Método iterrows() do DataFrame Pandas

Beginner

Introdução

Neste laboratório, exploraremos o método DataFrame.iterrows() do Pandas em Python. Este método nos permite iterar sobre as linhas de um DataFrame do Pandas, retornando o índice e os dados para cada linha.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Criar um DataFrame

Primeiro, precisamos criar um DataFrame para trabalhar. Vamos criar um DataFrame simples usando a biblioteca Pandas.

#importing pandas as pd
import pandas as pd

#creating DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['id001', 'id002'])

Iterar sobre as linhas usando o método iterrows()

Para iterar sobre as linhas do DataFrame, podemos usar o método iterrows(). Este método retorna um objeto gerador que contém uma tupla do índice e dos dados para cada linha.

#print the DataFrame
print("The DataFrame is:")
print(df)

#print the generator object
print("Iterate over rows:")
print(df.iterrows())

Usar um loop for para acessar as linhas

Para acessar o índice e os dados para cada linha, podemos usar um loop for. Os dados da linha podem ser acessados usando a variável row_data, e o índice pode ser acessado usando a variável row_index.

#for loop to iterate over rows
print("Iterate over rows:")
for row_index, row_data in df.iterrows():
    print("Index:", row_index)
    print("Data:", row_data)

Acessando dados específicos de uma linha

Também podemos acessar dados específicos de uma linha especificando o número do índice. Vamos imprimir o valor da coluna "Name" para cada linha.

#for loop to access the "Name" column for each row
print("Accessing specific data:")
for row_index, row_data in df.iterrows():
    print("Name:", row_data['Name'])

Resumo

Neste laboratório, aprendemos como usar o método iterrows() no Pandas para iterar sobre as linhas de um DataFrame. Exploramos como acessar o índice e os dados para cada linha usando um loop for, e como acessar dados específicos de uma linha. O método iterrows() é uma ferramenta útil para analisar e manipular dados em um DataFrame.