Introdução
Neste laboratório, exploraremos o método DataFrame.iterrows() do Pandas em Python. Este método nos permite iterar sobre as linhas de um DataFrame do Pandas, retornando o índice e os dados para cada linha.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Criar um DataFrame
Primeiro, precisamos criar um DataFrame para trabalhar. Vamos criar um DataFrame simples usando a biblioteca Pandas.
#importing pandas as pd
import pandas as pd
#creating DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['id001', 'id002'])
Iterar sobre as linhas usando o método iterrows()
Para iterar sobre as linhas do DataFrame, podemos usar o método iterrows(). Este método retorna um objeto gerador que contém uma tupla do índice e dos dados para cada linha.
#print the DataFrame
print("The DataFrame is:")
print(df)
#print the generator object
print("Iterate over rows:")
print(df.iterrows())
Usar um loop for para acessar as linhas
Para acessar o índice e os dados para cada linha, podemos usar um loop for. Os dados da linha podem ser acessados usando a variável row_data, e o índice pode ser acessado usando a variável row_index.
#for loop to iterate over rows
print("Iterate over rows:")
for row_index, row_data in df.iterrows():
print("Index:", row_index)
print("Data:", row_data)
Acessando dados específicos de uma linha
Também podemos acessar dados específicos de uma linha especificando o número do índice. Vamos imprimir o valor da coluna "Name" para cada linha.
#for loop to access the "Name" column for each row
print("Accessing specific data:")
for row_index, row_data in df.iterrows():
print("Name:", row_data['Name'])
Resumo
Neste laboratório, aprendemos como usar o método iterrows() no Pandas para iterar sobre as linhas de um DataFrame. Exploramos como acessar o índice e os dados para cada linha usando um loop for, e como acessar dados específicos de uma linha. O método iterrows() é uma ferramenta útil para analisar e manipular dados em um DataFrame.