Introdução
Neste laboratório, aprenderemos sobre o método DataFrame.iteruples() do Pandas em Python. O método iteruples() no Pandas itera sobre as linhas de um DataFrame e retorna cada linha como uma tupla nomeada (named tuple). É um método útil para iterar e trabalhar com as linhas de um DataFrame.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Entenda a Sintaxe
A sintaxe do método iteruples() é a seguinte:
DataFrame.iteruples(index=True, name='Pandas')
index: É um valor booleano que indica se o índice deve ser incluído como o primeiro elemento da tupla. O valor padrão éTrue.name: É um valor string que representa o nome das tuplas nomeadas (named tuples) retornadas. O valor padrão é "Pandas". Se definido comoNone, tuplas regulares são retornadas em vez de tuplas nomeadas.
Iterar sobre as Linhas do DataFrame
Nesta etapa, criaremos um DataFrame e usaremos o método iteruples() para iterar sobre suas linhas. O método retorna um objeto map, que pode ser usado em um loop para iterar sobre cada linha como uma tupla nomeada (named tuple).
## import pandas
import pandas as pd
## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])
## iterate over DataFrame rows
for row in df.iteruples():
print(row)
Controlar Indexação e Nomenclatura de Tuplas
Nesta etapa, exploraremos como controlar o índice e a nomenclatura das tuplas retornadas. Por padrão, o índice é incluído como o primeiro elemento da tupla, e as tuplas são nomeadas "Pandas". Podemos modificar essas configurações passando argumentos para o método iteruples().
## import pandas
import pandas as pd
## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])
## iterate over DataFrame rows without index and custom name
for row in df.iteruples(index=False, name='Rows'):
print(row)
Resumo
Neste laboratório, aprendemos sobre o método DataFrame.iteruples() do Pandas, que é útil para iterar sobre as linhas de um DataFrame e acessar os valores de cada linha. Vimos como usar o método, controlar a inclusão do índice e personalizar a nomenclatura das tuplas retornadas. Este método pode ser útil em várias tarefas de análise e manipulação de dados com DataFrames do Pandas.