Método iteruples() do DataFrame Pandas

Beginner

Introdução

Neste laboratório, aprenderemos sobre o método DataFrame.iteruples() do Pandas em Python. O método iteruples() no Pandas itera sobre as linhas de um DataFrame e retorna cada linha como uma tupla nomeada (named tuple). É um método útil para iterar e trabalhar com as linhas de um DataFrame.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Entenda a Sintaxe

A sintaxe do método iteruples() é a seguinte:

DataFrame.iteruples(index=True, name='Pandas')
  • index: É um valor booleano que indica se o índice deve ser incluído como o primeiro elemento da tupla. O valor padrão é True.
  • name: É um valor string que representa o nome das tuplas nomeadas (named tuples) retornadas. O valor padrão é "Pandas". Se definido como None, tuplas regulares são retornadas em vez de tuplas nomeadas.

Iterar sobre as Linhas do DataFrame

Nesta etapa, criaremos um DataFrame e usaremos o método iteruples() para iterar sobre suas linhas. O método retorna um objeto map, que pode ser usado em um loop para iterar sobre cada linha como uma tupla nomeada (named tuple).

## import pandas
import pandas as pd

## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])

## iterate over DataFrame rows
for row in df.iteruples():
    print(row)

Controlar Indexação e Nomenclatura de Tuplas

Nesta etapa, exploraremos como controlar o índice e a nomenclatura das tuplas retornadas. Por padrão, o índice é incluído como o primeiro elemento da tupla, e as tuplas são nomeadas "Pandas". Podemos modificar essas configurações passando argumentos para o método iteruples().

## import pandas
import pandas as pd

## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])

## iterate over DataFrame rows without index and custom name
for row in df.iteruples(index=False, name='Rows'):
    print(row)

Resumo

Neste laboratório, aprendemos sobre o método DataFrame.iteruples() do Pandas, que é útil para iterar sobre as linhas de um DataFrame e acessar os valores de cada linha. Vimos como usar o método, controlar a inclusão do índice e personalizar a nomenclatura das tuplas retornadas. Este método pode ser útil em várias tarefas de análise e manipulação de dados com DataFrames do Pandas.