Méthode itertuples du DataFrame Pandas

Beginner

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode DataFrame.iteruples() de Python Pandas. La méthode iteruples() dans Pandas itère sur les lignes d'un DataFrame et renvoie chaque ligne sous forme d'un tuple nommé. C'est une méthode pratique pour itérer sur et travailler avec les lignes d'un DataFrame.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Comprendre la syntaxe

La syntaxe de la méthode iteruples() est la suivante :

DataFrame.iteruples(index=True, name='Pandas')
  • index : C'est une valeur booléenne indiquant s'il faut inclure l'index comme premier élément du tuple. La valeur par défaut est True.
  • name : C'est une valeur de type chaîne de caractères représentant le nom des tuples nommés renvoyés. La valeur par défaut est "Pandas". Si elle est définie sur None, des tuples normaux sont renvoyés au lieu de tuples nommés.

Itérer sur les lignes d'un DataFrame

Dans cette étape, nous allons créer un DataFrame et utiliser la méthode iteruples() pour itérer sur ses lignes. La méthode renvoie un objet map, qui peut être utilisé dans une boucle pour itérer sur chaque ligne sous forme d'un tuple nommé.

## import pandas
import pandas as pd

## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])

## iterate over DataFrame rows
for row in df.iteruples():
    print(row)

Contrôler l'index et la nomination des tuples

Dans cette étape, nous allons explorer la manière de contrôler l'index et la nomination des tuples renvoyés. Par défaut, l'index est inclus en tant que premier élément du tuple, et les tuples sont nommés "Pandas". Nous pouvons modifier ces paramètres en passant des arguments à la méthode iteruples().

## import pandas
import pandas as pd

## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])

## iterate over DataFrame rows without index and custom name
for row in df.iteruples(index=False, name='Rows'):
    print(row)

Résumé

Dans ce laboratoire, nous avons appris à utiliser la méthode DataFrame.iteruples() de Pandas, qui est pratique pour itérer sur les lignes d'un DataFrame et accéder aux valeurs de chaque ligne. Nous avons vu comment utiliser la méthode, contrôler l'inclusion de l'index et personnaliser la nomination des tuples renvoyés. Cette méthode peut être utile dans diverses tâches d'analyse et de manipulation de données avec des DataFrames Pandas.