Méthode iterrows() du DataFrame Pandas

Beginner

Introduction

Dans ce laboratoire, nous allons explorer la méthode DataFrame.iterrows() de Pandas en Python. Cette méthode nous permet d'itérer sur les lignes d'un DataFrame Pandas, en retournant l'index et les données de chaque ligne.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder au carnet Jupyter Notebook pour pratiquer.

Parfois, vous devrez peut-être attendre quelques secondes pour que le carnet Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations du carnet Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Créer un DataFrame

Tout d'abord, nous devons créer un DataFrame avec lequel travailler. Créons un DataFrame simple à l'aide de la bibliothèque Pandas.

#importing pandas as pd
import pandas as pd

#creating DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['id001', 'id002'])

Itérer sur les lignes à l'aide de la méthode iterrows()

Pour itérer sur les lignes d'un DataFrame, nous pouvons utiliser la méthode iterrows(). Cette méthode renvoie un objet générateur qui contient un tuple de l'index et des données pour chaque ligne.

#print the DataFrame
print("The DataFrame is:")
print(df)

#print the generator object
print("Iterate over rows:")
print(df.iterrows())

Utiliser une boucle for pour accéder aux lignes

Pour accéder à l'index et aux données de chaque ligne, nous pouvons utiliser une boucle for. Les données de la ligne peuvent être accessibles à l'aide de la variable row_data, et l'index peut être accessé à l'aide de la variable row_index.

#for loop to iterate over rows
print("Iterate over rows:")
for row_index, row_data in df.iterrows():
    print("Index:", row_index)
    print("Data:", row_data)

Accéder à des données spécifiques d'une ligne

Nous pouvons également accéder à des données spécifiques d'une ligne en spécifiant le numéro d'index. Affichons la valeur de la colonne "Name" pour chaque ligne.

#for loop to access the "Name" column for each row
print("Accessing specific data:")
for row_index, row_data in df.iterrows():
    print("Name:", row_data['Name'])

Résumé

Dans ce laboratoire, nous avons appris à utiliser la méthode iterrows() dans Pandas pour itérer sur les lignes d'un DataFrame. Nous avons exploré la manière d'accéder à l'index et aux données de chaque ligne à l'aide d'une boucle for, et de comment accéder à des données spécifiques d'une ligne. La méthode iterrows() est un outil utile pour analyser et manipuler les données dans un DataFrame.