Méthode items() du DataFrame Pandas

Beginner

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode items() de la bibliothèque Pandas pour itérer sur les colonnes d'un DataFrame. Cette méthode renvoie un objet générateur qui contient des tuples de noms de colonnes et de leurs Series correspondantes.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importer les bibliothèques nécessaires

Tout d'abord, nous devons importer la bibliothèque pandas :

import pandas as pd

Créer un DataFrame

Ensuite, créons un DataFrame avec quelques données d'échantillonnage :

df = pd.DataFrame({
    "Name": ["Navya", "Vindya"],
    "Age": [25, 24],
    "Education": ["M.Tech", "Ph.d"]
}, index=['id001', 'id002'])

Itérer sur les noms de colonnes

Pour itérer sur les noms de colonnes du DataFrame, nous pouvons utiliser la méthode items(). Cette méthode renvoie un objet générateur. Nous pouvons l'afficher ou l'itérer à l'aide d'une boucle for :

print("Itération sur les noms de colonnes en utilisant items():")

for column_name, data in df.items():
    print('Nom de la colonne :', column_name)

Itérer sur les valeurs des colonnes

Pour accéder aux valeurs de chaque colonne, nous pouvons utiliser la méthode items() en combinaison avec une boucle for. Chaque itération renverra un tuple composé du nom de la colonne et de la Series correspondante :

print("Itération sur les valeurs des colonnes en utilisant items():")

for column_name, data in df.items():
    print('Nom de la colonne :', column_name)
    print('Données :', data)

Itérer sur une ligne spécifique

Pour itérer sur une ligne spécifique, nous pouvons utiliser le numéro d'index et accéder à la ligne à travers l'objet Series :

print("Itération sur une ligne spécifique en utilisant items():")

for column_name, data in df.items():
    print('Nom de la colonne :', column_name)
    print('Données :', data[0])  ## Accédez au premier élément de la Series

Itérer sur une colonne spécifique

Pour itérer sur une colonne spécifique, nous pouvons utiliser le nom de la colonne comme index pour l'objet de données :

print("Itération sur une colonne spécifique en utilisant items():")

for column_name, data in df.items():
    print('Nom de la colonne :', column_name)
    print('Données :', data['id001'])  ## Accédez à la valeur à l'index 'id001'

Résumé

Dans ce laboratoire, nous avons appris à utiliser la méthode items() de la bibliothèque Pandas pour itérer sur les colonnes d'un DataFrame. Nous avons vu comment itérer sur les noms de colonnes, les valeurs de colonnes, les lignes spécifiques et les colonnes spécifiques. La méthode items() fournit un moyen pratique d'explorer et de manipuler les données dans un DataFrame.