Introduction
La méthode explode() dans la bibliothèque Python Pandas est utilisée pour transformer chaque élément d'un objet similaire à une liste en une ligne. Elle duplique les valeurs d'index et renvoie un DataFrame avec les listes éclatées comme lignes des colonnes de sous-ensemble. Elle prend un paramètre de colonne qui spécifie la colonne à éclater, et un paramètre ignore_index optionnel qui détermine si l'index résultant devrait être étiqueté.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder à Jupyter Notebook pour pratiquer.
Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez des commentaires après la session, et nous résoudrons rapidement le problème pour vous.
Importer les bibliothèques requises
Pour utiliser la méthode explode(), nous devons importer la bibliothèque pandas.
import pandas as pd
Créer un DataFrame
Créez un DataFrame avec une colonne qui contient des listes en tant qu'éléments.
df = pd.DataFrame({'A': [[1, 3], [3]], 'B': 1})
Développer le DataFrame
Utilisez la méthode explode() pour découper le DataFrame sur une colonne spécifique. Dans cet exemple, nous allons découper le DataFrame sur la colonne 'A'.
exploded_df = df.explode('A')
Afficher le DataFrame décomposé
Affichez le DataFrame décomposé pour voir le résultat.
print(exploded_df)
Résumé
Dans ce laboratoire, nous avons appris à utiliser la méthode explode() de la bibliothèque Python Pandas pour transformer chaque élément d'un objet similaire à une liste en une ligne dans un DataFrame. En spécifiant la colonne à décomposer, nous pouvons dupliquer les valeurs d'index et générer un DataFrame avec des listes décomposées comme lignes des colonnes de sous-ensemble. Cette méthode est utile pour travailler avec des données stockées dans des listes imbriquées ou pour effectuer des opérations sur les éléments individuels d'une liste.