Méthode de tableau croisé dynamique de DataFrame Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode pivot_table() de la bibliothèque pandas de Python. La méthode pivot_table() est utilisée pour agréger et résumer des données dans un DataFrame. Elle renvoie un tableau croisé dynamique de type tableur sous forme d'un nouveau DataFrame.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet d'étude pour accéder à Jupyter Notebook et pratiquer.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL pandas(("Pandas")) -.-> pandas/DataAnalysisGroup(["Data Analysis"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas(("Pandas")) -.-> pandas/ReadingDataGroup(["Reading Data"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) pandas/ReadingDataGroup -.-> pandas/read_csv("Read CSV") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") pandas/DataAnalysisGroup -.-> pandas/data_aggregation("Data Aggregation") pandas/DataAnalysisGroup -.-> pandas/pivot_tables("Pivot Tables") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/read_csv -.-> lab-68694{{"Méthode de tableau croisé dynamique de DataFrame Pandas"}} python/importing_modules -.-> lab-68694{{"Méthode de tableau croisé dynamique de DataFrame Pandas"}} pandas/data_aggregation -.-> lab-68694{{"Méthode de tableau croisé dynamique de DataFrame Pandas"}} pandas/pivot_tables -.-> lab-68694{{"Méthode de tableau croisé dynamique de DataFrame Pandas"}} python/data_collections -.-> lab-68694{{"Méthode de tableau croisé dynamique de DataFrame Pandas"}} python/data_analysis -.-> lab-68694{{"Méthode de tableau croisé dynamique de DataFrame Pandas"}} end

Importez les bibliothèques requises et créez le DataFrame

Tout d'abord, importons la bibliothèque pandas et créons un DataFrame avec quelques données d'échantillonnage. Nous allons créer un DataFrame avec les colonnes 'Date', 'State', 'Temperature' et 'Humidity'.

import pandas as pd

df = pd.DataFrame({'Date': ['1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021', '1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021'],
                   'State': ['Karnataka', 'Karnataka', 'Karnataka', 'Karnataka', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu'],
                   'Temperature': [25, 29, 28, 31, 26, 27, 22, 32],
                   'Humidity': [46, 50, 52, 59, 42, 45, 46, 43]})

Agrégez le DataFrame à l'aide de la méthode pivot_table()

Pour agréger les données dans le DataFrame à l'aide de la méthode pivot_table(), nous devons spécifier les colonnes que nous voulons utiliser comme index, colonnes et les valeurs que nous voulons agréger.

pivot_df = df.pivot_table(index='Date', columns='State', aggfunc='mean')

Affichez le DataFrame résultant

Enfin, affichons le DataFrame du tableau croisé dynamique résultant.

print(pivot_df)

Sommaire

En suivant ces étapes, nous avons pu utiliser la méthode pivot_table() de la bibliothèque pandas pour agréger et résumer des données dans un DataFrame. Cette méthode est utile pour analyser et visualiser des données sous forme tabulaire. Le DataFrame du tableau croisé dynamique résultant fournit un moyen pratique de voir les valeurs agrégées en fonction de différents indices et colonnes.