Méthode d'agrégation de DataFrame Pandas

Beginner

Introduction

Dans ce laboratoire, vous allez apprendre à utiliser la méthode agg() de la bibliothèque pandas pour aggreger des données dans un DataFrame. Cette méthode vous permet d'effectuer une ou plusieurs opérations sur un axe spécifié, tel que les lignes ou les colonnes, et renvoie un scalaire, une Séries ou un DataFrame en fonction de la fonction choisie.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour passer à l'onglet Notebook et accéder à Jupyter Notebook pour pratiquer.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importer la bibliothèque pandas

Tout d'abord, vous devez importer la bibliothèque pandas à l'aide de l'instruction import :

import pandas as pd

Créer un DataFrame

Ensuite, créez un objet DataFrame avec lequel travailler. Vous pouvez utiliser la fonction pd.DataFrame() pour créer un DataFrame à partir d'une liste ou d'un tableau. Voici un exemple :

df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns=['A', 'B', 'C'])

Aggréger un DataFrame avec une seule fonction sur les lignes

Pour aggréger le DataFrame à l'aide d'une seule fonction, vous pouvez utiliser la méthode agg(). Spécifiez la fonction que vous souhaitez appliquer aux lignes en utilisant un nom de fonction sous forme de chaîne de caractères ou un objet fonction. Voici un exemple :

print("Printing the sum of values in DataFrame")
print(df.agg(["sum"]))

Aggréger un DataFrame avec une seule fonction sur les colonnes

Pour aggréger le DataFrame à l'aide d'une seule fonction sur les colonnes, définissez le paramètre axis sur 'columns'. Cela appliquera la fonction à chaque colonne au lieu de chaque ligne. Voici un exemple :

print("Printing the minimum value in DataFrame")
print(df.agg(["min"], axis='columns'))

Aggréger un DataFrame avec une liste de fonctions sur les lignes et les colonnes

Vous pouvez également aggréger le DataFrame à l'aide d'une liste de fonctions. Cela vous permet d'effectuer plusieurs opérations sur les lignes ou les colonnes. Voici un exemple :

print("Printing sum and min of the DataFrame with default axis")
print(df.agg(["sum", "min"]))

Aggréger un DataFrame avec différentes fonctions sur les colonnes

Pour plus de flexibilité, vous pouvez passer un dictionnaire de noms de colonnes et de fonctions correspondantes à la méthode agg(). Cela vous permet d'appliquer différentes fonctions à différentes colonnes. Voici un exemple :

print("Printing different aggregation functions over the columns")
print(df.agg({'A': ["sum"], 'B': ["min", "max"], 'C': ["count"]}))

Résumé

Dans ce laboratoire, vous avez appris à utiliser la méthode agg() dans pandas pour aggréger des données dans un DataFrame. Vous savez maintenant comment appliquer une seule fonction ou plusieurs fonctions sur les lignes et les colonnes d'un DataFrame. Cette méthode est utile pour effectuer diverses opérations d'agrégation sur vos données. Experimentez avec différentes fonctions et axes pour analyser et résumer votre DataFrame. Bonne analyse!