Introduction
Le regroupement et l'agrégation de données sont des opérations fondamentales en analyse de données. Ils vous permettent de diviser un grand ensemble de données en groupes plus petits basés sur certains critères, puis de calculer des statistiques récapitulatives pour chaque groupe. Ce processus est essentiel pour découvrir des tendances, comparer des segments et tirer des informations significatives à partir de données brutes.
Dans la bibliothèque d'analyse de données Python, Pandas, cette stratégie "split-apply-combine" (diviser-appliquer-combiner) est principalement gérée par la puissante méthode groupby(). Dans ce laboratoire, vous apprendrez à utiliser groupby() pour effectuer le regroupement et l'agrégation. Vous commencerez par regrouper des données par une seule colonne, appliquerez des fonctions d'agrégation, utiliserez plusieurs fonctions à la fois, regrouperez par plusieurs colonnes, et enfin, formaterez la sortie dans un DataFrame standard.



