Méthode de moyenne des DataFrames Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode mean() de la bibliothèque Pandas pour calculer les valeurs moyennes d'un DataFrame. La méthode mean() peut être utilisée pour calculer la moyenne le long de l'axe des index ou des colonnes du DataFrame.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limites de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importez les bibliothèques requises

Tout d'abord, importons les bibliothèques requises, Pandas et NumPy, en utilisant le code suivant :

import pandas as pd
import numpy as np

Créez un DataFrame

Ensuite, créons un DataFrame en utilisant le code suivant :

df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})

Calculez la moyenne le long de l'axe des index

Pour calculer la moyenne le long de l'axe des index du DataFrame, nous pouvons utiliser la méthode mean() avec le paramètre axis=0. Voici un exemple :

mean_index = df.mean(axis=0)
print(mean_index)

Calculez la moyenne le long de l'axe des colonnes

Pour calculer la moyenne le long de l'axe des colonnes du DataFrame, nous pouvons utiliser la méthode mean() avec le paramètre axis = 1. Voici un exemple :

mean_column = df.mean(axis=1)
print(mean_column)

Gérer les valeurs nulles

Par défaut, la méthode mean() exclut les valeurs nulles lors du calcul de la moyenne. Cependant, nous pouvons changer ce comportement en définissant le paramètre skipna sur False. Voici un exemple de calcul de la moyenne le long de l'axe des index avec des valeurs nulles :

df_with_null = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
mean_null = df_with_null.mean(axis=0, skipna=False)
print(mean_null)

Récapitulatif

Dans ce laboratoire, nous avons appris à utiliser la méthode mean() de la bibliothèque Pandas pour calculer les valeurs moyennes d'un DataFrame. Nous avons vu comment calculer la moyenne le long des axes des index et des colonnes, et comment gérer les valeurs nulles lors du calcul de la moyenne. La méthode mean() est un outil utile pour analyser et résumer les données dans les DataFrames Pandas.

Conclusion

La méthode mean() de la bibliothèque Pandas est un outil puissant pour calculer les valeurs moyennes des DataFrames. Elle offre une flexibilité dans le calcul de la moyenne le long de différents axes et gère les valeurs nulles de manière appropriée. Comprendre comment utiliser la méthode mean() est une compétence essentielle pour l'analyse de données avec Pandas.

Récapitulatif

Félicitations ! Vous avez terminé le laboratoire sur la méthode mean() des DataFrames Pandas. Vous pouvez pratiquer d'autres laboratoires sur LabEx pour améliorer vos compétences.