Introduction
Dans ce laboratoire, nous allons apprendre à utiliser la méthode mean() de la bibliothèque Pandas pour calculer les valeurs moyennes d'un DataFrame. La méthode mean() peut être utilisée pour calculer la moyenne le long de l'axe des index ou des colonnes du DataFrame.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.
Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limites de Jupyter Notebook.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.
Importer les bibliothèques requises
Tout d'abord, importons les bibliothèques requises, Pandas et NumPy, en utilisant le code suivant :
import pandas as pd
import numpy as np
Créer un DataFrame
Ensuite, créons un DataFrame en utilisant le code suivant :
df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})
Calculer la moyenne le long de l'axe des index
Pour calculer la moyenne le long de l'axe des index du DataFrame, nous pouvons utiliser la méthode mean() avec le paramètre axis=0. Voici un exemple :
mean_index = df.mean(axis=0)
print(mean_index)
Calculer la moyenne le long de l'axe des colonnes
Pour calculer la moyenne le long de l'axe des colonnes du DataFrame, nous pouvons utiliser la méthode mean() avec le paramètre axis = 1. Voici un exemple :
mean_column = df.mean(axis=1)
print(mean_column)
Gérer les valeurs nulles
Par défaut, la méthode mean() exclut les valeurs nulles lors du calcul de la moyenne. Cependant, nous pouvons changer ce comportement en définissant le paramètre skipna sur False. Voici un exemple de calcul de la moyenne le long de l'axe des index avec des valeurs nulles :
df_with_null = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
mean_null = df_with_null.mean(axis=0, skipna=False)
print(mean_null)
Résumé
Dans ce laboratoire, nous avons appris à utiliser la méthode mean() de la bibliothèque Pandas pour calculer les valeurs moyennes d'un DataFrame. Nous avons vu comment calculer la moyenne le long des axes des index et des colonnes, et comment gérer les valeurs nulles lors du calcul de la moyenne. La méthode mean() est un outil utile pour analyser et résumer les données dans les DataFrames Pandas.
Conclusion
La méthode mean() de la bibliothèque Pandas est un outil puissant pour calculer les valeurs moyennes des DataFrames. Elle offre une flexibilité dans le calcul de la moyenne le long de différents axes et gère les valeurs nulles de manière appropriée. Comprendre comment utiliser la méthode mean() est une compétence essentielle pour l'analyse de données avec Pandas.
Résumé
Félicitations ! Vous avez terminé le laboratoire sur la méthode mean() des DataFrames Pandas. Vous pouvez pratiquer d'autres laboratoires sur LabEx pour améliorer vos compétences.