Introduction
Dans ce laboratoire, nous allons apprendre à utiliser la méthode median() de la bibliothèque Pandas pour calculer la médiane des valeurs dans un DataFrame. La méthode median() nous permet de trouver la valeur médiane dans un ensemble de données, fournissant une mesure de tendance centrale.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.
Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.
Importer la bibliothèque pandas
Tout d'abord, nous devons importer la bibliothèque 'pandas', qui est couramment utilisée pour la manipulation et l'analyse de données.
import pandas as pd
Créer un DataFrame
Ensuite, nous allons créer un objet DataFrame à l'aide du constructeur pd.DataFrame(). Cela nous permettra de stocker et de manipuler nos données.
df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})
print("------Le DataFrame est------")
print(df)
Calculer la médiane le long de l'axe d'index
Pour calculer la médiane le long de l'axe d'index du DataFrame, nous pouvons utiliser la méthode median() avec le paramètre axis défini sur 0.
print("---------------------------")
print(df.median(axis=0))
Calculer la médiane le long de l'axe des colonnes
Pour calculer la médiane le long de l'axe des colonnes du DataFrame, nous pouvons utiliser la méthode median() avec le paramètre axis défini sur 1.
print("---------------------------")
print(df.median(axis=1))
Gérer les valeurs nulles
Si notre DataFrame contient des valeurs nulles, nous pouvons les gérer en spécifiant le paramètre skipna. Par défaut, skipna est défini sur True, ce qui exclut les valeurs nulles lors du calcul de la médiane. Si nous voulons inclure les valeurs nulles, nous pouvons définir skipna sur False.
df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
print("------Le DataFrame est------")
print(df)
print("---------------------------")
print(df.median(axis=0, skipna=False))
Résumé
Dans ce laboratoire, nous avons appris à utiliser la méthode median() dans Pandas pour calculer la médiane des valeurs dans un DataFrame. Nous avons exploré la manière de calculer la médiane le long de l'axe d'index et de l'axe des colonnes. De plus, nous avons appris à gérer les valeurs nulles lors du calcul de la médiane. Calculer la médiane est utile pour comprendre la tendance centrale d'un ensemble de données et peut être utilisée pour prendre des décisions éclairées dans l'analyse de données.