Méthode de médiane pour le DataFrame Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode median() de la bibliothèque Pandas pour calculer la médiane des valeurs dans un DataFrame. La méthode median() nous permet de trouver la valeur médiane dans un ensemble de données, fournissant une mesure de tendance centrale.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importez la bibliothèque pandas

Tout d'abord, nous devons importer la bibliothèque 'pandas', qui est couramment utilisée pour la manipulation et l'analyse de données.

import pandas as pd

Créez un DataFrame

Ensuite, nous allons créer un objet DataFrame à l'aide du constructeur pd.DataFrame(). Cela nous permettra de stocker et de manipuler nos données.

df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})
print("------Le DataFrame est------")
print(df)

Calculez la médiane le long de l'axe d'index

Pour calculer la médiane le long de l'axe d'index du DataFrame, nous pouvons utiliser la méthode median() avec le paramètre axis défini sur 0.

print("---------------------------")
print(df.median(axis=0))

Calculez la médiane le long de l'axe des colonnes

Pour calculer la médiane le long de l'axe des colonnes du DataFrame, nous pouvons utiliser la méthode median() avec le paramètre axis défini sur 1.

print("---------------------------")
print(df.median(axis=1))

Gérer les valeurs nulles

Si notre DataFrame contient des valeurs nulles, nous pouvons les gérer en spécifiant le paramètre skipna. Par défaut, skipna est défini sur True, ce qui exclut les valeurs nulles lors du calcul de la médiane. Si nous voulons inclure les valeurs nulles, nous pouvons définir skipna sur False.

df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
print("------Le DataFrame est------")
print(df)
print("---------------------------")
print(df.median(axis=0, skipna=False))

Récapitulatif

Dans ce laboratoire, nous avons appris à utiliser la méthode median() dans Pandas pour calculer la médiane des valeurs dans un DataFrame. Nous avons exploré la manière de calculer la médiane le long de l'axe d'index et de l'axe des colonnes. De plus, nous avons appris à gérer les valeurs nulles lors du calcul de la médiane. Calculer la médiane est utile pour comprendre la tendance centrale d'un ensemble de données et peut être utilisée pour prendre des décisions éclairées dans l'analyse de données.