Méthode mode() d'un DataFrame Pandas

Beginner

Introduction

Ce laboratoire vous guidera dans l'utilisation de la méthode mode() dans un DataFrame Pandas. La méthode mode() est utilisée pour trouver la ou les valeurs qui apparaissent le plus fréquemment dans un DataFrame.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limites de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importer les bibliothèques nécessaires

Tout d'abord, importez la bibliothèque Pandas à l'aide de l'instruction import :

import pandas as pd

Créer un DataFrame

Maintenant, créez un DataFrame à l'aide du constructeur DataFrame(). Pour cet exemple, créons un DataFrame avec trois colonnes : "A", "B" et "C".

df = pd.DataFrame({"A": [1, 2, 1], "B": [2, 2, 1], "C": [5, 2, 5]})

Trouver la ou les valeurs mode

Pour trouver la ou les valeurs mode de chaque colonne dans le DataFrame, utilisez la méthode mode() :

df_mode = df.mode()
print(df_mode)

La méthode mode() renvoie un DataFrame contenant la ou les valeurs mode de chaque colonne.

Spécifier l'axe

Par défaut, la méthode mode() trouve la ou les valeurs mode le long de l'axe des colonnes (axis = 0). Si vous voulez trouver la ou les valeurs mode le long de l'axe des lignes, spécifiez axis = 1.

Par exemple, pour trouver la ou les valeurs mode le long de l'axe des lignes, utilisez le code suivant :

df_mode = df.mode(axis=1)
print(df_mode)

Inclure seulement les colonnes numériques

Si vous voulez inclure seulement les colonnes numériques dans le calcul du mode, vous pouvez utiliser le paramètre numeric_only. Par défaut, numeric_only est défini sur False. Réglez-le sur True pour inclure seulement les colonnes numériques.

Par exemple, pour inclure seulement les colonnes numériques dans le calcul du mode, utilisez le code suivant :

df_mode = df.mode(numeric_only=True)
print(df_mode)

Inclure les valeurs nulles

Par défaut, la méthode mode() ne prend pas en compte les valeurs nulles. Si vous voulez inclure les valeurs nulles dans le calcul du mode, vous pouvez utiliser le paramètre dropna. Par défaut, dropna est défini sur True. Réglez-le sur False pour inclure les valeurs nulles.

Par exemple, pour inclure les valeurs nulles dans le calcul du mode, utilisez le code suivant :

df_mode = df.mode(dropna=False)
print(df_mode)

Résumé

Dans ce laboratoire, vous avez appris à utiliser la méthode mode() dans un DataFrame Pandas pour trouver la ou les valeurs qui apparaissent le plus fréquemment. Vous avez également appris à spécifier l'axe, à inclure seulement les colonnes numériques et à inclure les valeurs nulles. Maintenant, vous pouvez utiliser ces connaissances pour trouver la ou les valeurs mode dans vos propres projets d'analyse de données.