Méthode dropna pour les DataFrame de Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode dropna() de pandas pour les DataFrame. Cette méthode est utilisée pour supprimer les valeurs manquantes d'un DataFrame en supprimant les lignes ou les colonnes qui contiennent des valeurs nulles ou NaN.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importez la bibliothèque pandas

Avant de commencer, nous devons importer la bibliothèque pandas. Nous utiliserons l'alias pd pour cette bibliothèque.

import pandas as pd

Créez un DataFrame

Créeons un DataFrame qui contient quelques valeurs manquantes.

df = pd.DataFrame([
    ['Abhishek', 100, 'Science', None],
    ['Anurag', 101, 'Science', 85],
    ['Chetan', 103, 'Maths', None]
], columns=['Name', 'Roll No', 'Subject', 'Marks'])

Utilisez la méthode dropna() pour supprimer les lignes avec des valeurs manquantes

Nous pouvons utiliser la méthode dropna() pour supprimer les lignes qui contiennent des valeurs manquantes. Par défaut, elle supprime toute ligne qui a au moins une valeur nulle ou NaN.

df_dropped = df.dropna()

Affichez le résultat

Affichons le DataFrame original et le DataFrame résultant après avoir supprimé les lignes avec des valeurs manquantes.

print("Original DataFrame:")
print(df)

print("DataFrame after dropping rows with missing values:")
print(df_dropped)

Récapitulatif

Dans ce laboratoire, nous avons appris sur la méthode dropna() de pandas pour les DataFrame, qui est utilisée pour supprimer des lignes ou des colonnes avec des valeurs manquantes. En supprimant ces valeurs manquantes, nous pouvons nettoyer notre DataFrame et le rendre approprié pour une analyse ultérieure. Rappelez-vous que cette méthode modifie le DataFrame et renvoie un nouveau DataFrame par défaut, mais nous pouvons également choisir de modifier le DataFrame en place en définissant le paramètre inplace sur True.