Méthode notna() du DataFrame Pandas

Beginner

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode notna() de la bibliothèque Pandas en Python. La méthode notna() est utilisée pour détecter les valeurs existantes dans un DataFrame et renvoie un DataFrame composé de valeurs booléennes pour chaque élément indiquant si l'élément n'est pas une valeur NA.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importer les bibliothèques nécessaires

Tout d'abord, nous devons importer la bibliothèque pandas en utilisant l'alias pd et la bibliothèque numpy en utilisant l'alias np. Ces bibliothèques sont utilisées respectivement pour la manipulation de données et les opérations numériques.

import pandas as pd
import numpy as np

Créer un DataFrame

Ensuite, nous allons créer un DataFrame avec quelques données d'échantillonnage pour démontrer l'utilisation de la méthode notna(). Nous utiliserons la fonction pd.DataFrame() pour créer le DataFrame.

df = pd.DataFrame([(0.0, np.nan, -1.0, 1.0), (np.nan, 2.0, np.nan, np.nan), (2.0, 3.0, np.nan, 9.0)], columns=list('abcd'))

Afficher le DataFrame

Affichons le DataFrame pour voir son contenu et sa structure.

print("Le DataFrame est :")
print(df)

Utiliser la méthode notna()

Maintenant, nous allons utiliser la méthode notna() sur le DataFrame pour détecter les valeurs existantes. La méthode notna() renvoie un DataFrame ayant la même forme que le DataFrame original, où chaque élément est une valeur booléenne indiquant si l'élément correspondant n'est pas une valeur NA.

notna_df = df.notna()
print("Le résultat de la méthode notna() est :")
print(notna_df)

Afficher le résultat

Affichons le DataFrame résultant pour voir les valeurs booléennes indiquant les valeurs existantes.

print(notna_df)

Résumé

Dans ce laboratoire, nous avons appris à utiliser la méthode notna() dans la bibliothèque Pandas pour détecter les valeurs existantes dans un DataFrame. Cette méthode est utile pour les tâches de nettoyage et d'analyse de données où nous devons identifier les valeurs manquantes ou nulles. En utilisant la méthode notna(), nous pouvons rapidement obtenir un DataFrame de valeurs booléennes indiquant la présence ou l'absence de valeurs existantes.