Méthode isna() d'un DataFrame Pandas

Beginner

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode DataFrame.isna() dans Pandas. La méthode isna() est utilisée pour détecter les valeurs manquantes dans un DataFrame pandas. Elle renvoie un DataFrame de valeurs booléennes, où chaque élément indique s'il s'agit d'une valeur nulle ou non. La méthode isna() ne considère pas les chaînes de caractères vides ou les valeurs spéciales telles que numpy.inf comme des valeurs nulles.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous réglerons rapidement le problème pour vous.

Création d'un DataFrame

Tout d'abord, créons un DataFrame avec quelques valeurs manquantes à l'aide de la fonction DataFrame() de la bibliothèque pandas. Nous allons importer les bibliothèques nécessaires et créer le DataFrame avec les colonnes 'a', 'b', 'c' et 'd'.

#importing pandas as pd
import pandas as pd
#importing numpy as np
import numpy as np

#creating the DataFrame
df = pd.DataFrame([(0.0, np.nan, -1.0, 1.0),
                   (np.nan, 2.0, np.nan, np.nan),
                   (2.0, 3.0, np.nan, 9.0)],
                  columns=list('abcd'))

print("------Le DataFrame est----------")
print(df)

Détection des valeurs manquantes

Ensuite, nous utiliserons la méthode isna() pour détecter les valeurs manquantes dans le DataFrame. Nous afficherons le résultat pour voir quels éléments sont des valeurs nulles.

print("---------------------------------")
print(df.isna())

Evaluation des résultats

En exécutant le code, nous pouvons constater que la méthode isna() a renvoyé un DataFrame composé de valeurs booléennes pour chaque élément du DataFrame original. False indique que l'élément n'est pas une valeur nulle, tandis que True indique que l'élément est une valeur nulle.

Considérer les chaînes de caractères vides

Dans l'exemple précédent, la méthode isna() ne considérait pas les chaînes de caractères vides comme des valeurs nulles. Créons un autre DataFrame et vérifions si la méthode isna() se comporte toujours de la même manière.

#creating another DataFrame
df = pd.DataFrame({'a': [0, 1, ''], 'b': ['', None, 3]})

print("------Le DataFrame est----------")
print(df)

Détection à nouveau des valeurs manquantes

Maintenant, utilisons la méthode isna() sur le nouveau DataFrame pour détecter les valeurs manquantes.

print("---------------------------------")
print(df.isna())

Résumé

Dans ce laboratoire, nous avons appris à utiliser la méthode DataFrame.isna() de Pandas pour détecter les valeurs manquantes dans un DataFrame. Nous avons créé un DataFrame avec des valeurs manquantes, utilisé la méthode isna() pour détecter ces valeurs manquantes et observé les résultats. De plus, nous avons vu que la méthode isna() ne considère pas les chaînes de caractères vides comme des valeurs nulles. Cette méthode est utile pour traiter les données manquantes dans les DataFrames de pandas.


Veuillez me contacter si vous avez besoin d'une assistance supplémentaire.