Méthode ffill du DataFrame Pandas

Beginner

Introduction

Ce laboratoire vous guidera tout au long du processus étape par étape d'utilisation de la méthode ffill() du DataFrame Pandas. La méthode ffill(), qui signifie "remplissage vers l'avant", remplit les valeurs manquantes dans un DataFrame en prenant la dernière valeur précédant la valeur nulle et en la remplissant.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importer les bibliothèques nécessaires

Pour utiliser la méthode ffill(), vous devez importer la bibliothèque pandas. Vous pouvez le faire en exécutant le code suivant :

import pandas as pd

Créer un DataFrame avec des valeurs manquantes

Ensuite, vous devez créer un DataFrame avec quelques valeurs manquantes. Vous pouvez le faire en exécutant le code suivant :

df = pd.DataFrame({"A": [2, None, 4], "B": [None, 4, np.nan], "C": [2, 0.25, np.nan], "D": [9, 4, None]})

Remplir les valeurs manquantes à l'aide de la méthode ffill()

Maintenant, vous pouvez utiliser la méthode ffill() pour remplir les valeurs manquantes dans le DataFrame. Pour ce faire, exécutez simplement le code suivant :

df_filled = df.ffill()

Spécifier le paramètre d'axe

Par défaut, la méthode ffill() remplit les valeurs manquantes le long de l'axe de l'index (axis=0). Cependant, vous pouvez également spécifier le paramètre d'axe pour remplir les valeurs manquantes le long de l'axe des colonnes (axis=1). Pour ce faire, exécutez simplement le code suivant :

df_filled = df.ffill(axis=1)

Remplissage in-place

Par défaut, la méthode ffill() ne modifie pas le DataFrame d'origine. Cependant, vous pouvez spécifier le paramètre inplace=True pour remplir les valeurs manquantes en place. Pour ce faire, exécutez simplement le code suivant :

df.ffill(axis=1, inplace=True)

Spécifier le paramètre de limite

Vous pouvez également spécifier le paramètre limite pour limiter le nombre de valeurs NaN consécutives à remplir vers l'avant. Pour ce faire, exécutez simplement le code suivant :

df_filled = df.ffill(axis=1, limit=2)

Résumé

Dans ce laboratoire, vous avez appris à utiliser la méthode ffill() du DataFrame Pandas pour remplir les valeurs manquantes dans un DataFrame. Vous avez appris à importer les bibliothèques nécessaires, à créer un DataFrame avec des valeurs manquantes, à remplir les valeurs manquantes le long de différents axes, à remplir les valeurs manquantes en place et à limiter le nombre de valeurs NaN consécutives à remplir vers l'avant. Cette méthode peut être utile pour traiter les données manquantes et prétraiter les jeux de données pour l'analyse.