Pandas DataFrame Ffill-Methode

Beginner

Einführung

In diesem Lab führen wir Sie Schritt für Schritt durch den Prozess des Verwenden der ffill()-Methode des Pandas DataFrames. Die ffill()-Methode, die für "forward fill" steht, füllt fehlende Werte in einem DataFrame, indem sie den letzten Wert vor dem NULL-Wert nimmt und ihn einfüllt.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie während des Lernens Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importiere die erforderlichen Bibliotheken

Um die ffill()-Methode verwenden zu können, müssen Sie die pandas-Bibliothek importieren. Dies können Sie tun, indem Sie den folgenden Code ausführen:

import pandas as pd

Erstelle einen DataFrame mit fehlenden Werten

Als nächstes müssen Sie ein DataFrame mit einigen fehlenden Werten erstellen. Dies können Sie tun, indem Sie den folgenden Code ausführen:

df = pd.DataFrame({"A": [2, None, 4], "B": [None, 4, np.nan], "C": [2, 0.25, np.nan], "D": [9, 4, None]})

Fülle fehlende Werte mit der ffill()-Methode

Jetzt können Sie die ffill()-Methode verwenden, um die fehlenden Werte im DataFrame auszufüllen. Dazu führen Sie einfach folgenden Code aus:

df_filled = df.ffill()

Definiere den Achsenparameter

Standardmäßig füllt die ffill()-Methode fehlende Werte entlang der Indexachse (axis=0). Sie können jedoch auch den axis-Parameter angeben, um fehlende Werte entlang der Spaltenachse (axis=1) auszufüllen. Dazu führen Sie einfach folgenden Code aus:

df_filled = df.ffill(axis=1)

Inplace-Füllung

Standardmäßig modifiziert die ffill()-Methode nicht das ursprüngliche DataFrame. Sie können jedoch den Parameter inplace=True angeben, um die fehlenden Werte direkt im ursprünglichen DataFrame auszufüllen. Dazu führen Sie einfach folgenden Code aus:

df.ffill(axis=1, inplace=True)

Definiere den Limitparameter

Sie können auch den limit-Parameter angeben, um die Anzahl aufeinanderfolgender NaN-Werte, die mit der forward-fill-Methode ausgefüllt werden sollen, zu begrenzen. Dazu führen Sie einfach folgenden Code aus:

df_filled = df.ffill(axis=1, limit=2)

Zusammenfassung

In diesem Lab haben Sie gelernt, wie Sie die ffill()-Methode des Pandas DataFrames verwenden, um fehlende Werte in einem DataFrame auszufüllen. Sie haben gelernt, wie Sie die erforderlichen Bibliotheken importieren, einen DataFrame mit fehlenden Werten erstellen, fehlende Werte entlang unterschiedlicher Achsen ausfüllen, fehlende Werte direkt im ursprünglichen DataFrame ausfüllen und die Anzahl aufeinanderfolgender NaN-Werte begrenzen, die mit der forward-fill-Methode ausgefüllt werden sollen. Diese Methode kann hilfreich sein, um fehlende Daten zu behandeln und Datensätze für die Analyse vorzubereiten.