Pandas DataFrame Backfill-Methode

PandasPandasBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab lernen wir, wie wir die DataFrame.backfill()-Methode in der Pandas-Bibliothek verwenden. Mit dieser Methode können wir fehlende Werte in einem DataFrame mit Werten aus dem nächsten Eintrag in der gleichen Spalte auffüllen. Wir werden lernen, wie diese Methode mit verschiedenen Parametern verwendet wird, um fehlende Daten effektiv zu behandeln.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Erstellen eines DataFrames mit fehlenden Werten

Zunächst erstellen wir ein DataFrame mit fehlenden Werten mithilfe der Pandas-Bibliothek.

import pandas as pd

df = pd.DataFrame({'A': [None, 3, None, None],
                   'B': [2, 4, None, 3],
                   'C': [None, None, None, 1],
                   'D': [0, 1, 5, 4]},
                  columns=['A', 'B', 'C', 'D'])

print(df)

Der obige Code erstellt ein DataFrame mit fehlenden Werten in den Spalten 'A', 'B', 'C' und 'D'.

Fehlende Werte mit DataFrame.backfill() auffüllen

In diesem Schritt verwenden wir die DataFrame.backfill()-Methode, um die fehlenden Werte im DataFrame auszufüllen.

filled_df = df.bfill()

print(filled_df)

Die bfill()-Methode wird auf das DataFrame angewendet, und die fehlenden Werte werden mit dem nächsten verfügbaren Wert in der gleichen Spalte ausgefüllt.

Fehlende Werte mit axis=1 auffüllen

In diesem Schritt verwenden wir den axis-Parameter der DataFrame.backfill()-Methode, um die fehlenden Werte horizontal, d.h. entlang der Spalten, auszufüllen.

filled_df = df.bfill(axis=1)

print(filled_df)

Durch Festlegen von axis=1 füllt die bfill()-Methode die fehlenden Werte mit Werten aus dem nächsten verfügbaren Eintrag in der gleichen Zeile.

Begrenzen der Anzahl aufeinanderfolgender gefüllter NaN-Werte

In diesem Schritt verwenden wir den limit-Parameter der DataFrame.backfill()-Methode, um die Anzahl aufeinanderfolgender gefüllter NaN-Werte zu begrenzen.

filled_df = df.bfill(limit=2)

print(filled_df)

Durch Festlegen von limit=2 wird die bfill()-Methode maximal zwei aufeinanderfolgende NaN-Werte in jeder Spalte ausfüllen.

Verwenden von inplace=True für eine in-place-Modifikation

In diesem Schritt verwenden wir den inplace-Parameter der DataFrame.backfill()-Methode, um das DataFrame in-place zu modifizieren.

df.bfill(inplace=True)

print(df)

Durch Festlegen von inplace=True modifiziert die bfill()-Methode das ursprüngliche DataFrame anstelle eines neuen DataFrames zurückzugeben.

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die DataFrame.backfill()-Methode in der Pandas-Bibliothek verwendet. Wir haben verschiedene Möglichkeiten untersucht, um fehlende Werte in einem DataFrame auszufüllen, darunter das vertikale und horizontale Ausfüllen, das Begrenzen der Anzahl aufeinanderfolgender gefüllter NaN-Werte und das Ausführen der Ausfüllung in-place. Das Verständnis, wie man fehlende Daten behandelt, ist für Datenanalyse- und Modellierungsaufgaben unerlässlich. Die backfill()-Methode ist in dieser Hinsicht ein nützliches Werkzeug.