Pandas DataFrame combine_first Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab lernen wir, wie wir die combine_first()-Methode in einem Pandas DataFrame verwenden. Diese Methode ermöglicht es uns, zwei DataFrame-Objekte zu kombinieren, indem wir leere Werte in einem DataFrame mit nicht-leeren Werten aus einem anderen DataFrame auffüllen. Dies kann nützlich sein, wenn wir in einem DataFrame fehlende Daten haben und diese mit Daten aus einem anderen DataFrame auffüllen möchten.

Tipps für die virtuelle Maschine

Nachdem der Start der virtuellen Maschine abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem für Sie prompt beheben.

Importieren der erforderlichen Bibliotheken

import pandas as pd

Erstellen von zwei DataFrames mit fehlenden Werten

df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [1, 1], 'B': [3, 3]})

Verbinden der DataFrames mit der combine_first()-Methode

combined_df = df1.combine_first(df2)

Drucken des kombinierten DataFrames

print(combined_df)

Fügen einer neuen Zeile zu einem der DataFrames hinzu

df2.loc[2] = [2, 2]

Verbinde die DataFrames erneut

combined_df = df1.combine_first(df2)

Drucke den kombinierten DataFrame erneut

print(combined_df)

Verbinde DataFrames mit None-Werten

df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [None, 1], 'B': [None, 3]})
combined_df = df1.combine_first(df2)
print(combined_df)

Verbinde DataFrames mit unterschiedlichen Indizes

df1 = pd.DataFrame({'A': [None, 0], 'B': [4, None]})
df2 = pd.DataFrame({'B': [3, 3], 'C': [1, 1]}, index=[1, 2])
combined_df = df1.combine_first(df2)
print(combined_df)

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die combine_first()-Methode in einem Pandas DataFrame verwendet. Wir haben gesehen, dass diese Methode uns ermöglicht, leere Werte in einem DataFrame mit nicht-leeren Werten aus einem anderen DataFrame zu füllen. Wir haben auch gesehen, wie sie Fälle behandeln kann, in denen beide DataFrames leere Werte haben oder wenn die DataFrames unterschiedliche Indizes haben. Die combine_first()-Methode ist ein nützliches Werkzeug zum Verbinden und Ausfüllen von fehlenden Daten in DataFrames.