Pandas DataFrame combine_first Methode

Beginner

Einführung

In diesem Lab lernen wir, wie wir die combine_first()-Methode in einem Pandas DataFrame verwenden. Diese Methode ermöglicht es uns, zwei DataFrame-Objekte zu kombinieren, indem wir leere Werte in einem DataFrame mit nicht-leeren Werten aus einem anderen DataFrame auffüllen. Dies kann nützlich sein, wenn wir in einem DataFrame fehlende Daten haben und diese mit Daten aus einem anderen DataFrame auffüllen möchten.

Tipps für die virtuelle Maschine

Nachdem der Start der virtuellen Maschine abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem für Sie prompt beheben.

Importiere die erforderlichen Bibliotheken

import pandas as pd

Erstelle zwei DataFrames mit fehlenden Werten

df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [1, 1], 'B': [3, 3]})

Verbinde die DataFrames mit der combine_first()-Methode

combined_df = df1.combine_first(df2)

Drucke das kombinierte DataFrame

print(combined_df)

Füge eine neue Zeile zu einem der DataFrames hinzu

df2.loc[2] = [2, 2]

Verbindung der DataFrames erneut

combined_df = df1.combine_first(df2)

Drucke das kombinierte DataFrame erneut

print(combined_df)

Vereinige DataFrames mit None-Werten

df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [None, 1], 'B': [None, 3]})
combined_df = df1.combine_first(df2)
print(combined_df)

Vereinige DataFrames mit unterschiedlichen Indexen

df1 = pd.DataFrame({'A': [None, 0], 'B': [4, None]})
df2 = pd.DataFrame({'B': [3, 3], 'C': [1, 1]}, index=[1, 2])
combined_df = df1.combine_first(df2)
print(combined_df)

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die combine_first()-Methode in einem Pandas DataFrame verwendet. Wir haben gesehen, dass diese Methode uns ermöglicht, leere Werte in einem DataFrame mit nicht-leeren Werten aus einem anderen DataFrame zu füllen. Wir haben auch gesehen, wie sie Fälle behandeln kann, in denen beide DataFrames leere Werte haben oder wenn die DataFrames unterschiedliche Indizes haben. Die combine_first()-Methode ist ein nützliches Werkzeug zum Verbinden und Ausfüllen von fehlenden Daten in DataFrames.