Einführung
In diesem Lab lernen wir, wie wir die combine_first()-Methode in einem Pandas DataFrame verwenden. Diese Methode ermöglicht es uns, zwei DataFrame-Objekte zu kombinieren, indem wir leere Werte in einem DataFrame mit nicht-leeren Werten aus einem anderen DataFrame auffüllen. Dies kann nützlich sein, wenn wir in einem DataFrame fehlende Daten haben und diese mit Daten aus einem anderen DataFrame auffüllen möchten.
Tipps für die virtuelle Maschine
Nachdem der Start der virtuellen Maschine abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.
Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.
Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem für Sie prompt beheben.
Importiere die erforderlichen Bibliotheken
import pandas as pd
Erstelle zwei DataFrames mit fehlenden Werten
df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [1, 1], 'B': [3, 3]})
Verbinde die DataFrames mit der combine_first()-Methode
combined_df = df1.combine_first(df2)
Drucke das kombinierte DataFrame
print(combined_df)
Füge eine neue Zeile zu einem der DataFrames hinzu
df2.loc[2] = [2, 2]
Verbindung der DataFrames erneut
combined_df = df1.combine_first(df2)
Drucke das kombinierte DataFrame erneut
print(combined_df)
Vereinige DataFrames mit None-Werten
df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [None, 1], 'B': [None, 3]})
combined_df = df1.combine_first(df2)
print(combined_df)
Vereinige DataFrames mit unterschiedlichen Indexen
df1 = pd.DataFrame({'A': [None, 0], 'B': [4, None]})
df2 = pd.DataFrame({'B': [3, 3], 'C': [1, 1]}, index=[1, 2])
combined_df = df1.combine_first(df2)
print(combined_df)
Zusammenfassung
In diesem Lab haben wir gelernt, wie man die combine_first()-Methode in einem Pandas DataFrame verwendet. Wir haben gesehen, dass diese Methode uns ermöglicht, leere Werte in einem DataFrame mit nicht-leeren Werten aus einem anderen DataFrame zu füllen. Wir haben auch gesehen, wie sie Fälle behandeln kann, in denen beide DataFrames leere Werte haben oder wenn die DataFrames unterschiedliche Indizes haben. Die combine_first()-Methode ist ein nützliches Werkzeug zum Verbinden und Ausfüllen von fehlenden Daten in DataFrames.