Pandas DataFrame Kombinationsmethode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden wir lernen, wie man die combine()-Methode in der pandas-Bibliothek verwendet, um zwei DataFrames spaltenweise zu kombinieren. Die combine()-Methode ermöglicht es uns, Spalten aus einem DataFrame mit einem anderen DataFrame unter Verwendung einer angegebenen Funktion zu kombinieren.

VM-Tipps

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie während des Lernens Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie schnellstmöglich beheben.

Importieren der pandas-Bibliothek

Zunächst müssen wir die pandas-Bibliothek importieren, die eine leistungsstarke Bibliothek für die Datenmanipulation und -analyse ist.

import pandas as pd

Erstellen der DataFrames

Als nächstes erstellen wir zwei DataFrames, die wir verwenden werden, um die combine()-Methode zu demonstrieren.

df1 = pd.DataFrame({'A': [2, 0, 5], 'B': [2, None, -0.25]})
df2 = pd.DataFrame({'A': [3, 1, None], 'B': [3, 3, -4]})

Lassen Sie uns die DataFrames ausgeben, um ihren Inhalt zu sehen.

print("DataFrame 1:")
print(df1)
print("\nDataFrame 2:")
print(df2)

Ausgabe:

DataFrame 1:
   A     B
0  2  2.00
1  0   NaN
2  5 -0.25

DataFrame 2:
     A  B
0  3.0  3
1  1.0  3
2  NaN -4

DataFrames mit der combine()-Methode kombinieren

Jetzt kombinieren wir die beiden DataFrames mit der combine()-Methode.

combined_df = df1.combine(df2, min)

Die min-Funktion wird als func-Parameter verwendet, um den kleineren Wert zwischen den beiden Spalten auszuwählen.

Lassen Sie uns das kombinierte DataFrame ausgeben, um das Ergebnis zu sehen.

print("\nKombiniertes DataFrame:")
print(combined_df)

Ausgabe:

Kombiniertes DataFrame:
     A     B
0  2.0  2.00
1  0.0   NaN
2  5.0 -4.00

DataFrames mit benutzerdefinierter Funktion kombinieren

Wir können auch eine benutzerdefinierte Funktion als func-Parameter verwenden, um die DataFrames zu kombinieren. Erstellen wir eine benutzerdefinierte Funktion multiply_columns, die die Werte in jeder Spalte multipliziert.

def multiply_columns(s1, s2):
    return s1 * s2

combined_df = df1.combine(df2, multiply_columns)

Lassen Sie uns das kombinierte DataFrame ausgeben, um das Ergebnis zu sehen.

print("\nKombiniertes DataFrame:")
print(combined_df)

Ausgabe:

Kombiniertes DataFrame:
     A    B
0  6.0  6.0
1  0.0  NaN
2  NaN  1.0

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die combine()-Methode in pandas verwendet, um zwei DataFrames spaltenweise zu kombinieren. Wir haben gesehen, wie man integrierte Funktionen und benutzerdefinierte Funktionen verwendet, um die Spalten zu vereinigen. Die combine()-Methode ist nützlich, wenn wir Spalten aus zwei DataFrames basierend auf einer bestimmten Bedingung oder Regel kombinieren möchten. Sie bietet Flexibilität bei der Kombination der Daten und füllt fehlende Werte bei Bedarf aus.