Pandas DataFrame Join Methode

PandasPandasBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab lernen wir, wie die join()-Methode in der Python-Pandas-Bibliothek verwendet wird. Die join()-Methode wird verwendet, um die Spalten eines anderen DataFrames an einen bestehenden DataFrame anzufügen. Sie kann die Spalten anhand des Index oder einer Schlüsselspalte verbinden.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) pandas(("Pandas")) -.-> pandas/ReadingDataGroup(["Reading Data"]) pandas(("Pandas")) -.-> pandas/AdvancedOperationsGroup(["Advanced Operations"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas/ReadingDataGroup -.-> pandas/read_csv("Read CSV") pandas/ReadingDataGroup -.-> pandas/read_excel("Read Excel") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") pandas/AdvancedOperationsGroup -.-> pandas/merge_data("Merging Data") pandas/AdvancedOperationsGroup -.-> pandas/reshape_data("Reshaping Data") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/PythonStandardLibraryGroup -.-> python/data_serialization("Data Serialization") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/read_csv -.-> lab-68645{{"Pandas DataFrame Join Methode"}} pandas/read_excel -.-> lab-68645{{"Pandas DataFrame Join Methode"}} python/importing_modules -.-> lab-68645{{"Pandas DataFrame Join Methode"}} python/using_packages -.-> lab-68645{{"Pandas DataFrame Join Methode"}} pandas/merge_data -.-> lab-68645{{"Pandas DataFrame Join Methode"}} pandas/reshape_data -.-> lab-68645{{"Pandas DataFrame Join Methode"}} python/data_collections -.-> lab-68645{{"Pandas DataFrame Join Methode"}} python/data_serialization -.-> lab-68645{{"Pandas DataFrame Join Methode"}} python/data_analysis -.-> lab-68645{{"Pandas DataFrame Join Methode"}} end

Importieren der erforderlichen Bibliotheken und Erstellen der DataFrames

    import pandas as pd

    ## Erstellen des ersten DataFrames
    df_1 = pd.DataFrame({"A":[0,1], "B":[3,4]})
    print("Der erste DataFrame:")
    print(df_1)

    ## Erstellen des zweiten DataFrames
    df_2 = pd.DataFrame({"C":[0,1], "D":[3,4]})
    print("Der zweite DataFrame:")
    print(df_2)

Verbinden der beiden DataFrames mit der join()-Methode

    print("Verbundenes DataFrame:")
    joined_df = df_1.join(df_2)
    print(joined_df)

Verbinden der beiden DataFrames mit den Parametern lsuffix und rsuffix

    print("Verbundenes DataFrame mit Suffixen:")
    joined_df_suffix = df_1.join(df_2, lsuffix='_first', rsuffix='_second')
    print(joined_df_suffix)

Verbinden der beiden DataFrames unter Verwendung einer bestimmten Spalte als Schlüssel

    print("Verbundenes DataFrame unter Verwendung von A als Schlüssel:")
    joined_df_key = df_1.set_index('A').join(df_2.set_index('A'))
    print(joined_df_key)

Zusammenfassung

In diesem Lab haben wir gelernt, wie die join()-Methode in der Python-Pandas-Bibliothek verwendet wird. Wir haben gesehen, wie man zwei DataFrames anhand des Index oder einer Schlüsselspalte verknüpft und wie man Suffixe verwendet, um die überlappenden Spalten zu unterscheiden. Die join()-Methode ist ein nützliches Werkzeug zum Kombinieren und Zusammenführen von DataFrames in Pandas.