Pandas DataFrame 的 Join 方法

PandasPandasBeginner
立即练习

💡 本教程由 AI 辅助翻译自英文原版。如需查看原文,您可以 切换至英文原版

介绍

在本实验中,我们将学习如何在 Python Pandas 库中使用 join() 方法。join() 方法用于将另一个 DataFrame 的列连接到现有的 DataFrame 上。它可以根据索引或键列进行连接。

虚拟机提示

虚拟机启动完成后,点击左上角切换到 Notebook 标签页,以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果你在学习过程中遇到问题,请随时向 Labby 寻求帮助。在实验结束后提供反馈,我们将及时为你解决问题。


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) pandas(("Pandas")) -.-> pandas/AdvancedOperationsGroup(["Advanced Operations"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas(("Pandas")) -.-> pandas/ReadingDataGroup(["Reading Data"]) pandas/ReadingDataGroup -.-> pandas/read_csv("Read CSV") pandas/ReadingDataGroup -.-> pandas/read_excel("Read Excel") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") pandas/AdvancedOperationsGroup -.-> pandas/merge_data("Merging Data") pandas/AdvancedOperationsGroup -.-> pandas/reshape_data("Reshaping Data") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/PythonStandardLibraryGroup -.-> python/data_serialization("Data Serialization") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/read_csv -.-> lab-68645{{"Pandas DataFrame 的 Join 方法"}} pandas/read_excel -.-> lab-68645{{"Pandas DataFrame 的 Join 方法"}} python/importing_modules -.-> lab-68645{{"Pandas DataFrame 的 Join 方法"}} python/using_packages -.-> lab-68645{{"Pandas DataFrame 的 Join 方法"}} pandas/merge_data -.-> lab-68645{{"Pandas DataFrame 的 Join 方法"}} pandas/reshape_data -.-> lab-68645{{"Pandas DataFrame 的 Join 方法"}} python/data_collections -.-> lab-68645{{"Pandas DataFrame 的 Join 方法"}} python/data_serialization -.-> lab-68645{{"Pandas DataFrame 的 Join 方法"}} python/data_analysis -.-> lab-68645{{"Pandas DataFrame 的 Join 方法"}} end

导入所需的库并创建 DataFrames

    import pandas as pd

    ## Create the first DataFrame
    df_1 = pd.DataFrame({"A":[0,1], "B":[3,4]})
    print("The first DataFrame:")
    print(df_1)

    ## Create the second DataFrame
    df_2 = pd.DataFrame({"C":[0,1], "D":[3,4]})
    print("The second DataFrame:")
    print(df_2)

使用 join() 方法连接两个 DataFrames

    print("Joined DataFrame:")
    joined_df = df_1.join(df_2)
    print(joined_df)

使用 lsuffixrsuffix 参数连接两个 DataFrames

    print("Joined DataFrame with suffixes:")
    joined_df_suffix = df_1.join(df_2, lsuffix='_first', rsuffix='_second')
    print(joined_df_suffix)

使用特定列作为键连接两个 DataFrames

    print("Joined DataFrame using A as the key:")
    joined_df_key = df_1.set_index('A').join(df_2.set_index('A'))
    print(joined_df_key)

总结

在本实验中,我们学习了如何在 Python 的 Pandas 库中使用 join() 方法。我们了解了如何基于索引或键列连接两个 DataFrames,以及如何使用后缀来区分重叠的列。join() 方法是 Pandas 中用于组合和合并 DataFrames 的有用工具。