Метод объединения DataFrame в Pandas

PandasPandasBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом практическом занятии мы научимся использовать метод join() из библиотеки Python Pandas. Метод join() используется для объединения столбцов из другого DataFrame с существующим DataFrame. Он может объединять столбцы на основе индекса или по ключевому столбцу.

Советы по работе с ВМ

После запуска виртуальной машины нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL pandas(("Pandas")) -.-> pandas/ReadingDataGroup(["Reading Data"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas(("Pandas")) -.-> pandas/AdvancedOperationsGroup(["Advanced Operations"]) pandas/ReadingDataGroup -.-> pandas/read_csv("Read CSV") pandas/ReadingDataGroup -.-> pandas/read_excel("Read Excel") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") pandas/AdvancedOperationsGroup -.-> pandas/merge_data("Merging Data") pandas/AdvancedOperationsGroup -.-> pandas/reshape_data("Reshaping Data") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/PythonStandardLibraryGroup -.-> python/data_serialization("Data Serialization") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/read_csv -.-> lab-68645{{"Метод объединения DataFrame в Pandas"}} pandas/read_excel -.-> lab-68645{{"Метод объединения DataFrame в Pandas"}} python/importing_modules -.-> lab-68645{{"Метод объединения DataFrame в Pandas"}} python/using_packages -.-> lab-68645{{"Метод объединения DataFrame в Pandas"}} pandas/merge_data -.-> lab-68645{{"Метод объединения DataFrame в Pandas"}} pandas/reshape_data -.-> lab-68645{{"Метод объединения DataFrame в Pandas"}} python/data_collections -.-> lab-68645{{"Метод объединения DataFrame в Pandas"}} python/data_serialization -.-> lab-68645{{"Метод объединения DataFrame в Pandas"}} python/data_analysis -.-> lab-68645{{"Метод объединения DataFrame в Pandas"}} end

Импортируем необходимые библиотеки и создаем DataFrame

    import pandas as pd

    ## Создаем первый DataFrame
    df_1 = pd.DataFrame({"A":[0,1], "B":[3,4]})
    print("Первый DataFrame:")
    print(df_1)

    ## Создаем второй DataFrame
    df_2 = pd.DataFrame({"C":[0,1], "D":[3,4]})
    print("Второй DataFrame:")
    print(df_2)

Объединим два DataFrame с использованием метода join()

    print("Объединенный DataFrame:")
    joined_df = df_1.join(df_2)
    print(joined_df)

Объединим два DataFrame с использованием параметров lsuffix и rsuffix

    print("Объединенный DataFrame с суффиксами:")
    joined_df_suffix = df_1.join(df_2, lsuffix='_first', rsuffix='_second')
    print(joined_df_suffix)

Объединим два DataFrame, используя определенный столбец в качестве ключа

    print("Объединенный DataFrame, используя A в качестве ключа:")
    joined_df_key = df_1.set_index('A').join(df_2.set_index('A'))
    print(joined_df_key)

Резюме

В этом практическом занятии мы узнали, как использовать метод join() в библиотеке Python Pandas. Мы увидели, как объединять два DataFrame по индексу или по ключевому столбцу, а также как использовать суффиксы для различения перекрывающихся столбцов. Метод join() - это полезный инструмент для объединения и слияния DataFrame в Pandas.