Método de Unión de DataFrame en Pandas

PandasPandasBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, aprenderemos a usar el método join() de la biblioteca Python Pandas. El método join() se utiliza para unir las columnas de otro DataFrame a un DataFrame existente. Puede unir las columnas basándose en el índice o en una columna de clave.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL pandas(("Pandas")) -.-> pandas/AdvancedOperationsGroup(["Advanced Operations"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas(("Pandas")) -.-> pandas/ReadingDataGroup(["Reading Data"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) pandas/ReadingDataGroup -.-> pandas/read_csv("Read CSV") pandas/ReadingDataGroup -.-> pandas/read_excel("Read Excel") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") pandas/AdvancedOperationsGroup -.-> pandas/merge_data("Merging Data") pandas/AdvancedOperationsGroup -.-> pandas/reshape_data("Reshaping Data") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/PythonStandardLibraryGroup -.-> python/data_serialization("Data Serialization") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/read_csv -.-> lab-68645{{"Método de Unión de DataFrame en Pandas"}} pandas/read_excel -.-> lab-68645{{"Método de Unión de DataFrame en Pandas"}} python/importing_modules -.-> lab-68645{{"Método de Unión de DataFrame en Pandas"}} python/using_packages -.-> lab-68645{{"Método de Unión de DataFrame en Pandas"}} pandas/merge_data -.-> lab-68645{{"Método de Unión de DataFrame en Pandas"}} pandas/reshape_data -.-> lab-68645{{"Método de Unión de DataFrame en Pandas"}} python/data_collections -.-> lab-68645{{"Método de Unión de DataFrame en Pandas"}} python/data_serialization -.-> lab-68645{{"Método de Unión de DataFrame en Pandas"}} python/data_analysis -.-> lab-68645{{"Método de Unión de DataFrame en Pandas"}} end

Importar las bibliotecas necesarias y crear los DataFrames

    import pandas as pd

    ## Crear el primer DataFrame
    df_1 = pd.DataFrame({"A":[0,1], "B":[3,4]})
    print("El primer DataFrame:")
    print(df_1)

    ## Crear el segundo DataFrame
    df_2 = pd.DataFrame({"C":[0,1], "D":[3,4]})
    print("El segundo DataFrame:")
    print(df_2)

Unir los dos DataFrames usando el método join()

    print("DataFrame unido:")
    joined_df = df_1.join(df_2)
    print(joined_df)

Unir los dos DataFrames usando los parámetros lsuffix y rsuffix

    print("DataFrame unido con sufijos:")
    joined_df_suffix = df_1.join(df_2, lsuffix='_first', rsuffix='_second')
    print(joined_df_suffix)

Unir los dos DataFrames usando una columna específica como clave

    print("DataFrame unido usando A como clave:")
    joined_df_key = df_1.set_index('A').join(df_2.set_index('A'))
    print(joined_df_key)

Resumen

En este laboratorio, aprendimos cómo usar el método join() en la biblioteca Python Pandas. Vimos cómo unir dos DataFrames basados en el índice o una columna clave, y cómo usar sufijos para diferenciar las columnas superpuestas. El método join() es una herramienta útil para combinar y fusionar DataFrames en Pandas.