Método de combinación de DataFrame de Pandas

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, aprenderemos a usar el método combine() de la biblioteca pandas para combinar dos DataFrames por columnas. El método combine() nos permite fusionar columnas de un DataFrame con otro DataFrame usando una función especificada.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos para que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Importar la biblioteca pandas

Primero, necesitamos importar la biblioteca pandas, que es una biblioteca poderosa para la manipulación y análisis de datos.

import pandas as pd

Crear los DataFrames

A continuación, creemos dos DataFrames que usaremos para demostrar el método combine().

df1 = pd.DataFrame({'A': [2, 0, 5], 'B': [2, None, -0.25]})
df2 = pd.DataFrame({'A': [3, 1, None], 'B': [3, 3, -4]})

Imprimamos los DataFrames para ver su contenido.

print("DataFrame 1:")
print(df1)
print("\nDataFrame 2:")
print(df2)

Salida:

DataFrame 1:
   A     B
0  2  2.00
1  0   NaN
2  5 -0.25

DataFrame 2:
     A  B
0  3.0  3
1  1.0  3
2  NaN -4

Combinar DataFrames usando el método combine()

Ahora, combinemos los dos DataFrames usando el método combine().

combined_df = df1.combine(df2, min)

La función min se utiliza como parámetro func para elegir el valor más pequeño entre las dos columnas.

Imprimamos el DataFrame combinado para ver el resultado.

print("\nDataFrame combinado:")
print(combined_df)

Salida:

DataFrame combinado:
     A     B
0  2.0  2.00
1  0.0   NaN
2  5.0 -4.00

Combinar DataFrames con una función personalizada

También podemos usar una función personalizada como parámetro func para combinar los DataFrames. Creemos una función personalizada multiply_columns que multiplique los valores en cada columna.

def multiply_columns(s1, s2):
    return s1 * s2

combined_df = df1.combine(df2, multiply_columns)

Imprimamos el DataFrame combinado para ver el resultado.

print("\nDataFrame combinado:")
print(combined_df)

Salida:

DataFrame combinado:
     A    B
0  6.0  6.0
1  0.0  NaN
2  NaN  1.0

Resumen

En este laboratorio, aprendimos cómo usar el método combine() en pandas para combinar dos DataFrames por columnas. Vimos cómo usar funciones integradas y funciones personalizadas para fusionar las columnas. El método combine() es útil cuando queremos fusionar columnas de dos DataFrames basados en una condición o regla específica. Proporciona flexibilidad en cómo combinamos los datos y rellena los valores faltantes cuando sea necesario.