Método combine_first del DataFrame de Pandas

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, aprenderemos a usar el método combine_first() en el DataFrame de Pandas. Este método nos permite combinar dos objetos DataFrame llenando los valores nulos en un DataFrame con valores no nulos de otro DataFrame. Puede ser útil cuando tenemos datos faltantes en un DataFrame y queremos llenarlos con datos de otro DataFrame.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Importar las bibliotecas necesarias

import pandas as pd

Crear dos DataFrames con valores faltantes

df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [1, 1], 'B': [3, 3]})

Combinar los DataFrames usando el método combine_first()

combined_df = df1.combine_first(df2)

Imprimir el DataFrame combinado

print(combined_df)

Agregar una nueva fila a uno de los DataFrames

df2.loc[2] = [2, 2]

Combinar nuevamente los DataFrames

combined_df = df1.combine_first(df2)

Imprimir nuevamente el DataFrame combinado

print(combined_df)

Combinar DataFrames con valores None

df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [None, 1], 'B': [None, 3]})
combined_df = df1.combine_first(df2)
print(combined_df)

Combinar DataFrames con diferentes índices

df1 = pd.DataFrame({'A': [None, 0], 'B': [4, None]})
df2 = pd.DataFrame({'B': [3, 3], 'C': [1, 1]}, index=[1, 2])
combined_df = df1.combine_first(df2)
print(combined_df)

Resumen

En este laboratorio, aprendimos cómo usar el método combine_first() en el DataFrame de Pandas. Vimos que este método nos permite llenar los valores nulos en un DataFrame con valores no nulos de otro DataFrame. También vimos cómo puede manejar casos en los que ambos DataFrames tienen valores nulos o cuando los DataFrames tienen diferentes índices. El método combine_first() es una herramienta útil para combinar y llenar datos faltantes en DataFrames.