Introducción
En este laboratorio, aprenderemos a usar el método combine_first() en el DataFrame de Pandas. Este método nos permite combinar dos objetos DataFrame llenando los valores nulos en un DataFrame con valores no nulos de otro DataFrame. Puede ser útil cuando tenemos datos faltantes en un DataFrame y queremos llenarlos con datos de otro DataFrame.
Consejos sobre la VM
Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.
Importar las bibliotecas necesarias
import pandas as pd
Crear dos DataFrames con valores faltantes
df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [1, 1], 'B': [3, 3]})
Combinar los DataFrames usando el método combine_first()
combined_df = df1.combine_first(df2)
Imprimir el DataFrame combinado
print(combined_df)
Agregar una nueva fila a uno de los DataFrames
df2.loc[2] = [2, 2]
Combinar una vez más los DataFrames
combined_df = df1.combine_first(df2)
Imprimir de nuevo el DataFrame combinado
print(combined_df)
Combinar DataFrames con valores None
df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [None, 1], 'B': [None, 3]})
combined_df = df1.combine_first(df2)
print(combined_df)
Combinar DataFrames con diferentes índices
df1 = pd.DataFrame({'A': [None, 0], 'B': [4, None]})
df2 = pd.DataFrame({'B': [3, 3], 'C': [1, 1]}, index=[1, 2])
combined_df = df1.combine_first(df2)
print(combined_df)
Resumen
En este laboratorio, aprendimos cómo usar el método combine_first() en el DataFrame de Pandas. Vimos que este método nos permite llenar los valores nulos en un DataFrame con valores no nulos de otro DataFrame. También vimos cómo puede manejar casos en los que ambos DataFrames tienen valores nulos o cuando los DataFrames tienen diferentes índices. El método combine_first() es una herramienta útil para combinar y llenar datos faltantes en DataFrames.