Método combine_first do Pandas DataFrame

Beginner

Introdução

Neste laboratório, aprenderemos como usar o método combine_first() em um DataFrame do Pandas. Este método nos permite combinar dois objetos DataFrame preenchendo valores nulos em um DataFrame com valores não nulos de outro DataFrame. Pode ser útil quando temos dados ausentes em um DataFrame e queremos preenchê-los com dados de outro DataFrame.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias

import pandas as pd

Criar dois DataFrames com valores ausentes

df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [1, 1], 'B': [3, 3]})

Combinar os DataFrames usando o método combine_first()

combined_df = df1.combine_first(df2)

Imprimir o DataFrame combinado

print(combined_df)

Adicionar uma nova linha a um dos DataFrames

df2.loc[2] = [2, 2]

Combinar os DataFrames novamente

combined_df = df1.combine_first(df2)

Imprimir o DataFrame combinado novamente

print(combined_df)

Combinar DataFrames com valores None

df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [None, 1], 'B': [None, 3]})
combined_df = df1.combine_first(df2)
print(combined_df)

Combinar DataFrames com índices diferentes

df1 = pd.DataFrame({'A': [None, 0], 'B': [4, None]})
df2 = pd.DataFrame({'B': [3, 3], 'C': [1, 1]}, index=[1, 2])
combined_df = df1.combine_first(df2)
print(combined_df)

Resumo

Neste laboratório, aprendemos como usar o método combine_first() no DataFrame do Pandas. Vimos que este método nos permite preencher valores nulos em um DataFrame com valores não nulos de outro DataFrame. Também vimos como ele pode lidar com casos em que ambos os DataFrames têm valores nulos ou quando os DataFrames têm diferentes índices. O método combine_first() é uma ferramenta útil para combinar e preencher dados ausentes em DataFrames.