Introdução
Neste laboratório, aprenderemos como usar o método combine_first() em um DataFrame do Pandas. Este método nos permite combinar dois objetos DataFrame preenchendo valores nulos em um DataFrame com valores não nulos de outro DataFrame. Pode ser útil quando temos dados ausentes em um DataFrame e queremos preenchê-los com dados de outro DataFrame.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar as bibliotecas necessárias
import pandas as pd
Criar dois DataFrames com valores ausentes
df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [1, 1], 'B': [3, 3]})
Combinar os DataFrames usando o método combine_first()
combined_df = df1.combine_first(df2)
Imprimir o DataFrame combinado
print(combined_df)
Adicionar uma nova linha a um dos DataFrames
df2.loc[2] = [2, 2]
Combinar os DataFrames novamente
combined_df = df1.combine_first(df2)
Imprimir o DataFrame combinado novamente
print(combined_df)
Combinar DataFrames com valores None
df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [None, 1], 'B': [None, 3]})
combined_df = df1.combine_first(df2)
print(combined_df)
Combinar DataFrames com índices diferentes
df1 = pd.DataFrame({'A': [None, 0], 'B': [4, None]})
df2 = pd.DataFrame({'B': [3, 3], 'C': [1, 1]}, index=[1, 2])
combined_df = df1.combine_first(df2)
print(combined_df)
Resumo
Neste laboratório, aprendemos como usar o método combine_first() no DataFrame do Pandas. Vimos que este método nos permite preencher valores nulos em um DataFrame com valores não nulos de outro DataFrame. Também vimos como ele pode lidar com casos em que ambos os DataFrames têm valores nulos ou quando os DataFrames têm diferentes índices. O método combine_first() é uma ferramenta útil para combinar e preencher dados ausentes em DataFrames.