Introdução
Este laboratório irá guiá-lo através do processo passo a passo de utilização do método ffill() do Pandas DataFrame. O método ffill(), que significa "preenchimento para frente" (forward fill), preenche valores ausentes em um DataFrame, tomando o último valor que precede o valor nulo e preenchendo-o.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar as bibliotecas necessárias
Para usar o método ffill(), você precisa importar a biblioteca pandas. Você pode fazer isso executando o seguinte código:
import pandas as pd
Criar um DataFrame com valores ausentes
Em seguida, você precisa criar um DataFrame com alguns valores ausentes. Você pode fazer isso executando o seguinte código:
df = pd.DataFrame({"A": [2, None, 4], "B": [None, 4, np.nan], "C": [2, 0.25, np.nan], "D": [9, 4, None]})
Preencher valores ausentes usando o método ffill()
Agora, você pode usar o método ffill() para preencher os valores ausentes no DataFrame. Para fazer isso, basta executar o seguinte código:
df_filled = df.ffill()
Especificar o parâmetro axis
Por padrão, o método ffill() preenche os valores ausentes ao longo do eixo do índice (axis=0). No entanto, você também pode especificar o parâmetro axis para preencher os valores ausentes ao longo do eixo das colunas (axis=1). Para fazer isso, basta executar o seguinte código:
df_filled = df.ffill(axis=1)
Preenchimento Inplace
Por padrão, o método ffill() não modifica o DataFrame original. No entanto, você pode especificar o parâmetro inplace=True para preencher os valores ausentes no local. Para fazer isso, basta executar o seguinte código:
df.ffill(axis=1, inplace=True)
Especificar o parâmetro limite
Você também pode especificar o parâmetro limit para limitar o número de valores NaN consecutivos a serem preenchidos para frente (forward fill). Para fazer isso, basta executar o seguinte código:
df_filled = df.ffill(axis=1, limit=2)
Resumo
Neste laboratório, você aprendeu como usar o método ffill() do DataFrame Pandas para preencher valores ausentes em um DataFrame. Você aprendeu como importar as bibliotecas necessárias, criar um DataFrame com valores ausentes, preencher valores ausentes ao longo de diferentes eixos, preencher valores ausentes no local (in place) e limitar o número de valores NaN consecutivos a serem preenchidos para frente (forward fill). Este método pode ser útil no tratamento de dados ausentes e no pré-processamento de conjuntos de dados para análise.