Método Ffill do DataFrame Pandas

Beginner

Introdução

Este laboratório irá guiá-lo através do processo passo a passo de utilização do método ffill() do Pandas DataFrame. O método ffill(), que significa "preenchimento para frente" (forward fill), preenche valores ausentes em um DataFrame, tomando o último valor que precede o valor nulo e preenchendo-o.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias

Para usar o método ffill(), você precisa importar a biblioteca pandas. Você pode fazer isso executando o seguinte código:

import pandas as pd

Criar um DataFrame com valores ausentes

Em seguida, você precisa criar um DataFrame com alguns valores ausentes. Você pode fazer isso executando o seguinte código:

df = pd.DataFrame({"A": [2, None, 4], "B": [None, 4, np.nan], "C": [2, 0.25, np.nan], "D": [9, 4, None]})

Preencher valores ausentes usando o método ffill()

Agora, você pode usar o método ffill() para preencher os valores ausentes no DataFrame. Para fazer isso, basta executar o seguinte código:

df_filled = df.ffill()

Especificar o parâmetro axis

Por padrão, o método ffill() preenche os valores ausentes ao longo do eixo do índice (axis=0). No entanto, você também pode especificar o parâmetro axis para preencher os valores ausentes ao longo do eixo das colunas (axis=1). Para fazer isso, basta executar o seguinte código:

df_filled = df.ffill(axis=1)

Preenchimento Inplace

Por padrão, o método ffill() não modifica o DataFrame original. No entanto, você pode especificar o parâmetro inplace=True para preencher os valores ausentes no local. Para fazer isso, basta executar o seguinte código:

df.ffill(axis=1, inplace=True)

Especificar o parâmetro limite

Você também pode especificar o parâmetro limit para limitar o número de valores NaN consecutivos a serem preenchidos para frente (forward fill). Para fazer isso, basta executar o seguinte código:

df_filled = df.ffill(axis=1, limit=2)

Resumo

Neste laboratório, você aprendeu como usar o método ffill() do DataFrame Pandas para preencher valores ausentes em um DataFrame. Você aprendeu como importar as bibliotecas necessárias, criar um DataFrame com valores ausentes, preencher valores ausentes ao longo de diferentes eixos, preencher valores ausentes no local (in place) e limitar o número de valores NaN consecutivos a serem preenchidos para frente (forward fill). Este método pode ser útil no tratamento de dados ausentes e no pré-processamento de conjuntos de dados para análise.