Introdução
Neste laboratório, aprenderemos como usar o método clip() na biblioteca Pandas para truncar valores em um DataFrame. O método clip() nos permite definir limites superior e inferior e atribuir valores fora dos limites aos valores dos limites. Isso pode ser útil quando queremos limitar a faixa de valores em nosso DataFrame.
Dicas da VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar a biblioteca pandas e criar um DataFrame
Primeiro, vamos importar a biblioteca pandas e criar um DataFrame.
import pandas as pd
## Create a dictionary with some sample data
data = {'col_1': [9, -3, 0, -1, 12], 'col_2': [-2, -7, -6, 8, -5]}
## Create a DataFrame from the dictionary
df = pd.DataFrame(data)
Exibir o DataFrame original
Vamos exibir o DataFrame original para ver os valores antes de aplicar o método clip().
print("------DataFrame--------")
print(df)
Usar o método clip() com um limite superior
Agora, vamos usar o método clip() para truncar valores em um limite superior. Isso significa que quaisquer valores acima do limite superior especificado serão definidos para o próprio valor do limite.
## Trim values at an upper threshold of 6
clipped_df = df.clip(upper=6)
print("------After clipping the DataFrame--------")
print(clipped_df)
Usar o método clip() com um limite inferior
Em seguida, vamos usar o método clip() para truncar valores em um limite inferior. Isso significa que quaisquer valores abaixo do limite inferior especificado serão definidos para o próprio valor do limite.
## Trim values at a lower threshold of -1
clipped_df = df.clip(lower=-1)
print("------After clipping the DataFrame--------")
print(clipped_df)
Usar o método clip() com limites superior e inferior
Finalmente, vamos usar o método clip() para truncar valores em um limite superior e inferior. Isso significa que quaisquer valores acima do limite superior serão definidos para o valor do limite superior, e quaisquer valores abaixo do limite inferior serão definidos para o valor do limite inferior.
## Trim values at a lower threshold of -1 and an upper threshold of 6
clipped_df = df.clip(-1, 6)
print("------After clipping the DataFrame--------")
print(clipped_df)
Resumo
Neste laboratório, aprendemos como usar o método clip() na biblioteca Pandas para truncar valores em um DataFrame. Vimos como podemos definir limites superior e inferior para limitar a faixa de valores no DataFrame. Isso pode ser útil em tarefas de limpeza e processamento de dados.