Método drop() em DataFrame Pandas

Beginner

Introdução

Neste laboratório, aprenderemos como usar o método drop() na biblioteca Pandas do Python para remover linhas ou colunas específicas de um DataFrame. O método drop() permite que removamos rótulos especificando os nomes do índice ou da coluna e o eixo correspondente. Também podemos remover rótulos em diferentes níveis em um DataFrame multi-índice.

Dicas da VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar a biblioteca pandas

Primeiramente, precisamos importar a biblioteca pandas para usar o DataFrame e o método drop(). Podemos importar pandas usando o seguinte código:

import pandas as pd

Criar um DataFrame

Em seguida, vamos criar um DataFrame para trabalhar. Criaremos um DataFrame com alguns dados de exemplo usando o seguinte código:

df = pd.DataFrame([[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11]], columns=['a', 'b', 'c', 'd'])

Remover linhas específicas usando o método drop()

Para remover linhas específicas do DataFrame, podemos usar o método drop() com o parâmetro index. O parâmetro index especifica o rótulo ou rótulos das linhas a serem removidas. Também podemos especificar o parâmetro axis como 0 ou 'index' para indicar que queremos remover linhas. Aqui está um exemplo:

dropped_df = df.drop([1])

Remover colunas específicas usando o método drop()

Para remover colunas específicas do DataFrame, podemos usar o método drop() com o parâmetro columns. O parâmetro columns especifica o rótulo ou rótulos das colunas a serem removidas. Precisamos definir o parâmetro axis como 1 ou 'columns' para indicar que queremos remover colunas. Aqui está um exemplo:

dropped_df = df.drop(columns=['b'])

Use inplace=True para modificar o DataFrame no local

Por padrão, o método drop() retorna um novo DataFrame com as linhas ou colunas removidas. No entanto, se quisermos modificar o DataFrame original no local (in-place), podemos definir o parâmetro inplace como True. Aqui está um exemplo:

df.drop([1], inplace=True)

Resumo

Neste laboratório, aprendemos como usar o método drop() na biblioteca Python Pandas para remover linhas ou colunas específicas de um DataFrame. Podemos especificar os rótulos a serem removidos usando o parâmetro index ou columns, e usar o parâmetro axis para indicar o eixo ao longo do qual os rótulos devem ser removidos. Lembre-se que, por padrão, o método drop() retorna um novo DataFrame com os rótulos removidos, mas podemos modificar o DataFrame original no local (in-place) definindo o parâmetro inplace como True. O método drop() é uma ferramenta poderosa ao trabalhar com DataFrames em pandas.