Método Append do Pandas

Beginner

Introdução

Neste tutorial, você aprenderá como usar o método append() no Python Pandas. O método append() permite que você adicione linhas de um DataFrame a outro e retorna um novo objeto DataFrame. Ele também pode adicionar colunas do DataFrame adicionado se elas ainda não estiverem presentes no DataFrame de chamada.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Criar Dois DataFrames

Primeiramente, precisamos criar dois DataFrames que usaremos para os exemplos neste tutorial.

import pandas as pd

## Create DataFrame 1
df1 = pd.DataFrame([['Abhishek', 100, 'Science', 90],
                    ['Anurag', 101, 'Science', 85]],
                   columns=['Name', 'Roll No', 'Subject', 'Marks'])

## Create DataFrame 2
df2 = pd.DataFrame([['Chetan', 103, 'Maths', 75],
                    ['Divya', 104, 'Science', 80],
                    ['Diya', 105, 'Maths', 92]],
                   columns=['Name', 'Roll No', 'Subject', 'Marks'])

Adicionar Linhas usando o Método append()

Você pode adicionar um DataFrame a outro usando o método append(). Para fazer isso, simplesmente chame o método append() no DataFrame ao qual você deseja adicionar e passe o DataFrame que você deseja adicionar como parâmetro.

## Append DataFrame 2 to DataFrame 1
appended_df = df1.append(df2)

## Print the result
print(appended_df)

Evitar Valores de Índice Sobrepostos

Ao adicionar um DataFrame a outro, os valores do índice podem se sobrepor. Para evitar isso, você pode definir o parâmetro ignore_index como True. Isso reatribuirá novos valores de índice ao DataFrame adicionado.

## Append DataFrame 2 to DataFrame 1 with ignore_index parameter set to True
appended_df = df1.append(df2, ignore_index=True)

## Print the result
print(appended_df)

Prevenir Valores de Índice Sobrepostos

Se você deseja gerar um erro quando os valores do índice se sobrepõem, você pode definir o parâmetro verify_integrity como True.

## Append DataFrame 2 to DataFrame 1 with verify_integrity parameter set to True
try:
    appended_df = df1.append(df2, verify_integrity=True)
except ValueError as e:
    print(e)

Anexar Linha da Série

Você também pode adicionar uma única linha, representada como uma Series, a um DataFrame. Para fazer isso, crie um objeto Series com os valores e o índice da linha e, em seguida, chame o método append() no DataFrame com a Series como parâmetro.

## Create a Series
series = pd.Series(['Chetan', 103, 'Maths', 75], index=['Name', 'Roll No', 'Subject', 'Marks'])

## Append the Series to DataFrame 1
appended_df = df1.append(series, ignore_index=True)

## Print the result
print(appended_df)

Anexar Linha do Dicionário

Você também pode adicionar uma linha representada como um dicionário a um DataFrame. Para fazer isso, crie um dicionário com os nomes das colunas como chaves e os valores da linha como valores e, em seguida, chame o método append() no DataFrame com o dicionário como parâmetro.

## Create a dictionary
dictionary = {'Name': 'Chetan', 'Roll No': 103, 'Subject': 'Maths', 'Marks': 75}

## Append the dictionary to DataFrame 1
appended_df = df1.append(dictionary, ignore_index=True)

## Print the result
print(appended_df)

Resumo

Neste tutorial, você aprendeu como usar o método append() no Python Pandas. Você pode usar este método para adicionar linhas de um DataFrame a outro, bem como adicionar colunas do DataFrame adicionado se elas ainda não estiverem presentes no DataFrame de chamada. Lembre-se de usar os parâmetros apropriados, como ignore_index e verify_integrity, para controlar o comportamento da operação de adição. Este método permite que você combine e manipule facilmente DataFrames em suas tarefas de análise de dados. Boa codificação!