Méthode append de Pandas

Beginner

Introduction

Dans ce tutoriel, vous allez apprendre à utiliser la méthode append() dans Python Pandas. La méthode append() vous permet d'ajouter des lignes d'un DataFrame à un autre et renvoie un nouvel objet DataFrame. Elle peut également ajouter des colonnes du DataFrame ajouté si elles ne sont pas déjà présentes dans le DataFrame appelant.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Créer deux DataFrames

Tout d'abord, nous devons créer deux DataFrames que nous utiliserons pour les exemples de ce tutoriel.

import pandas as pd

## Créer le DataFrame 1
df1 = pd.DataFrame([['Abhishek', 100, 'Science', 90],
                    ['Anurag', 101, 'Science', 85]],
                   columns=['Name', 'Roll No', 'Subject', 'Marks'])

## Créer le DataFrame 2
df2 = pd.DataFrame([['Chetan', 103, 'Maths', 75],
                    ['Divya', 104, 'Science', 80],
                    ['Diya', 105, 'Maths', 92]],
                   columns=['Name', 'Roll No', 'Subject', 'Marks'])

Ajouter des lignes en utilisant la méthode append()

Vous pouvez ajouter un DataFrame à un autre en utilisant la méthode append(). Pour ce faire, appelez simplement la méthode append() sur le DataFrame auquel vous voulez ajouter des lignes, et passez le DataFrame que vous voulez ajouter en tant que paramètre.

## Ajoutez le DataFrame 2 au DataFrame 1
appended_df = df1.append(df2)

## Affichez le résultat
print(appended_df)

Éviter les valeurs d'index qui se chevauchent

Lorsque vous ajoutez un DataFrame à un autre, les valeurs d'index peuvent être en chevauchement. Pour éviter cela, vous pouvez définir le paramètre ignore_index sur True. Cela réaffectera de nouvelles valeurs d'index au DataFrame ajouté.

## Ajoutez le DataFrame 2 au DataFrame 1 en définissant le paramètre ignore_index sur True
appended_df = df1.append(df2, ignore_index=True)

## Affichez le résultat
print(appended_df)

Empêcher les valeurs d'index qui se chevauchent

Si vous voulez lever une erreur lorsque les valeurs d'index sont en chevauchement, vous pouvez définir le paramètre verify_integrity sur True.

## Ajoutez le DataFrame 2 au DataFrame 1 en définissant le paramètre verify_integrity sur True
try:
    appended_df = df1.append(df2, verify_integrity=True)
except ValueError as e:
    print(e)

Ajouter une ligne à partir d'une Séries

Vous pouvez également ajouter une seule ligne, représentée sous forme d'une Séries, à un DataFrame. Pour ce faire, créez un objet Séries avec les valeurs et l'index de la ligne, puis appelez la méthode append() sur le DataFrame en utilisant la Séries comme paramètre.

## Créez une Séries
series = pd.Series(['Chetan', 103, 'Maths', 75], index=['Name', 'Roll No', 'Subject', 'Marks'])

## Ajoutez la Séries au DataFrame 1
appended_df = df1.append(series, ignore_index=True)

## Affichez le résultat
print(appended_df)

Ajouter une ligne à partir d'un Dictionnaire

Vous pouvez également ajouter une ligne représentée sous forme d'un dictionnaire à un DataFrame. Pour ce faire, créez un dictionnaire avec les noms de colonnes comme clés et les valeurs de ligne comme valeurs, puis appelez la méthode append() sur le DataFrame en utilisant le dictionnaire comme paramètre.

## Créez un dictionnaire
dictionary = {'Name': 'Chetan', 'Roll No': 103, 'Subject': 'Maths', 'Marks': 75}

## Ajoutez le dictionnaire au DataFrame 1
appended_df = df1.append(dictionary, ignore_index=True)

## Affichez le résultat
print(appended_df)

Résumé

Dans ce tutoriel, vous avez appris à utiliser la méthode append() dans Python Pandas. Vous pouvez utiliser cette méthode pour ajouter des lignes d'un DataFrame à un autre, ainsi que pour ajouter des colonnes du DataFrame ajouté si elles ne sont pas déjà présentes dans le DataFrame appelant. N'oubliez pas d'utiliser les paramètres appropriés, tels que ignore_index et verify_integrity, pour contrôler le comportement de l'opération d'ajout. Cette méthode vous permet de facilement combiner et manipuler des DataFrames dans vos tâches d'analyse de données. Bonne programmation!