Méthode d'insertion de DataFrame de Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode DataFrame.insert() de la bibliothèque pandas de Python. Cette méthode nous permet d'insérer une colonne dans un DataFrame à un emplacement spécifié. Nous pouvons également choisir s'il est possible d'avoir des colonnes dupliquées ou non.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder à Jupyter Notebook pour pratiquer.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importez la bibliothèque pandas

Nous allons commencer par importer la bibliothèque pandas, qui nous permettra de travailler avec des DataFrames.

import pandas as pd

Créez un DataFrame

Ensuite, créons un DataFrame avec lequel travailler. Pour cet exemple, nous allons créer un DataFrame avec deux colonnes, 'A' et 'B', et quatre lignes.

df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8]})

Insérez une nouvelle colonne dans le DataFrame

Maintenant, insérons une nouvelle colonne appelée 'C' à l'index 2 dans le DataFrame. Nous allons définir la valeur de cette colonne sur 1 pour toutes les lignes.

df.insert(2, 'C', 1)

Affichez le DataFrame

Pour voir le DataFrame mis à jour, affichons-le à l'aide de la fonction print().

print(df)

Insérez une série en tant que colonne

Alternativement, nous pouvons insérer un objet Series en tant que colonne dans le DataFrame. Créons un nouvel objet Series avec les valeurs [1, 2, 3, 4] et l'insérons à l'index 0 dans le DataFrame.

series = pd.Series([1, 2, 3, 4])
df.insert(0, 'C', series)

Affichez le DataFrame

Encore une fois, affichons le DataFrame pour voir les modifications.

print(df)

Gérer les colonnes en double

Par défaut, la méthode DataFrame.insert() lève une ValueError si nous essayons d'insérer une colonne avec une étiquette qui existe déjà dans le DataFrame. Cependant, nous pouvons contourner ce comportement en définissant allow_duplicates sur True. Essayons d'insérer une colonne avec une étiquette en double et voyons le résultat.

df.insert(2, 'A', 1, allow_duplicates = True)

Affichez le DataFrame

Après avoir essayé d'insérer la colonne en double, affichons le DataFrame pour voir le message d'erreur.

print(df)

Sommaire

Dans ce laboratoire, nous avons appris à utiliser la méthode DataFrame.insert() dans pandas pour insérer de nouvelles colonnes dans un DataFrame à des emplacements spécifiques. Nous avons appris à insérer des colonnes avec des valeurs constantes et avec des objets Series. Nous avons également vu comment gérer les doublons lors de l'insertion de colonnes. Cette méthode est utile lorsque nous avons besoin d'ajouter de nouvelles fonctionnalités ou de modifier la structure de notre DataFrame.