Méthode assign() pour le DataFrame Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode assign() de la bibliothèque Pandas en Python. La méthode assign() nous permet d'ajouter de nouvelles colonnes à un DataFrame et renvoie un nouvel objet DataFrame avec toutes les colonnes d'origine ainsi que les nouvelles. Nous pouvons assigner de nouvelles colonnes directement ou en utilisant des fonctions ou des expressions.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importez les bibliothèques requises

Tout d'abord, importons les bibliothèques nécessaires : pandas et numpy.

import pandas as pd
import numpy as np

Créez un DataFrame

Ensuite, créons un DataFrame contenant quelques données d'échantillonnage. Nous allons utiliser la fonction pd.DataFrame() pour créer un DataFrame à partir d'un dictionnaire.

data = {'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]}
df = pd.DataFrame(data)
print(df)

La sortie sera :

   A   B
0  1   6
1  2   7
2  3   8
3  4   9
4  5  10

Affectez une nouvelle colonne au DataFrame

Maintenant, affectons une nouvelle colonne au DataFrame en utilisant la méthode assign(). Nous pouvons affecter une nouvelle colonne directement en spécifiant le nom de la colonne et les valeurs.

df = df.assign(C=[11, 12, 13, 14, 15])
print(df)

La sortie sera :

   A   B   C
0  1   6  11
1  2   7  12
2  3   8  13
3  4   9  14
4  5  10  15

Affectez une nouvelle colonne en utilisant une fonction

Nous pouvons également affecter une nouvelle colonne au DataFrame en passant une fonction à la méthode assign(). Cette fonction prendra le DataFrame en entrée et effectuera un calcul pour générer les valeurs de la nouvelle colonne. Affectons une nouvelle colonne D qui calcule la valeur de C plus 1.

df = df.assign(D=lambda x: x['C'] + 1)
print(df)

La sortie sera :

   A   B   C   D
0  1   6  11  12
1  2   7  12  13
2  3   8  13  14
3  4   9  14  15
4  5  10  15  16

Affectez plusieurs colonnes au DataFrame

Nous pouvons affecter plusieurs colonnes au DataFrame en utilisant la méthode assign() plusieurs fois. Affectons deux nouvelles colonnes E et F au DataFrame. La colonne E calculera la valeur de A plus 1, et la colonne F calculera la valeur de B moins 1.

df = df.assign(E=lambda x: x['A'] + 1).assign(F=lambda x: x['B'] - 1)
print(df)

La sortie sera :

   A   B   C   D   E   F
0  1   6  11  12   2   5
1  2   7  12  13   3   6
2  3   8  13  14   4   7
3  4   9  14  15   5   8
4  5  10  15  16   6   9

Sommaire

Dans ce laboratoire, nous avons appris à utiliser la méthode assign() dans Pandas pour ajouter de nouvelles colonnes à un DataFrame. Nous pouvons affecter de nouvelles colonnes directement ou en utilisant des fonctions ou des expressions. Cette méthode nous permet de manipuler et de modifier facilement notre DataFrame sans modifier les données originales.