Méthode apply() sur DataFrame Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode apply() de la bibliothèque Pandas pour Python. La méthode apply() nous permet d'appliquer une fonction à chaque ligne ou colonne d'un DataFrame, et elle est utile pour effectuer des calculs ou des transformations sur nos données.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importez les bibliothèques nécessaires

Pour commencer, nous devons importer la bibliothèque Pandas, qui fournit l'objet DataFrame et la méthode apply(). Nous pouvons également importer d'autres bibliothèques si elles sont nécessaires pour nos calculs.

import pandas as pd

Créez un DataFrame

Ensuite, créons un DataFrame avec lequel travailler. Nous pouvons définir les données à l'aide d'une liste Python ou d'un dictionnaire. Pour simplifier, utilisons un dictionnaire où les clés représentent les noms des colonnes et les valeurs représentent les données.

data = {
    'Name': ['John', 'Emma', 'David', 'Mary'],
    'Age': [25, 30, 35, 40],
    'Salary': [50000, 60000, 70000, 80000]
}
df = pd.DataFrame(data)
print(df)

Définissez une fonction

Maintenant, définissons une fonction que nous pouvons appliquer à notre DataFrame. Cette fonction prendra un seul paramètre, qui sera une ligne ou une colonne du DataFrame.

def double(x):
    return x * 2

Appliquez la fonction à une colonne

Nous pouvons utiliser la méthode apply() pour appliquer notre fonction définie à une colonne du DataFrame. Dans cet exemple, appliquons la fonction double() à la colonne 'Salary'.

df['Salary'] = df['Salary'].apply(double)
print(df)

Appliquez la fonction à une ligne

Nous pouvons également appliquer notre fonction à une ligne du DataFrame en spécifiant axis=1 dans la méthode apply(). Dans cet exemple, appliquons la fonction double() à chaque ligne du DataFrame.

df = df.apply(double, axis=1)
print(df)

Appliquez une fonction lambda

Au lieu de définir une fonction séparée, nous pouvons utiliser une fonction lambda directement avec la méthode apply(). Une fonction lambda est une petite fonction anonyme qui peut prendre un nombre quelconque d'arguments et renvoyer un résultat. Dans cet exemple, appliquons une fonction lambda à la colonne 'Age' pour calculer le carré de chaque valeur.

df['Age'] = df['Age'].apply(lambda x: x ** 2)
print(df)

Récapitulatif

Dans ce laboratoire, nous avons appris à utiliser la méthode apply() dans Pandas pour appliquer une fonction à chaque ligne ou colonne d'un DataFrame. Nous avons vu comment définir une fonction et l'appliquer à une colonne ou une ligne, ainsi que comment utiliser une fonction lambda directement avec la méthode apply(). La méthode apply() est un outil puissant pour effectuer des calculs ou des transformations sur nos données, et elle peut aider à simplifier nos tâches d'analyse de données.