Méthode drop() sur un DataFrame Pandas

Beginner

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode drop() de la bibliothèque Python Pandas pour supprimer des lignes ou des colonnes spécifiques d'un DataFrame. La méthode drop() nous permet de supprimer des étiquettes en spécifiant les noms d'index ou de colonne et l'axe correspondant. Nous pouvons également supprimer des étiquettes à différents niveaux dans un DataFrame à index multi-niveaux.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limites de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importer la bibliothèque pandas

Tout d'abord, nous devons importer la bibliothèque pandas pour utiliser la classe DataFrame et la méthode drop(). Nous pouvons importer pandas à l'aide du code suivant :

import pandas as pd

Créer un DataFrame

Ensuite, créons un DataFrame avec lequel travailler. Nous allons créer un DataFrame avec quelques données d'exemple à l'aide du code suivant :

df = pd.DataFrame([[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11]], columns=['a', 'b', 'c', 'd'])

Supprimer des lignes spécifiques à l'aide de la méthode drop()

Pour supprimer des lignes spécifiques du DataFrame, nous pouvons utiliser la méthode drop() avec le paramètre index. Le paramètre index spécifie l'étiquette ou les étiquettes des lignes à supprimer. Nous pouvons également spécifier le paramètre axis comme 0 ou 'index' pour indiquer que nous voulons supprimer des lignes. Voici un exemple :

dropped_df = df.drop([1])

Supprimer des colonnes spécifiques à l'aide de la méthode drop()

Pour supprimer des colonnes spécifiques du DataFrame, nous pouvons utiliser la méthode drop() avec le paramètre columns. Le paramètre columns spécifie l'étiquette ou les étiquettes des colonnes à supprimer. Nous devons définir le paramètre axis sur 1 ou 'columns' pour indiquer que nous voulons supprimer des colonnes. Voici un exemple :

dropped_df = df.drop(columns=['b'])

Utiliser inplace=True pour modifier le DataFrame en place

Par défaut, la méthode drop() renvoie un nouveau DataFrame avec les lignes ou colonnes supprimées. Cependant, si nous voulons modifier le DataFrame original en place, nous pouvons définir le paramètre inplace sur True. Voici un exemple :

df.drop([1], inplace=True)

Résumé

Dans ce laboratoire, nous avons appris à utiliser la méthode drop() dans la bibliothèque Python Pandas pour supprimer des lignes ou des colonnes spécifiques d'un DataFrame. Nous pouvons spécifier les étiquettes à supprimer en utilisant le paramètre index ou columns, et utiliser le paramètre axis pour indiquer l'axe le long duquel les étiquettes doivent être supprimées. Rappelez-vous que, par défaut, la méthode drop() renvoie un nouveau DataFrame avec les étiquettes supprimées, mais nous pouvons modifier le DataFrame original en place en définissant le paramètre inplace sur True. La méthode drop() est un outil puissant lorsqu'on travaille avec des DataFrames dans pandas.


J'ai révisé le contenu pour répondre aux exigences. N'hésitez pas à me contacter si vous avez besoin d'une assistance supplémentaire.