Travailler avec les colonnes dans Pandas

Beginner

This tutorial is from open-source community. Access the source code

Introduction

Dans ce laboratoire, nous allons apprendre à travailler avec les colonnes dans Pandas. Nous explorerons comment créer de nouvelles colonnes à partir de celles existantes, appliquer des opérations mathématiques et logiques sur les colonnes, renommer les étiquettes de colonnes et effectuer des opérations par colonne à l'aide de la méthode apply.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour passer à l'onglet Carnet de notes pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez des commentaires après la session, et nous résoudrons rapidement le problème pour vous.

Ceci est un Guided Lab, qui fournit des instructions étape par étape pour vous aider à apprendre et à pratiquer. Suivez attentivement les instructions pour compléter chaque étape et acquérir une expérience pratique. Les données historiques montrent que c'est un laboratoire de niveau débutant avec un taux de réussite de 98%. Il a reçu un taux d'avis positifs de 100% de la part des apprenants.

Import Pandas et charger les données

Tout d'abord, nous allons importer la bibliothèque pandas et charger les données de qualité de l'air à partir d'un fichier CSV.

## Import pandas library
import pandas as pd

## Load air quality data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)

Créer une nouvelle colonne

Nous allons créer une nouvelle colonne, "london_mg_per_cubic", en multipliant la colonne "station_london" par un facteur de conversion.

## Create new column by multiplying "station_london" by conversion factor
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882

Vérifier le ratio des valeurs dans deux colonnes

Ensuite, nous allons vérifier le ratio des valeurs dans les colonnes "station_paris" et "station_antwerp" et enregistrer le résultat dans une nouvelle colonne.

## Create new column by dividing "station_paris" by "station_antwerp"
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]

Renommer les étiquettes de colonnes

Nous allons renommer les étiquettes de colonnes pour correspondre aux identifiants de stations utilisés par OpenAQ.

## Rename column labels
air_quality_renamed = air_quality.rename(
    columns={
        "station_antwerp": "BETR801",
        "station_paris": "FR04014",
        "station_london": "London Westminster",
    }
)

Convertir les étiquettes de colonne en minuscules

Enfin, nous allons convertir les étiquettes de colonne en minuscules en utilisant une fonction.

## Convert column labels to lowercase
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)

Sommaire

Dans ce laboratoire, nous avons appris à créer de nouvelles colonnes à partir de colonnes existantes, à effectuer des opérations mathématiques et logiques sur les colonnes, à renommer les étiquettes de colonne et à convertir les étiquettes de colonne en minuscules. Avec ces compétences, nous pouvons manipuler et transformer les données dans pandas de manière plus efficace.