Introduction
Dans ce laboratoire, nous allons apprendre à travailler avec les colonnes dans Pandas. Nous explorerons comment créer de nouvelles colonnes à partir de celles existantes, appliquer des opérations mathématiques et logiques sur les colonnes, renommer les étiquettes de colonnes et effectuer des opérations par colonne à l'aide de la méthode apply.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour passer à l'onglet Carnet de notes pour accéder à Jupyter Notebook pour la pratique.
Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez des commentaires après la session, et nous résoudrons rapidement le problème pour vous.
Import Pandas et charger les données
Tout d'abord, nous allons importer la bibliothèque pandas et charger les données de qualité de l'air à partir d'un fichier CSV.
## Import pandas library
import pandas as pd
## Load air quality data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
Créer une nouvelle colonne
Nous allons créer une nouvelle colonne, "london_mg_per_cubic", en multipliant la colonne "station_london" par un facteur de conversion.
## Create new column by multiplying "station_london" by conversion factor
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882
Vérifier le ratio des valeurs dans deux colonnes
Ensuite, nous allons vérifier le ratio des valeurs dans les colonnes "station_paris" et "station_antwerp" et enregistrer le résultat dans une nouvelle colonne.
## Create new column by dividing "station_paris" by "station_antwerp"
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]
Renommer les étiquettes de colonnes
Nous allons renommer les étiquettes de colonnes pour correspondre aux identifiants de stations utilisés par OpenAQ.
## Rename column labels
air_quality_renamed = air_quality.rename(
columns={
"station_antwerp": "BETR801",
"station_paris": "FR04014",
"station_london": "London Westminster",
}
)
Convertir les étiquettes de colonne en minuscules
Enfin, nous allons convertir les étiquettes de colonne en minuscules en utilisant une fonction.
## Convert column labels to lowercase
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)
Sommaire
Dans ce laboratoire, nous avons appris à créer de nouvelles colonnes à partir de colonnes existantes, à effectuer des opérations mathématiques et logiques sur les colonnes, à renommer les étiquettes de colonne et à convertir les étiquettes de colonne en minuscules. Avec ces compétences, nous pouvons manipuler et transformer les données dans pandas de manière plus efficace.