Introducción
En este laboratorio, aprenderemos a trabajar con columnas en Pandas. Exploraremos cómo crear nuevas columnas derivadas de las existentes, aplicar operaciones matemáticas y lógicas en columnas, renombrar etiquetas de columnas y realizar operaciones por columnas utilizando el método apply.
Consejos sobre la VM
Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.
Importar Pandas y cargar datos
Primero, importaremos la biblioteca de pandas y cargaremos los datos de calidad del aire desde un archivo CSV.
## Importar la biblioteca de pandas
import pandas as pd
## Cargar los datos de calidad del aire
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
Crear una nueva columna
Crearemos una nueva columna, "london_mg_per_cubic", multiplicando la columna "station_london" por un factor de conversión.
## Crear una nueva columna multiplicando "station_london" por el factor de conversión
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882
Comprobar la relación de valores en dos columnas
A continuación, comprobaremos la relación de los valores en las columnas "station_paris" y "station_antwerp" y guardaremos el resultado en una nueva columna.
## Crear una nueva columna dividiendo "station_paris" entre "station_antwerp"
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]
Cambiar los nombres de las etiquetas de las columnas
Cambiaremos los nombres de las etiquetas de las columnas para que coincidan con los identificadores de las estaciones utilizados por OpenAQ.
## Cambiar los nombres de las etiquetas de las columnas
air_quality_renamed = air_quality.rename(
columns={
"station_antwerp": "BETR801",
"station_paris": "FR04014",
"station_london": "London Westminster",
}
)
Convertir los nombres de las columnas a minúsculas
Finalmente, convertiremos los nombres de las columnas a minúsculas utilizando una función.
## Convertir los nombres de las columnas a minúsculas
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)
Resumen
En este laboratorio, aprendimos cómo crear nuevas columnas derivadas de las existentes, realizar operaciones matemáticas y lógicas en columnas, cambiar los nombres de las etiquetas de las columnas y convertir los nombres de las columnas a minúsculas. Con estas habilidades, podemos manipular y transformar datos en pandas de manera más efectiva.