Trabajar con columnas en Pandas

PythonPythonBeginner
Practicar Ahora

This tutorial is from open-source community. Access the source code

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, aprenderemos a trabajar con columnas en Pandas. Exploraremos cómo crear nuevas columnas derivadas de las existentes, aplicar operaciones matemáticas y lógicas en columnas, renombrar etiquetas de columnas y realizar operaciones por columnas utilizando el método apply.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Importar Pandas y cargar datos

Primero, importaremos la biblioteca de pandas y cargaremos los datos de calidad del aire desde un archivo CSV.

## Importar la biblioteca de pandas
import pandas as pd

## Cargar los datos de calidad del aire
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)

Crear una nueva columna

Crearemos una nueva columna, "london_mg_per_cubic", multiplicando la columna "station_london" por un factor de conversión.

## Crear una nueva columna multiplicando "station_london" por el factor de conversión
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882

Comprobar la relación de valores en dos columnas

A continuación, comprobaremos la relación de los valores en las columnas "station_paris" y "station_antwerp" y guardaremos el resultado en una nueva columna.

## Crear una nueva columna dividiendo "station_paris" entre "station_antwerp"
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]

Cambiar los nombres de las etiquetas de las columnas

Cambiaremos los nombres de las etiquetas de las columnas para que coincidan con los identificadores de las estaciones utilizados por OpenAQ.

## Cambiar los nombres de las etiquetas de las columnas
air_quality_renamed = air_quality.rename(
    columns={
        "station_antwerp": "BETR801",
        "station_paris": "FR04014",
        "station_london": "London Westminster",
    }
)

Convertir los nombres de las columnas a minúsculas

Finalmente, convertiremos los nombres de las columnas a minúsculas utilizando una función.

## Convertir los nombres de las columnas a minúsculas
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)

Resumen

En este laboratorio, aprendimos cómo crear nuevas columnas derivadas de las existentes, realizar operaciones matemáticas y lógicas en columnas, cambiar los nombres de las etiquetas de las columnas y convertir los nombres de las columnas a minúsculas. Con estas habilidades, podemos manipular y transformar datos en pandas de manera más efectiva.