在Pandas中处理列

PythonPythonBeginner
立即练习

This tutorial is from open-source community. Access the source code

💡 本教程由 AI 辅助翻译自英文原版。如需查看原文,您可以 切换至英文原版

简介

在本实验中,我们将学习如何在 Pandas 中处理列。我们将探索如何从现有列创建新列、对列应用数学和逻辑运算、重命名列标签,以及使用 apply 方法执行按列操作。

虚拟机提示

虚拟机启动完成后,点击左上角切换到 笔记本 标签页,以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果你在学习过程中遇到问题,请随时向 Labby 提问。课程结束后提供反馈,我们将立即为你解决问题。

导入 Pandas 并加载数据

首先,我们将导入 pandas 库,并从 CSV 文件中加载空气质量数据。

## 导入 pandas 库
import pandas as pd

## 加载空气质量数据
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)

创建新列

我们将通过把“station_london”列乘以一个转换因子来创建一个新列“london_mg_per_cubic”。

## 通过将“station_london”乘以转换因子来创建新列
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882

检查两列值的比率

接下来,我们将检查“station_paris”和“station_antwerp”列中值的比率,并将结果保存在一个新列中。

## 通过用“station_paris”除以“station_antwerp”来创建新列
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]

重命名列标签

我们将重命名列标签,使其与 OpenAQ 使用的站点标识符相匹配。

## 重命名列标签
air_quality_renamed = air_quality.rename(
    columns={
        "station_antwerp": "BETR801",
        "station_paris": "FR04014",
        "station_london": "London Westminster",
    }
)

将列标签转换为小写

最后,我们将使用一个函数把列标签转换为小写。

## 将列标签转换为小写
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)

总结

在这个实验中,我们学习了如何从现有列创建新列、对列执行数学和逻辑运算、重命名列标签以及将列标签转换为小写。有了这些技能,我们可以更有效地在pandas中操作和转换数据。