简介
在本实验中,我们将学习如何在 Pandas 中处理列。我们将探索如何从现有列创建新列、对列应用数学和逻辑运算、重命名列标签,以及使用 apply 方法执行按列操作。
虚拟机提示
虚拟机启动完成后,点击左上角切换到 笔记本 标签页,以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。
如果你在学习过程中遇到问题,请随时向 Labby 提问。课程结束后提供反馈,我们将立即为你解决问题。
这是一个实验(Guided Lab),提供逐步指导来帮助你学习和实践。请仔细按照说明完成每个步骤,获得实际操作经验。根据历史数据,这是一个 初级 级别的实验,完成率为 98%。获得了学习者 100% 的好评率。
导入 Pandas 并加载数据
首先,我们将导入 pandas 库,并从 CSV 文件中加载空气质量数据。
## 导入 pandas 库
import pandas as pd
## 加载空气质量数据
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
创建新列
我们将通过把“station_london”列乘以一个转换因子来创建一个新列“london_mg_per_cubic”。
## 通过将“station_london”乘以转换因子来创建新列
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882
检查两列值的比率
接下来,我们将检查“station_paris”和“station_antwerp”列中值的比率,并将结果保存在一个新列中。
## 通过用“station_paris”除以“station_antwerp”来创建新列
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]
重命名列标签
我们将重命名列标签,使其与 OpenAQ 使用的站点标识符相匹配。
## 重命名列标签
air_quality_renamed = air_quality.rename(
columns={
"station_antwerp": "BETR801",
"station_paris": "FR04014",
"station_london": "London Westminster",
}
)
将列标签转换为小写
最后,我们将使用一个函数把列标签转换为小写。
## 将列标签转换为小写
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)
总结
在这个实验中,我们学习了如何从现有列创建新列、对列执行数学和逻辑运算、重命名列标签以及将列标签转换为小写。有了这些技能,我们可以更有效地在 pandas 中操作和转换数据。