使用Pandas进行空气质量分析绘图

PythonPythonBeginner
立即练习

This tutorial is from open-source community. Access the source code

💡 本教程由 AI 辅助翻译自英文原版。如需查看原文,您可以 切换至英文原版

简介

在本实验中,我们将学习如何使用Pandas创建图表,Pandas是Python中一个强大的数据处理库。我们将使用真实的空气质量数据进行实际演示。在本实验结束时,你应该能够使用Pandas创建折线图、散点图、箱线图,并自定义你的图表。

虚拟机提示

虚拟机启动完成后,点击左上角切换到“笔记本”标签,以访问Jupyter Notebook进行练习。

有时,你可能需要等待几秒钟让Jupyter Notebook完成加载。由于Jupyter Notebook的限制,操作验证无法自动化。

如果你在学习过程中遇到问题,请随时向Labby提问。课程结束后提供反馈,我们将立即为你解决问题。

导入必要的库

首先,我们需要导入必要的库。我们将使用Pandas进行数据处理,使用Matplotlib进行数据可视化。

## 导入必要的库
import pandas as pd
import matplotlib.pyplot as plt

加载数据

本教程我们将使用空气质量数据。数据将从CSV文件加载到Pandas DataFrame中。

## 加载数据
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
air_quality.head()

创建折线图

默认情况下,Pandas会为每列数值数据创建一个折线图。这能让我们快速直观地了解数据概况。

## 创建折线图
air_quality.plot()
plt.show()

为特定列创建图表

要为特定列创建图表,我们可以结合使用选择方法和绘图方法。

## 为特定列创建图表
air_quality["station_paris"].plot()
plt.show()

创建散点图

为了直观地比较在伦敦和巴黎测量的二氧化氮(NO2)值,我们可以创建一个散点图。

## 创建散点图
air_quality.plot.scatter(x="station_london", y="station_paris", alpha=0.5)
plt.show()

创建箱线图

箱线图能让我们很好地了解数据分布情况。我们可以为空气质量数据创建一个箱线图。

## 创建箱线图
air_quality.plot.box()
plt.show()

为每列创建子图

我们可以使用 subplots 参数为每个数据列创建单独的子图。

## 为每列创建子图
axs = air_quality.plot.area(figsize=(12, 4), subplots=True)
plt.show()

自定义并保存图表

我们可以使用Matplotlib的定制选项进一步自定义图表。我们还可以将图表保存到文件中。

## 自定义并保存图表
fig, axs = plt.subplots(figsize=(12, 4))
air_quality.plot.area(ax=axs)
axs.set_ylabel("NO$_2$ concentration")
fig.savefig("no2_concentrations.png")
plt.show()

总结

在本实验中,我们学习了如何使用Pandas创建各种类型的图表。我们还学习了如何自定义和保存这些图表。这些知识对于数据分析和可视化任务将非常有用。