可视化变量关系

Beginner

This tutorial is from open-source community. Access the source code

简介

在本实验中,我们将学习如何使用 Python 的 Matplotlib 库创建一个简单的散点图。散点图是一种将两个变量的值显示为点的集合的图表类型。每个点代表两个变量的值,点的位置表示这两个变量的值。散点图对于识别变量之间的关系和识别异常值很有用。

虚拟机使用提示

虚拟机启动完成后,点击左上角切换到“笔记本”标签,以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果你在学习过程中遇到问题,随时向 Labby 提问。课程结束后提供反馈,我们会及时为你解决问题。

导入必要的库

在这一步中,我们将导入创建散点图所需的库。我们将使用 Matplotlib 库来创建图表,并使用 NumPy 库来生成随机数据。

import matplotlib.pyplot as plt
import numpy as np

生成随机数据

在这一步中,我们将为散点图生成随机数据。我们将使用 NumPy 库为每个变量生成 50 个数据点。

np.random.seed(19680801)

N = 50
x = np.random.rand(N)
y = np.random.rand(N)

定义点的大小和颜色

在这一步中,我们将定义散点图中点的大小和颜色。我们将使用 NumPy 库为点的大小和颜色生成随机值。

colors = np.random.rand(N)
area = (30 * np.random.rand(N))**2

创建散点图

在这一步中,我们将使用 Matplotlib 库创建散点图。我们将使用 scatter 函数来创建图表,并指定点的大小和颜色。

plt.scatter(x, y, s=area, c=colors, alpha=0.5)
plt.show()

总结

在本次实验中,我们学习了如何使用 Python 的 Matplotlib 库创建一个简单的散点图。我们使用 NumPy 库为图表生成随机数据,定义点的大小和颜色,并使用 Matplotlib 库中的 scatter 函数创建图表。散点图对于识别变量之间的关系以及识别异常值很有用。