可视化变量关系

PythonPythonBeginner
立即练习

This tutorial is from open-source community. Access the source code

💡 本教程由 AI 辅助翻译自英文原版。如需查看原文,您可以 切换至英文原版

简介

在本实验中,我们将学习如何使用 Python 的 Matplotlib 库创建一个简单的散点图。散点图是一种将两个变量的值显示为点的集合的图表类型。每个点代表两个变量的值,点的位置表示这两个变量的值。散点图对于识别变量之间的关系和识别异常值很有用。

虚拟机使用提示

虚拟机启动完成后,点击左上角切换到“笔记本”标签,以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果你在学习过程中遇到问题,随时向 Labby 提问。课程结束后提供反馈,我们会及时为你解决问题。


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL matplotlib(("Matplotlib")) -.-> matplotlib/PlottingDataGroup(["Plotting Data"]) python(("Python")) -.-> python/DataStructuresGroup(["Data Structures"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) matplotlib(("Matplotlib")) -.-> matplotlib/BasicConceptsGroup(["Basic Concepts"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) matplotlib/BasicConceptsGroup -.-> matplotlib/importing_matplotlib("Importing Matplotlib") matplotlib/BasicConceptsGroup -.-> matplotlib/figures_axes("Understanding Figures and Axes") matplotlib/PlottingDataGroup -.-> matplotlib/scatter_plots("Scatter Plots") python/DataStructuresGroup -.-> python/tuples("Tuples") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") python/ModulesandPackagesGroup -.-> python/standard_libraries("Common Standard Libraries") python/PythonStandardLibraryGroup -.-> python/math_random("Math and Random") python/DataScienceandMachineLearningGroup -.-> python/numerical_computing("Numerical Computing") python/DataScienceandMachineLearningGroup -.-> python/data_visualization("Data Visualization") subgraph Lab Skills matplotlib/importing_matplotlib -.-> lab-48918{{"可视化变量关系"}} matplotlib/figures_axes -.-> lab-48918{{"可视化变量关系"}} matplotlib/scatter_plots -.-> lab-48918{{"可视化变量关系"}} python/tuples -.-> lab-48918{{"可视化变量关系"}} python/importing_modules -.-> lab-48918{{"可视化变量关系"}} python/standard_libraries -.-> lab-48918{{"可视化变量关系"}} python/math_random -.-> lab-48918{{"可视化变量关系"}} python/numerical_computing -.-> lab-48918{{"可视化变量关系"}} python/data_visualization -.-> lab-48918{{"可视化变量关系"}} end

导入必要的库

在这一步中,我们将导入创建散点图所需的库。我们将使用 Matplotlib 库来创建图表,并使用 NumPy 库来生成随机数据。

import matplotlib.pyplot as plt
import numpy as np

生成随机数据

在这一步中,我们将为散点图生成随机数据。我们将使用 NumPy 库为每个变量生成 50 个数据点。

np.random.seed(19680801)

N = 50
x = np.random.rand(N)
y = np.random.rand(N)

定义点的大小和颜色

在这一步中,我们将定义散点图中点的大小和颜色。我们将使用 NumPy 库为点的大小和颜色生成随机值。

colors = np.random.rand(N)
area = (30 * np.random.rand(N))**2

创建散点图

在这一步中,我们将使用 Matplotlib 库创建散点图。我们将使用 scatter 函数来创建图表,并指定点的大小和颜色。

plt.scatter(x, y, s=area, c=colors, alpha=0.5)
plt.show()

总结

在本次实验中,我们学习了如何使用 Python 的 Matplotlib 库创建一个简单的散点图。我们使用 NumPy 库为图表生成随机数据,定义点的大小和颜色,并使用 Matplotlib 库中的 scatter 函数创建图表。散点图对于识别变量之间的关系以及识别异常值很有用。