简介
在本实验中,我们将学习如何使用 Python 中的 Matplotlib 库创建小提琴图。小提琴图用于可视化数据集的分布。这些图与箱线图类似,但小提琴图展示的是数据的完整分布,而不仅仅是汇总统计信息。
我们将使用一个示例数据集来创建小提琴图,并修改各种参数以观察图中的变化。
虚拟机使用提示
虚拟机启动完成后,点击左上角切换到“笔记本”标签页,以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。
如果你在学习过程中遇到问题,随时向 Labby 提问。课程结束后提供反馈,我们会及时为你解决问题。
导入必要的库
我们将首先导入创建小提琴图所需的库。
import matplotlib.pyplot as plt
import numpy as np
创建示例数据集
我们将使用 numpy 库创建一个示例数据集。我们将创建六个具有不同标准差的数据集。
## Fixing random state for reproducibility
np.random.seed(19680801)
## fake data
pos = [1, 2, 4, 5, 7, 8]
data = [np.random.normal(0, std, size=100) for std in pos]
创建自定义小提琴图
我们将通过修改各种参数来创建自定义小提琴图。我们将使用不同的参数创建 5 个自定义小提琴图。
fig, axs = plt.subplots(nrows=2, ncols=5, figsize=(10, 6))
## 自定义小提琴图 1
axs[0, 0].violinplot(data, pos, points=20, widths=0.3,
showmeans=True, showextrema=True, showmedians=True)
axs[0, 0].set_title('Custom violinplot 1', fontsize=fs)
## 自定义小提琴图 2
axs[0, 1].violinplot(data, pos, points=40, widths=0.5,
showmeans=True, showextrema=True, showmedians=True,
bw_method='silverman')
axs[0, 1].set_title('Custom violinplot 2', fontsize=fs)
## 自定义小提琴图 3
axs[0, 2].violinplot(data, pos, points=60, widths=0.7, showmeans=True,
showextrema=True, showmedians=True, bw_method=0.5)
axs[0, 2].set_title('Custom violinplot 3', fontsize=fs)
## 自定义小提琴图 4
axs[0, 3].violinplot(data, pos, points=60, widths=0.7, showmeans=True,
showextrema=True, showmedians=True, bw_method=0.5,
quantiles=[[0.1], [], [], [0.175, 0.954], [0.75], [0.25]])
axs[0, 3].set_title('Custom violinplot 4', fontsize=fs)
## 自定义小提琴图 5
axs[0, 4].violinplot(data[-1:], pos[-1:], points=60, widths=0.7,
showmeans=True, showextrema=True, showmedians=True,
quantiles=[0.05, 0.1, 0.8, 0.9], bw_method=0.5)
axs[0, 4].set_title('Custom violinplot 5', fontsize=fs)
创建更多自定义小提琴图
我们将使用不同的参数创建更多自定义小提琴图。
## 自定义小提琴图 6
axs[1, 0].violinplot(data, pos, points=80, vert=False, widths=0.7,
showmeans=True, showextrema=True, showmedians=True)
axs[1, 0].set_title('Custom violinplot 6', fontsize=fs)
## 自定义小提琴图 7
axs[1, 1].violinplot(data, pos, points=100, vert=False, widths=0.9,
showmeans=True, showextrema=True, showmedians=True,
bw_method='silverman')
axs[1, 1].set_title('Custom violinplot 7', fontsize=fs)
## 自定义小提琴图 8
axs[1, 2].violinplot(data, pos, points=200, vert=False, widths=1.1,
showmeans=True, showextrema=True, showmedians=True,
bw_method=0.5)
axs[1, 2].set_title('Custom violinplot 8', fontsize=fs)
## 自定义小提琴图 9
axs[1, 3].violinplot(data, pos, points=200, vert=False, widths=1.1,
showmeans=True, showextrema=True, showmedians=True,
quantiles=[[0.1], [], [], [0.175, 0.954], [0.75], [0.25]],
bw_method=0.5)
axs[1, 3].set_title('Custom violinplot 9', fontsize=fs)
## 自定义小提琴图 10
axs[1, 4].violinplot(data[-1:], pos[-1:], points=200, vert=False, widths=1.1,
showmeans=True, showextrema=True, showmedians=True,
quantiles=[0.05, 0.1, 0.8, 0.9], bw_method=0.5)
axs[1, 4].set_title('Custom violinplot 10', fontsize=fs)
自定义图表外观
我们将通过移除 y 轴标签并为图表添加标题来自定义图表的外观。
for ax in axs.flat:
ax.set_yticklabels([])
fig.suptitle("Violin Plotting Examples")
fig.subplots_adjust(hspace=0.4)
plt.show()
总结
在本实验中,我们学习了如何使用 Python 中的 Matplotlib 库创建小提琴图。我们通过修改各种参数(如点数、核密度估计(KDE)的带宽和分位数)创建了自定义小提琴图。我们还学习了如何通过移除 y 轴标签并为图表添加标题来自定义图表的外观。