Pandas DataFrame Hist 方法

PandasPandasBeginner
立即练习

💡 本教程由 AI 辅助翻译自英文原版。如需查看原文,您可以 切换至英文原版

介绍

Pandas 库中的 hist() 方法允许我们创建直方图,直方图是数据分布的直观表示。该方法用于 DataFrame 对象,并在 DataFrame 中的每个系列上调用 matplotlib.pyplot.hist() 函数,从而为每列生成一个直方图。

虚拟机提示

虚拟机启动完成后,点击左上角切换到 Notebook 标签页以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果你在学习过程中遇到问题,随时可以询问 Labby。在课程结束后提供反馈,我们将及时为你解决问题。

导入必要的库

要使用 hist() 方法,我们需要导入所需的库,即 pandasmatplotlib.pyplot

import pandas as pd
import matplotlib.pyplot as plt

创建 DataFrame

接下来,我们需要使用 pd.DataFrame() 方法创建一个 DataFrame 对象。我们可以传递一个字典作为参数,其中键表示列名,值表示数据。

data = {'length': [1.5, 0.5, 1.2, 0.9, 3], 'width': [0.7, 0.2, 0.15, 0.2, 1.1]}
df = pd.DataFrame(data)

创建直方图

现在,我们可以在 DataFrame 上使用 hist() 方法为每一列创建直方图。

df.hist()
plt.show()

自定义直方图

我们可以通过向 hist() 方法提供额外的参数来自定义直方图。例如,我们可以指定分箱(bins)的数量、直方图条形的颜色以及直方图的标题。

df.hist(bins=10, color='skyblue')
plt.title('Histogram')
plt.show()

总结

Pandas 中的 hist() 方法允许我们为 DataFrame 中的数据创建直方图。通过使用此方法,我们可以可视化数据的分布,这对于数据分析和探索非常有用。此外,我们可以通过向 hist() 方法提供额外的参数来自定义直方图的外观。总的来说,hist() 方法是 Pandas 中分析和可视化数据的便捷工具。