Pandas DataFrame MAD 方法

Beginner

介绍

在本实验中,你将学习如何使用 Pandas 库中的 mad() 方法来计算 DataFrame 的平均绝对偏差(Mean Absolute Deviation)。平均绝对偏差是衡量数据集中变异程度的一种指标,定义为每个数据值与均值之间的平均距离。

虚拟机使用提示

虚拟机启动完成后,点击左上角切换到 Notebook 标签页,以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果你在学习过程中遇到问题,可以随时向 Labby 寻求帮助。请在实验结束后提供反馈,我们将及时为你解决问题。

导入必要的库

首先,将 pandas 库导入为 pd。这将允许你使用 Pandas 的 DataFrame 及其 mad() 方法。

import pandas as pd

创建一个 DataFrame

接下来,创建一个 DataFrame 用于操作。在这个例子中,你将创建一个包含四列(ABCD)和三行的 DataFrame。

df = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6], "C": [7, 8, 9], "D": [10, 11, 12]})

计算平均绝对偏差

现在你已经有了一个 DataFrame,可以使用 mad() 方法计算平均绝对偏差。要计算沿索引轴(index axis)的平均绝对偏差,请将 axis=0 作为参数传入。

mad_index = df.mad(axis=0)

要计算沿列轴(column axis)的平均绝对偏差,请将 axis=1 作为参数传入。

mad_columns = df.mad(axis=1)

打印结果

最后,你可以打印平均绝对偏差的值。

print("Mean Absolute Deviation over index axis:")
print(mad_index)

print("Mean Absolute Deviation over column axis:")
print(mad_columns)

总结

在本实验中,你学习了如何使用 Pandas 库中的 mad() 方法来计算 DataFrame 的平均绝对偏差。平均绝对偏差是衡量数据集中变异程度的一种指标,定义为每个数据值与均值之间的平均距离。通过遵循本实验中的步骤,你现在应该能够将 mad() 方法应用于你自己的 DataFrame,并分析数据中的变异情况。