掌握 Pandas DataFrame 的 MAD 方法

介绍

在本实验中，你将学习如何使用 Pandas 库中的 mad() 方法来计算 DataFrame 的平均绝对偏差（Mean Absolute Deviation）。平均绝对偏差是衡量数据集中变异程度的一种指标，定义为每个数据值与均值之间的平均距离。

虚拟机使用提示

虚拟机启动完成后，点击左上角切换到 Notebook 标签页，以访问 Jupyter Notebook 进行练习。

有时，你可能需要等待几秒钟，直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制，操作验证无法自动化。

如果你在学习过程中遇到问题，可以随时向 Labby 寻求帮助。请在实验结束后提供反馈，我们将及时为你解决问题。

导入必要的库

首先，将 pandas 库导入为 pd。这将允许你使用 Pandas 的 DataFrame 及其 mad() 方法。

import pandas as pd

创建一个 DataFrame

接下来，创建一个 DataFrame 用于操作。在这个例子中，你将创建一个包含四列（A、B、C 和 D）和三行的 DataFrame。

df = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6], "C": [7, 8, 9], "D": [10, 11, 12]})

计算平均绝对偏差

现在你已经有了一个 DataFrame，可以使用 mad() 方法计算平均绝对偏差。要计算沿索引轴（index axis）的平均绝对偏差，请将 axis=0 作为参数传入。

mad_index = df.mad(axis=0)

要计算沿列轴（column axis）的平均绝对偏差，请将 axis=1 作为参数传入。

mad_columns = df.mad(axis=1)

打印结果

最后，你可以打印平均绝对偏差的值。

print("Mean Absolute Deviation over index axis:")
print(mad_index)

print("Mean Absolute Deviation over column axis:")
print(mad_columns)

总结

在本实验中，你学习了如何使用 Pandas 库中的 mad() 方法来计算 DataFrame 的平均绝对偏差。平均绝对偏差是衡量数据集中变异程度的一种指标，定义为每个数据值与均值之间的平均距离。通过遵循本实验中的步骤，你现在应该能够将 mad() 方法应用于你自己的 DataFrame，并分析数据中的变异情况。

Pandas DataFrame MAD 方法

介绍

虚拟机使用提示

导入必要的库

创建一个 DataFrame

计算平均绝对偏差

打印结果

总结