掌握 Pandas DataFrame Cummax 方法

介绍

在本实验中，我们将学习如何在 pandas 库中使用 cummax() 方法。cummax() 方法用于计算 DataFrame 或 Series 轴上的累积最大值。它返回一个大小相同的 DataFrame 或 Series，其中包含累积最大值。

虚拟机提示

虚拟机启动完成后，点击左上角切换到 Notebook 选项卡以访问 Jupyter Notebook 进行练习。

有时，你可能需要等待几秒钟，直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制，操作验证无法自动化。

如果你在学习过程中遇到问题，请随时向 Labby 寻求帮助。实验结束后提供反馈，我们将及时为你解决问题。

导入 pandas 库

要使用 cummax() 方法，我们首先需要导入 pandas 库。可以通过运行以下代码来实现：

import pandas as pd

创建 DataFrame

接下来，我们需要创建一个 DataFrame，以便在其上应用 cummax() 方法。我们可以使用 pd.DataFrame() 函数并传入一个字典来创建 DataFrame。字典中的每个键代表一个列名，对应的值是一个包含列数据的列表。

df = pd.DataFrame({"A":[1, 2, 8, 4], "B":[9, 10, 7, 8], "C":[9, 10, 11, 12], "D":[13, 16, 15, 16]})

应用 cummax() 方法

现在，我们可以将 cummax() 方法应用到我们的 DataFrame 上。cummax() 方法接受三个可选参数：axis、skipna 以及额外的 args/kwargs。

axis 参数用于指定计算累积最大值的轴。默认情况下，它设置为 0 或 'index'，这意味着累积最大值将沿着索引轴计算。如果设置为 1 或 'columns'，则累积最大值将沿着列轴计算。

skipna 参数是一个布尔值，用于确定是否应从计算中排除 NA/null 值。如果设置为 True，则排除 NA/null 值；如果设置为 False，则包含 NA/null 值。

要应用 cummax() 方法，可以使用以下代码：

df_cummax = df.cummax(axis=0, skipna=True)

打印结果

最后，我们可以打印 cummax() 方法的结果，查看累积最大值。

print(df_cummax)

总结

在本实验中，我们学习了如何使用 pandas 库中的 cummax() 方法来计算 DataFrame 或 Series 轴上的累积最大值。我们了解了如何导入 pandas 库、创建 DataFrame、使用可选参数应用 cummax() 方法，以及打印结果。cummax() 方法对于分析趋势和查找数据集中随时间变化的最高值非常有用。它是数据分析和决策过程中的一个宝贵工具。