介绍
在本实验中,我们将学习如何在 pandas 库中使用 cummax() 方法。cummax() 方法用于计算 DataFrame 或 Series 轴上的累积最大值。它返回一个大小相同的 DataFrame 或 Series,其中包含累积最大值。
虚拟机提示
虚拟机启动完成后,点击左上角切换到 Notebook 选项卡以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。
如果你在学习过程中遇到问题,请随时向 Labby 寻求帮助。实验结束后提供反馈,我们将及时为你解决问题。
导入 pandas 库
要使用 cummax() 方法,我们首先需要导入 pandas 库。可以通过运行以下代码来实现:
import pandas as pd
创建 DataFrame
接下来,我们需要创建一个 DataFrame,以便在其上应用 cummax() 方法。我们可以使用 pd.DataFrame() 函数并传入一个字典来创建 DataFrame。字典中的每个键代表一个列名,对应的值是一个包含列数据的列表。
df = pd.DataFrame({"A":[1, 2, 8, 4], "B":[9, 10, 7, 8], "C":[9, 10, 11, 12], "D":[13, 16, 15, 16]})
应用 cummax() 方法
现在,我们可以将 cummax() 方法应用到我们的 DataFrame 上。cummax() 方法接受三个可选参数:axis、skipna 以及额外的 args/kwargs。
axis 参数用于指定计算累积最大值的轴。默认情况下,它设置为 0 或 'index',这意味着累积最大值将沿着索引轴计算。如果设置为 1 或 'columns',则累积最大值将沿着列轴计算。
skipna 参数是一个布尔值,用于确定是否应从计算中排除 NA/null 值。如果设置为 True,则排除 NA/null 值;如果设置为 False,则包含 NA/null 值。
要应用 cummax() 方法,可以使用以下代码:
df_cummax = df.cummax(axis=0, skipna=True)
打印结果
最后,我们可以打印 cummax() 方法的结果,查看累积最大值。
print(df_cummax)
总结
在本实验中,我们学习了如何使用 pandas 库中的 cummax() 方法来计算 DataFrame 或 Series 轴上的累积最大值。我们了解了如何导入 pandas 库、创建 DataFrame、使用可选参数应用 cummax() 方法,以及打印结果。cummax() 方法对于分析趋势和查找数据集中随时间变化的最高值非常有用。它是数据分析和决策过程中的一个宝贵工具。