掌握 Pandas DataFrame Cumsum 方法

介绍

Pandas DataFrame 的 cumsum() 方法用于计算 DataFrame 或 Series 轴上元素的累积和。它返回一个大小相同的 DataFrame 或 Series，其中包含累积和的结果。

虚拟机启动完成后，点击左上角切换到 Notebook 标签页，即可访问 Jupyter Notebook 进行练习。

有时，你可能需要等待几秒钟，直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制，操作验证无法自动化。

如果在学习过程中遇到问题，随时向 Labby 提问。实验结束后请提供反馈，我们将及时为你解决问题。

为了使用 cumsum() 方法，我们需要导入 pandas 库。

import pandas as pd

接下来，我们需要使用要计算累积和的数据创建一个 DataFrame。例如：

df = pd.DataFrame({"A": [1, 2, 3, 4], "B": [5, 6, 7, 8]})

要计算索引轴上的累积和，我们可以在 DataFrame 上使用 cumsum() 方法。默认情况下，cumsum() 方法按列计算累积和，因此我们需要将轴指定为 0。

result = df.cumsum(axis=0)

要计算列轴上的累积和，我们可以再次在 DataFrame 上使用 cumsum() 方法，但这次我们将轴指定为 1。

result = df.cumsum(axis=1)

如果 DataFrame 中包含空值，默认情况下 cumsum() 方法会跳过这些值。然而，我们可以通过指定 skipna=False 来改变这一行为，将空值包含在累积和的计算中。

result = df.cumsum(axis=0, skipna=False)

Pandas 中的 cumsum() 方法允许我们计算 DataFrame 或 Series 轴上累积和。它可以用于在索引轴和列轴上执行累积和计算。该方法还提供了在计算中包含或排除空值的选项。