Pandas DataFrame Cumsum 方法

Beginner

介绍

Pandas DataFrame 的 cumsum() 方法用于计算 DataFrame 或 Series 轴上元素的累积和。它返回一个大小相同的 DataFrame 或 Series,其中包含累积和的结果。

虚拟机使用提示

虚拟机启动完成后,点击左上角切换到 Notebook 标签页,即可访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果在学习过程中遇到问题,随时向 Labby 提问。实验结束后请提供反馈,我们将及时为你解决问题。

导入所需的库

为了使用 cumsum() 方法,我们需要导入 pandas 库。

import pandas as pd

创建一个 DataFrame

接下来,我们需要使用要计算累积和的数据创建一个 DataFrame。例如:

df = pd.DataFrame({"A": [1, 2, 3, 4], "B": [5, 6, 7, 8]})

计算索引轴上的累积和

要计算索引轴上的累积和,我们可以在 DataFrame 上使用 cumsum() 方法。默认情况下,cumsum() 方法按列计算累积和,因此我们需要将轴指定为 0。

result = df.cumsum(axis=0)

计算列轴上的累积和

要计算列轴上的累积和,我们可以再次在 DataFrame 上使用 cumsum() 方法,但这次我们将轴指定为 1。

result = df.cumsum(axis=1)

处理 DataFrame 中的空值

如果 DataFrame 中包含空值,默认情况下 cumsum() 方法会跳过这些值。然而,我们可以通过指定 skipna=False 来改变这一行为,将空值包含在累积和的计算中。

result = df.cumsum(axis=0, skipna=False)

总结

Pandas 中的 cumsum() 方法允许我们计算 DataFrame 或 Series 轴上累积和。它可以用于在索引轴和列轴上执行累积和计算。该方法还提供了在计算中包含或排除空值的选项。