Pandas DataFrame Cummin 方法

PythonPythonBeginner
立即练习

💡 本教程由 AI 辅助翻译自英文原版。如需查看原文,您可以 切换至英文原版

介绍

在本实验中,我们将学习如何在 Python 的 pandas 库中使用 cummin() 方法。cummin() 方法用于计算 DataFrame 或 Series 轴上的累积最小值。它返回一个大小相同的 DataFrame 或 Series,其中包含累积最小值。

虚拟机提示

虚拟机启动完成后,点击左上角切换到 Notebook 选项卡以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果你在学习过程中遇到问题,可以随时向 Labby 寻求帮助。实验结束后请提供反馈,我们将及时为你解决问题。

导入 pandas 库

首先,我们需要导入 pandas 库以使用 cummin() 方法。可以通过在程序开头添加以下代码行来实现:

import pandas as pd

创建 DataFrame

接下来,让我们创建一个用于示例的 DataFrame。可以通过使用 pd.DataFrame() 构造函数并传递一个值字典来实现。以下是一个示例:

df = pd.DataFrame({"A": [1, 2, 8, 4], "B": [9, 10, 7, 8], "C": [9, 10, 11, 12], "D": [13, 16, 15, 16]})

这将创建一个包含四列(A、B、C、D)和四行的 DataFrame。

计算索引轴上的累积最小值

要计算索引轴上的累积最小值,我们可以在 DataFrame 上使用 cummin() 方法。需要将 axis 参数指定为 0 或 'index'。以下是一个示例:

df_cummin = df.cummin(axis=0)

这将计算每列在索引轴上的累积最小值,并将结果存储在 df_cummin DataFrame 中。

计算列轴上的累积最小值

要计算列轴上的累积最小值,我们可以在 DataFrame 上使用 cummin() 方法。需要将 axis 参数指定为 1 或 'columns'。以下是一个示例:

df_cummin = df.cummin(axis=1)

这将计算每行在列轴上的累积最小值,并将结果存储在 df_cummin DataFrame 中。

处理空值

默认情况下,cummin() 方法会排除 NA/空值。如果整行或整列为 NA,结果将为 NA。我们可以通过将 skipna 参数设置为 False 来改变这种行为。以下是一个示例:

df_cummin = df.cummin(skipna=False)

这将计算每列在索引轴上的累积最小值,包括任何空值,并将结果存储在 df_cummin DataFrame 中。

总结

在本实验中,我们学习了如何在 pandas 库中使用 cummin() 方法。我们了解了如何计算 DataFrame 在索引轴或列轴上的累积最小值。此外,我们还学习了在计算过程中如何处理空值。cummin() 方法对于分析数据和发现随时间变化的趋势非常有用。