掌握 Pandas DataFrame Cummin 方法

介绍

在本实验中，我们将学习如何在 Python 的 pandas 库中使用 cummin() 方法。cummin() 方法用于计算 DataFrame 或 Series 轴上的累积最小值。它返回一个大小相同的 DataFrame 或 Series，其中包含累积最小值。

虚拟机启动完成后，点击左上角切换到 Notebook 选项卡以访问 Jupyter Notebook 进行练习。

有时，你可能需要等待几秒钟，直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制，操作验证无法自动化。

如果你在学习过程中遇到问题，可以随时向 Labby 寻求帮助。实验结束后请提供反馈，我们将及时为你解决问题。

首先，我们需要导入 pandas 库以使用 cummin() 方法。可以通过在程序开头添加以下代码行来实现：

import pandas as pd

接下来，让我们创建一个用于示例的 DataFrame。可以通过使用 pd.DataFrame() 构造函数并传递一个值字典来实现。以下是一个示例：

df = pd.DataFrame({"A": [1, 2, 8, 4], "B": [9, 10, 7, 8], "C": [9, 10, 11, 12], "D": [13, 16, 15, 16]})

这将创建一个包含四列（A、B、C、D）和四行的 DataFrame。

要计算索引轴上的累积最小值，我们可以在 DataFrame 上使用 cummin() 方法。需要将 axis 参数指定为 0 或 'index'。以下是一个示例：

df_cummin = df.cummin(axis=0)

这将计算每列在索引轴上的累积最小值，并将结果存储在 df_cummin DataFrame 中。

要计算列轴上的累积最小值，我们可以在 DataFrame 上使用 cummin() 方法。需要将 axis 参数指定为 1 或 'columns'。以下是一个示例：

df_cummin = df.cummin(axis=1)

这将计算每行在列轴上的累积最小值，并将结果存储在 df_cummin DataFrame 中。

默认情况下，cummin() 方法会排除 NA/空值。如果整行或整列为 NA，结果将为 NA。我们可以通过将 skipna 参数设置为 False 来改变这种行为。以下是一个示例：

df_cummin = df.cummin(skipna=False)

这将计算每列在索引轴上的累积最小值，包括任何空值，并将结果存储在 df_cummin DataFrame 中。

在本实验中，我们学习了如何在 pandas 库中使用 cummin() 方法。我们了解了如何计算 DataFrame 在索引轴或列轴上的累积最小值。此外，我们还学习了在计算过程中如何处理空值。cummin() 方法对于分析数据和发现随时间变化的趋势非常有用。