Pandas DataFrame Clip 方法

PythonPythonBeginner
立即练习

💡 本教程由 AI 辅助翻译自英文原版。如需查看原文,您可以 切换至英文原版

介绍

在本实验中,我们将学习如何在 Pandas 库中使用 clip() 方法来修剪 DataFrame 中的值。clip() 方法允许我们设置上限和下限,并将超出边界范围的值赋值为边界值。当我们想要限制 DataFrame 中的值范围时,这个方法非常有用。

虚拟机提示

虚拟机启动完成后,点击左上角切换到 Notebook 选项卡,以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果你在学习过程中遇到问题,随时可以向 Labby 提问。实验结束后请提供反馈,我们将及时为你解决问题。

导入 pandas 库并创建 DataFrame

首先,让我们导入 pandas 库并创建一个 DataFrame。

import pandas as pd

## 创建一个包含示例数据的字典
data = {'col_1': [9, -3, 0, -1, 12], 'col_2': [-2, -7, -6, 8, -5]}

## 从字典创建 DataFrame
df = pd.DataFrame(data)

显示原始 DataFrame

让我们显示原始 DataFrame,以查看在应用 clip() 方法之前的值。

print("------DataFrame--------")
print(df)

使用 clip() 方法设置上限阈值

现在,让我们使用 clip() 方法来修剪上限阈值处的值。这意味着任何高于指定上限阈值的值都将被设置为阈值本身。

## 在 6 的上限阈值处修剪值
clipped_df = df.clip(upper=6)

print("------修剪后的 DataFrame--------")
print(clipped_df)

使用 clip() 方法设置下限阈值

接下来,让我们使用 clip() 方法来修剪下限阈值处的值。这意味着任何低于指定下限阈值的值都将被设置为阈值本身。

## 在 -1 的下限阈值处修剪值
clipped_df = df.clip(lower=-1)

print("------修剪后的 DataFrame--------")
print(clipped_df)

使用 clip() 方法同时设置上限和下限阈值

最后,让我们使用 clip() 方法同时修剪上限和下限阈值处的值。这意味着任何高于上限阈值的值将被设置为上限阈值,而任何低于下限阈值的值将被设置为下限阈值。

## 在 -1 的下限阈值和 6 的上限阈值处修剪值
clipped_df = df.clip(-1, 6)

print("------修剪后的 DataFrame--------")
print(clipped_df)

总结

在本实验中,我们学习了如何使用 Pandas 库中的 clip() 方法来修剪 DataFrame 中的值。我们了解了如何设置上限和下限阈值以限制 DataFrame 中的值范围。这在数据清洗和处理任务中非常有用。