Pandas 中的窗口操作

Beginner

This tutorial is from open-source community. Access the source code

简介

在本实验中,我们将探索 pandas 中的窗口操作,包括滚动窗口、扩展窗口和指数加权窗口。窗口操作对于在值的滑动分区上执行聚合非常有用。

虚拟机提示

虚拟机启动完成后,点击左上角切换到“笔记本”标签,以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作的验证无法自动化。

如果你在学习过程中遇到问题,请随时向 Labby 提问。课程结束后提供反馈,我们将立即为你解决问题。

创建一个 Pandas 序列

我们创建一个包含从 0 到 4 的一系列值的 Pandas 序列。

import pandas as pd

## 创建一个包含从 0 到 4 的一系列值的 Pandas 序列
s = pd.Series(range(5))

执行滚动窗口操作

执行窗口大小为 2 的滚动窗口操作,然后计算每个窗口的总和。

## 执行窗口大小为 2 的滚动窗口操作并计算每个窗口的总和
s.rolling(window=2).sum()

执行扩展窗口操作

执行扩展窗口操作,然后计算每个窗口的总和。

## 执行扩展窗口操作并计算每个窗口的总和
s.expanding(min_periods=1).sum()

执行指数加权窗口操作

执行指数加权窗口操作,然后计算每个窗口的均值。

## 执行指数加权窗口操作并计算每个窗口的均值
s.ewm(span=3).mean()

总结

在本实验中,我们使用 pandas 执行了各种窗口操作,包括滚动窗口、扩展窗口和指数加权窗口。这些操作对于在值的滑动分区上执行聚合非常有用。