Pandas DataFrame Pct_change 方法

Beginner

介绍

Pandas DataFrame 中的 pct_change() 方法用于计算 DataFrame 中当前元素与前一个元素之间的百分比变化。它在分析数据和计算销售额、月度或年度差异时非常有用。

虚拟机使用提示

虚拟机启动完成后,点击左上角切换到 Notebook 标签页,以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果在学习过程中遇到问题,随时向 Labby 提问。课程结束后请提供反馈,我们将及时为你解决问题。

计算 Pandas DataFrame 中的百分比变化

要计算 Pandas DataFrame 中的百分比变化,请按照以下步骤操作:

  1. 导入 pandas 库。
import pandas as pd
  1. 创建一个带有时间序列索引和所需数据的 DataFrame。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. 打印原始 DataFrame。
print("----------数据集为----------")
print(df)
  1. 使用 pct_change() 方法计算 DataFrame 中的百分比变化。
print("-------数据集中的百分比变化-------")
print(df.pct_change())

沿列轴计算百分比变化

要沿列轴计算百分比变化,请按以下步骤修改代码:

  1. 导入 pandas 库。
import pandas as pd
  1. 创建一个带有时间序列索引和所需数据的 DataFrame。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. 打印原始 DataFrame。
print("----------数据集为----------")
print(df)
  1. 使用 pct_change() 方法并设置 axis=1 以沿列轴计算百分比变化。
print("-------数据集中的百分比变化-------")
print(df.pct_change(axis=1))

计算指定周期的百分比变化

要计算指定周期的百分比变化,请按以下步骤修改代码:

  1. 导入 pandas 库。
import pandas as pd
  1. 创建一个带有时间序列索引和所需数据的 DataFrame。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. 打印原始 DataFrame。
print("----------数据集为----------")
print(df)
  1. 使用 pct_change() 方法并设置 periods=2 以计算指定周期的百分比变化。
print("-------数据集中的百分比变化-------")
print(df.pct_change(periods=2))

在计算前处理缺失值

要在计算百分比变化前处理缺失值,请按以下步骤修改代码:

  1. 导入 pandas 库。
import pandas as pd
  1. 创建一个带有时间序列索引和所需数据的 DataFrame。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. 打印原始 DataFrame。
print("----------数据集为----------")
print(df)
  1. 使用 pct_change() 方法并设置 fill_method='ffill' 以在计算前处理缺失值。
print("-------数据集中的百分比变化-------")
print(df.pct_change(fill_method='ffill'))

总结

Pandas DataFrame 中的 pct_change() 方法用于计算当前元素与前一个元素之间的百分比变化。它可以用于分析数据并计算差异,同时提供了处理缺失值和指定计算周期的参数。通过遵循本教程中的步骤,你可以在数据分析任务中有效地使用 pct_change() 方法。