介绍
Pandas DataFrame 中的 pct_change() 方法用于计算 DataFrame 中当前元素与前一个元素之间的百分比变化。它在分析数据和计算销售额、月度或年度差异时非常有用。
虚拟机使用提示
虚拟机启动完成后,点击左上角切换到 Notebook 标签页,以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。
如果在学习过程中遇到问题,随时向 Labby 提问。课程结束后请提供反馈,我们将及时为你解决问题。
计算 Pandas DataFrame 中的百分比变化
要计算 Pandas DataFrame 中的百分比变化,请按照以下步骤操作:
- 导入 pandas 库。
import pandas as pd
- 创建一个带有时间序列索引和所需数据的 DataFrame。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- 打印原始 DataFrame。
print("----------数据集为----------")
print(df)
- 使用
pct_change()方法计算 DataFrame 中的百分比变化。
print("-------数据集中的百分比变化-------")
print(df.pct_change())
沿列轴计算百分比变化
要沿列轴计算百分比变化,请按以下步骤修改代码:
- 导入 pandas 库。
import pandas as pd
- 创建一个带有时间序列索引和所需数据的 DataFrame。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- 打印原始 DataFrame。
print("----------数据集为----------")
print(df)
- 使用
pct_change()方法并设置axis=1以沿列轴计算百分比变化。
print("-------数据集中的百分比变化-------")
print(df.pct_change(axis=1))
计算指定周期的百分比变化
要计算指定周期的百分比变化,请按以下步骤修改代码:
- 导入 pandas 库。
import pandas as pd
- 创建一个带有时间序列索引和所需数据的 DataFrame。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- 打印原始 DataFrame。
print("----------数据集为----------")
print(df)
- 使用
pct_change()方法并设置periods=2以计算指定周期的百分比变化。
print("-------数据集中的百分比变化-------")
print(df.pct_change(periods=2))
在计算前处理缺失值
要在计算百分比变化前处理缺失值,请按以下步骤修改代码:
- 导入 pandas 库。
import pandas as pd
- 创建一个带有时间序列索引和所需数据的 DataFrame。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- 打印原始 DataFrame。
print("----------数据集为----------")
print(df)
- 使用
pct_change()方法并设置fill_method='ffill'以在计算前处理缺失值。
print("-------数据集中的百分比变化-------")
print(df.pct_change(fill_method='ffill'))
总结
Pandas DataFrame 中的 pct_change() 方法用于计算当前元素与前一个元素之间的百分比变化。它可以用于分析数据并计算差异,同时提供了处理缺失值和指定计算周期的参数。通过遵循本教程中的步骤,你可以在数据分析任务中有效地使用 pct_change() 方法。