Pandas DataFrame の pct_change メソッド

Beginner

はじめに

Pandas の DataFrame にある pct_change() メソッドは、現在の要素と前の要素の間のパーセント変化を DataFrame 内で計算します。これは、データ分析や、月ごとまたは年ごとの売上の差分計算に役立ちます。

VM のヒント

VM の起動が完了したら、左上隅をクリックして Notebook タブに切り替え、Jupyter Notebook を開いて練習を行ってください。

時々、Jupyter Notebook の読み込みが完了するまで数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。

学習中に問題が発生した場合は、いつでも Labby に質問してください。セッション終了後にフィードバックを提供していただければ、迅速に問題を解決します。

Pandas DataFrame でパーセント変化を計算する

Pandas の DataFrame でパーセント変化を計算するには、以下の手順に従ってください。

  1. pandas ライブラリをインポートします。
import pandas as pd
  1. 時系列インデックスと必要なデータを持つ DataFrame を作成します。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. 元の DataFrame を表示します。
print("----------The dataset is----------")
print(df)
  1. pct_change() メソッドを使用して、DataFrame のパーセント変化を計算します。
print("-------percentage change in the dataset-------")
print(df.pct_change())

列軸に沿ってパーセント変化を計算する

列軸に沿ったパーセント変化を計算するには、手順 1 のコードを以下のように変更します。

  1. pandas ライブラリをインポートします。
import pandas as pd
  1. 時系列インデックスと必要なデータを持つ DataFrame を作成します。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. 元の DataFrame を表示します。
print("----------The dataset is----------")
print(df)
  1. axis=1 を指定して pct_change() メソッドを使用し、列軸に沿ったパーセント変化を計算します。
print("-------percentage change in the dataset-------")
print(df.pct_change(axis=1))

指定された期間でパーセント変化を計算する

指定された期間でパーセント変化を計算するには、手順 1 のコードを以下のように変更します。

  1. pandas ライブラリをインポートします。
import pandas as pd
  1. 時系列インデックスと必要なデータを持つ DataFrame を作成します。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. 元の DataFrame を表示します。
print("----------The dataset is----------")
print(df)
  1. periods=2 を指定して pct_change() メソッドを使用し、指定された期間でパーセント変化を計算します。
print("-------percentage change in the dataset-------")
print(df.pct_change(periods=2))

計算前に欠損値を処理する

パーセント変化を計算する前に欠損値を処理するには、手順 1 のコードを以下のように変更します。

  1. pandas ライブラリをインポートします。
import pandas as pd
  1. 時系列インデックスと必要なデータを持つ DataFrame を作成します。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. 元の DataFrame を表示します。
print("----------The dataset is----------")
print(df)
  1. fill_method='ffill' を指定して pct_change() メソッドを使用し、計算前に欠損値を処理します。
print("-------percentage change in the dataset-------")
print(df.pct_change(fill_method='ffill'))

まとめ

Pandas の DataFrame にある pct_change() メソッドは、現在の要素と前の要素の間のパーセント変化を計算します。このメソッドはデータの分析や差分の計算に使用でき、欠損値の処理や計算期間の指定を行うためのパラメータがあります。このチュートリアルの手順に従うことで、データ分析タスクで pct_change() メソッドを効果的に使用することができます。