はじめに
Pandas の DataFrame にある pct_change() メソッドは、現在の要素と前の要素の間のパーセント変化を DataFrame 内で計算します。これは、データ分析や、月ごとまたは年ごとの売上の差分計算に役立ちます。
VM のヒント
VM の起動が完了したら、左上隅をクリックして Notebook タブに切り替え、Jupyter Notebook を開いて練習を行ってください。
時々、Jupyter Notebook の読み込みが完了するまで数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。
学習中に問題が発生した場合は、いつでも Labby に質問してください。セッション終了後にフィードバックを提供していただければ、迅速に問題を解決します。
Pandas DataFrame でパーセント変化を計算する
Pandas の DataFrame でパーセント変化を計算するには、以下の手順に従ってください。
- pandas ライブラリをインポートします。
import pandas as pd
- 時系列インデックスと必要なデータを持つ DataFrame を作成します。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- 元の DataFrame を表示します。
print("----------The dataset is----------")
print(df)
pct_change()メソッドを使用して、DataFrame のパーセント変化を計算します。
print("-------percentage change in the dataset-------")
print(df.pct_change())
列軸に沿ってパーセント変化を計算する
列軸に沿ったパーセント変化を計算するには、手順 1 のコードを以下のように変更します。
- pandas ライブラリをインポートします。
import pandas as pd
- 時系列インデックスと必要なデータを持つ DataFrame を作成します。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- 元の DataFrame を表示します。
print("----------The dataset is----------")
print(df)
axis=1を指定してpct_change()メソッドを使用し、列軸に沿ったパーセント変化を計算します。
print("-------percentage change in the dataset-------")
print(df.pct_change(axis=1))
指定された期間でパーセント変化を計算する
指定された期間でパーセント変化を計算するには、手順 1 のコードを以下のように変更します。
- pandas ライブラリをインポートします。
import pandas as pd
- 時系列インデックスと必要なデータを持つ DataFrame を作成します。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- 元の DataFrame を表示します。
print("----------The dataset is----------")
print(df)
periods=2を指定してpct_change()メソッドを使用し、指定された期間でパーセント変化を計算します。
print("-------percentage change in the dataset-------")
print(df.pct_change(periods=2))
計算前に欠損値を処理する
パーセント変化を計算する前に欠損値を処理するには、手順 1 のコードを以下のように変更します。
- pandas ライブラリをインポートします。
import pandas as pd
- 時系列インデックスと必要なデータを持つ DataFrame を作成します。
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- 元の DataFrame を表示します。
print("----------The dataset is----------")
print(df)
fill_method='ffill'を指定してpct_change()メソッドを使用し、計算前に欠損値を処理します。
print("-------percentage change in the dataset-------")
print(df.pct_change(fill_method='ffill'))
まとめ
Pandas の DataFrame にある pct_change() メソッドは、現在の要素と前の要素の間のパーセント変化を計算します。このメソッドはデータの分析や差分の計算に使用でき、欠損値の処理や計算期間の指定を行うためのパラメータがあります。このチュートリアルの手順に従うことで、データ分析タスクで pct_change() メソッドを効果的に使用することができます。