はじめに
Pandas DataFrame の cumsum() メソッドは、DataFrame または Series の軸に沿った累積和を計算するために使用されます。同じサイズの DataFrame または Series を返し、そこに累積和が含まれています。
VM のヒント
VM の起動が完了した後、左上隅をクリックして ノートブック タブに切り替え、Jupyter Notebook にアクセスして練習します。
時々、Jupyter Notebook が読み込み完了するまで数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。
学習中に問題に直面した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。そうすれば、迅速に問題を解決いたします。
必要なライブラリをインポートする
cumsum() メソッドを使用するには、pandas ライブラリをインポートする必要があります。
import pandas as pd
DataFrame を作成する
次に、累積和を実行したいデータを使って DataFrame を作成する必要があります。たとえば:
df = pd.DataFrame({"A": [1, 2, 3, 4], "B": [5, 6, 7, 8]})
インデックス軸に沿った累積和を計算する
インデックス軸に沿った累積和を計算するには、DataFrame の cumsum() メソッドを使用できます。既定では、cumsum() メソッドは列方向に合計を計算するため、軸を 0 として指定する必要があります。
result = df.cumsum(axis=0)
列軸に沿った累積和を計算する
列軸に沿った累積和を計算するには、再び DataFrame の cumsum() メソッドを使用できますが、今回は軸を 1 として指定します。
result = df.cumsum(axis=1)
DataFrame 内の null 値の処理
DataFrame に null 値が含まれている場合、既定では cumsum() メソッドはこれらの値をスキップします。ただし、skipna=False を指定することで、この動作を変更して、累積和の計算に null 値を含めることができます。
result = df.cumsum(axis=0, skipna=False)
まとめ
Pandas の cumsum() メソッドを使用すると、DataFrame または Series の軸に沿った累積和を計算できます。これを使用すると、インデックス軸と列軸の両方で累積和の計算を行うことができます。また、このメソッドを使用すると、計算対象から null 値を含めるか除外するオプションも提供されています。