Pandas DataFrame の拡張メソッド

Beginner

はじめに

この実験では、Pandas DataFrame のexpanding()メソッドを調べます。このメソッドは Pandas のウィンドウ関数の一部で、拡張変換に使用されます。指定された操作に対してウィンドウオブジェクトを返します。

VM のヒント

VM の起動が完了したら、左上隅をクリックしてノートブックタブに切り替え、Jupyter Notebook を使って練習しましょう。

時々、Jupyter Notebook が読み込み終わるまで数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。

学習中に問題がある場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。

必要なライブラリをインポートする

まず、必要なライブラリ、つまり Pandas をインポートする必要があります。Pandas ライブラリを参照するためにpdエイリアスを使用します。

import pandas as pd

DataFrame を作成する

次に、操作するための DataFrame を作成します。この例では、列'A'と'B'を持つ DataFrame を使用します。

df = pd.DataFrame({"A": [1, 2, 3], "B": [1, 1, 1]})

累積和を計算するために拡張メソッドを適用する

次に、expanding()メソッドを適用して、DataFrame 全体の累積和を計算しましょう。

df_expanding_sum = df.expanding().sum()
print(df_expanding_sum)

結果を新しい列に格納する

拡張計算の結果を DataFrame の新しい列に格納することもできます。この例では、列'A'の累積和を新しい列'result'に格納します。

df['result'] = df['A'].expanding().sum()
print(df)

行軸に沿って累積和を計算する

さらに、DataFrame 全体の行軸に沿った累積和を計算することができます。

df_expanding_sum_row = df.T.expanding().sum().T
print(df_expanding_sum_row)

必要な最小観測数を指定する

拡張計算に値を持たせるために必要な最小観測数も指定できます。これはmin_periodsパラメータを使用して行うことができます。この例では、min_periods=2と設定します。

df_expanding_sum_min = df.expanding(min_periods=2).sum()
print(df_expanding_sum_min)

まとめ

この実験では、Pandas DataFrame のexpanding()メソッドについて学びました。このメソッドを適用して、DataFrame の累積和を計算し、結果を新しい列に格納し、行軸に沿った累積和を計算し、拡張計算に必要な最小観測数を指定しました。expanding()メソッドは、時間経過に伴うデータの累積和を探索する際に便利です。