Pandas DataFrame の cummax メソッドをマスターする

はじめに

この実験では、pandas ライブラリの cummax() メソッドの使い方を学びます。cummax() メソッドは、DataFrame または Series の軸に沿って累積最大値を計算するために使用されます。同じサイズの DataFrame または Series を返し、そこには累積最大値が含まれています。

VM のヒント

VM の起動が完了したら、左上隅をクリックして Notebook タブに切り替え、Jupyter Notebook にアクセスして練習しましょう。

時々、Jupyter Notebook が読み込み終了するまで数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証は自動化できません。

学習中に問題に遭遇した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。

pandas ライブラリをインポートする

cummax() メソッドを使用するには、まず pandas ライブラリをインポートする必要があります。これは、次のコードを実行することで行えます。

import pandas as pd

DataFrame を作成する

次に、cummax() メソッドを適用できる DataFrame を作成する必要があります。pd.DataFrame() 関数を使用して辞書を渡すことで DataFrame を作成できます。辞書の各キーは列名を表し、対応する値は列データを含むリストです。

df = pd.DataFrame({"A":[1, 2, 8, 4], "B":[9, 10, 7, 8], "C":[9, 10, 11, 12], "D":[13, 16, 15, 16]})

cummax() メソッドを適用する

これで、DataFrame に cummax() メソッドを適用できます。cummax() メソッドには、3 つのオプションパラメータがあります。axis、skipna、および追加の args/kwargs です。

axis パラメータは、累積最大値を計算する軸を指定するために使用されます。既定では、0 または 'index' に設定されており、これは累積最大値がインデックス軸に沿って計算されることを意味します。1 または 'columns' に設定すると、列軸に沿って累積最大値が計算されます。

skipna パラメータは、計算から NA/NULL 値を除外するかどうかを決定するブール値です。True に設定すると、NA/NULL 値が除外されます。False に設定すると、NA/NULL 値が含まれます。

cummax() メソッドを適用するには、次のコードを使用できます。

df_cummax = df.cummax(axis=0, skipna=True)

結果を表示する

最後に、cummax() メソッドの結果を表示して、累積最大値を確認できます。

print(df_cummax)

まとめ

この実験では、pandas ライブラリの cummax() メソッドを使用して、DataFrame または Series の軸に沿った累積最大値を計算する方法を学びました。pandas ライブラリをインポートする方法、DataFrame を作成する方法、オプションパラメータを使用して cummax() メソッドを適用する方法、および結果を表示する方法を見ました。cummax() メソッドは、トレンドを分析し、データセット内の最高値を時間の経過とともに見つけるのに役立ちます。これは、データ分析と意思決定プロセスにおいて貴重なツールになる可能性があります。