はじめに
この実験では、Pandas DataFrame の max() メソッドについて学びます。このメソッドは、DataFrame 内の最大値を見つけるために使用されます。構文、パラメータ、およびこのメソッドの使い方を例を使って探ります。
VM のヒント
VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替え、Jupyter Notebook を使って練習しましょう。
時々、Jupyter Notebook が読み込み終わるまで数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証は自動化できません。
学習中に問題に直面した場合は、Labby にお尋ねください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。
DataFrame を作成する
まず、max() メソッドとその機能を理解するために DataFrame を作成しましょう。次のコードを使用します。
import pandas as pd
df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})
print(df)
このコードは、4 つの列(A、B、C、D)がある DataFrame を作成します。各列には 3 つの値があります。
インデックス軸に沿った最大値を見つける
次に、DataFrame のインデックス軸(行)に沿った最大値を求めましょう。max() メソッドに axis=0 をパラメータとして渡します。以下のコードを参照してください。
max_values = df.max(axis=0)
print(max_values)
このコードは、各列についてインデックス軸に沿った最大値を表示します。
列軸に沿った最大値を見つける
次に、DataFrame の列軸(列)に沿った最大値を求めましょう。max() メソッドに axis=1 をパラメータとして渡します。以下のコードを参照してください。
max_values = df.max(axis=1)
print(max_values)
このコードは、各行について列軸に沿った最大値を表示します。
欠損値を含める
時々、私たちの DataFrame には欠損値が含まれる場合があります。最大値を計算する際に欠損値を含めるには、skipna=False パラメータを使用できます。以下のコードを参照してください。
df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
max_values = df.max(axis=0, skipna=False)
print(max_values)
このコードは、欠損値を含めたインデックス軸に沿った最大値を表示します。
欠損値を除外する
最大値を計算する際に欠損値を除外するには、skipna=True パラメータを使用できます。以下のコードを参照してください。
df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
max_values = df.max(axis=0, skipna=True)
print(max_values)
このコードは、欠損値を除外したインデックス軸に沿った最大値を表示します。
まとめ
この実験では、Pandas DataFrame の max() メソッドについて学びました。インデックス軸と列軸に沿った最大値を、欠損値を含めるか除外するかを問わず求める方法を検討しました。max() メソッドは、DataFrame 内の最高値を見つけるのに役立ち、さまざまなユースケースに適用できます。自分自身のプロジェクトで効果的に適用するために、max() メソッドの構文とパラメータを確認することを忘れないでください。