はじめに
この実験では、Python pandas の DataFrame.idxmin() メソッドを調べ、理解します。このメソッドは、指定された軸に沿った最小値の最初の出現位置のインデックスを取得するために使用されます。このメソッドは null または欠損値を除外します。このメソッドは、指定された軸に沿った最小値のインデックスを含む Series を返します。
VM のヒント
VM の起動が完了したら、左上隅をクリックして Notebook タブに切り替え、Jupyter Notebook にアクセスして練習します。
時々、Jupyter Notebook が読み込み完了するまで数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。
学習中に問題に遭遇した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。私たちは迅速に問題を解決いたします。
DataFrame を作成する
まず、操作対象の DataFrame を作成する必要があります。このステップでは、pandas ライブラリをインポートし、'Marks_1' と 'Marks_2' の 2 つの列を持つ DataFrame を作成します。この DataFrame は 3 行から構成され、各行は教科(カンナダ語、英語、理科)とそれぞれの点数を表しています。
import pandas as pd
## DataFrame を作成する
df = pd.DataFrame({'Marks_1': [85, 90, 45], 'Marks_2': [85, 96, 100]}, index=['Kannada', 'English', 'Science'])
## DataFrame を表示する
print("---- DataFrame は以下の通り ----")
print(df)
行軸における最小値のインデックスを見つける
このステップでは、DataFrame.idxmin() メソッドを使用して、行軸における最小値のインデックスを見つけます。このメソッドを DataFrame に適用し、結果を表示します。
## 行軸における最小値のインデックスを見つける
print("---- 行軸における最小値のインデックス ----")
print(df.idxmin())
列軸における最小値のインデックスを見つける
このステップでは、DataFrame.idxmin() メソッドを使用して、列軸における最小値のインデックスを見つけます。axis="columns" を指定して DataFrame にこのメソッドを適用し、結果を表示します。
## 列軸における最小値のインデックスを見つける
print("---- 列軸における最小値のインデックス ----")
print(df.idxmin(axis="columns"))
欠損値を処理する
このステップでは、欠損値を含む DataFrame を作成し、DataFrame.idxmin() メソッドを適用します。このメソッドが欠損値をどのように処理するか見てみます。結果の Series を表示します。
## 欠損値を含む DataFrame を作成する
df = pd.DataFrame({'Marks_1': [85, None, 45], 'Marks_2': [None, 46, None]}, index=['Kannada', 'English', 'Science'])
## DataFrame を表示する
print("---- DataFrame は以下の通り ----")
print(df)
## 列軸における最小値のインデックスを見つける
print("---- 列軸における最小値のインデックス ----")
print(df.idxmin(axis="columns"))
まとめ
この実験では、Python の pandas の DataFrame.idxmin() メソッドを調べました。指定された軸に沿った最小値の最初の出現位置のインデックスを見つける方法を学びました。また、このメソッドが欠損値をどのように処理するかも見ました。DataFrame.idxmin() メソッドは、DataFrame 内の最小値のインデックスを取得するための便利なツールです。