はじめに
この実験では、Pandas ライブラリのclip()メソッドを使って DataFrame 内の値をトリミングする方法を学びます。clip()メソッドを使うと、上下の閾値を設定して、範囲外の値を閾値に割り当てることができます。これは、DataFrame 内の値の範囲を制限したい場合に便利です。
VM のヒント
VM の起動が完了したら、左上隅をクリックしてノートブックタブに切り替え、Jupyter Notebook を使って練習しましょう。
時々、Jupyter Notebook が読み込み終わるまで数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。
学習中に問題がある場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。
pandas ライブラリをインポートして DataFrame を作成する
まず、pandas ライブラリをインポートして DataFrame を作成しましょう。
import pandas as pd
## サンプルデータを含む辞書を作成する
data = {'col_1': [9, -3, 0, -1, 12], 'col_2': [-2, -7, -6, 8, -5]}
## 辞書から DataFrame を作成する
df = pd.DataFrame(data)
元の DataFrame を表示する
clip()メソッドを適用する前の値を見るために、元の DataFrame を表示しましょう。
print("------DataFrame--------")
print(df)
clip() メソッドを上限閾値付きで使用する
次に、上限閾値で値をトリミングするためにclip()メソッドを使用しましょう。これは、指定された上限閾値を超える値はすべて閾値自体に設定されることを意味します。
## 上限閾値 6 で値をトリミングする
clipped_df = df.clip(upper=6)
print("------DataFrame をクリッピングした後--------")
print(clipped_df)
clip() メソッドを下限閾値付きで使用する
次に、下限閾値で値をトリミングするためにclip()メソッドを使用しましょう。これは、指定された下限閾値未満の値はすべて閾値自体に設定されることを意味します。
## 下限閾値 -1 で値をトリミングする
clipped_df = df.clip(lower=-1)
print("------DataFrame をクリッピングした後--------")
print(clipped_df)
上限と下限の両方の閾値を持つ clip() メソッドを使用する
最後に、上限と下限の両方の閾値で値をトリミングするためにclip()メソッドを使用しましょう。これは、上限閾値を超える値は上限閾値に設定され、下限閾値未満の値は下限閾値に設定されることを意味します。
## 下限閾値 -1 と上限閾値 6 で値をトリミングする
clipped_df = df.clip(-1, 6)
print("------DataFrame をクリッピングした後--------")
print(clipped_df)
まとめ
この実験では、Pandas ライブラリのclip()メソッドを使って DataFrame 内の値をトリミングする方法を学びました。DataFrame 内の値の範囲を制限するために、上限と下限の閾値を設定する方法を見ました。これは、データクリーニングと処理のタスクで役立つ場合があります。