はじめに
この実験では、Python の Pandas ライブラリのnotna()メソッドの使い方を学びます。notna()メソッドは、DataFrame 内の既存の値を検出するために使用され、要素が NA 値でないかどうかを示すブール値で構成される DataFrame を返します。
VM のヒント
VM の起動が完了したら、左上隅をクリックしてノートブックタブに切り替え、Jupyter Notebook を使って練習しましょう。
時々、Jupyter Notebook が読み込み終わるまで数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証は自動化できません。
学習中に問題に遭遇した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。
必要なライブラリをインポートする
まず、pandas ライブラリをエイリアス pd で、numpy ライブラリをエイリアス np でインポートする必要があります。これらのライブラリはそれぞれデータ操作と数値演算に使用されます。
import pandas as pd
import numpy as np
DataFrame を作成する
次に、notna() メソッドの使い方を示すために、サンプルデータを使って DataFrame を作成します。DataFrame を作成するには pd.DataFrame() 関数を使用します。
df = pd.DataFrame([(0.0, np.nan, -1.0, 1.0), (np.nan, 2.0, np.nan, np.nan), (2.0, 3.0, np.nan, 9.0)], columns=list('abcd'))
DataFrame を表示する
DataFrame の内容と構造を見るために、DataFrame を表示しましょう。
print("The DataFrame is:")
print(df)
notna() メソッドを使用する
次に、DataFrame に対して notna() メソッドを使用して既存の値を検出します。notna() メソッドは、元の DataFrame と同じ形状の DataFrame を返します。その各要素は、対応する要素が NA 値でないかどうかを示すブール値です。
notna_df = df.notna()
print("The result of the notna() method is:")
print(notna_df)
結果を表示する
既存の値を示すブール値を見るために、結果の DataFrame を表示しましょう。
print(notna_df)
まとめ
この実験では、Pandas ライブラリの notna() メソッドを使って DataFrame 内の既存の値を検出する方法を学びました。このメソッドは、欠損値や null 値を特定する必要があるデータクリーニングと分析タスクに役立ちます。notna() メソッドを使用することで、既存の値の有無を示すブール値の DataFrame を迅速に取得できます。