Pandas DataFrame の isna メソッド

PandasPandasBeginner
今すぐ練習

💡 このチュートリアルは英語版からAIによって翻訳されています。原文を確認するには、 ここをクリックしてください

はじめに

この実験では、PandasのDataFrame.isna()メソッドの使い方を学びます。isna()メソッドは、pandasのDataFrame内の欠損値を検出するために使用されます。ブール値のDataFrameを返し、各要素はnull値かどうかを示します。isna()メソッドは、空の文字列やnumpy.infのような特殊な値をnull値としては考慮しません。

VMのヒント

VMの起動が完了したら、左上隅をクリックしてノートブックタブに切り替え、Jupyter Notebookを使って練習しましょう。

時々、Jupyter Notebookが読み込み終わるまで数秒待つ必要がある場合があります。Jupyter Notebookの制限により、操作の検証を自動化することはできません。

学習中に問題に遭遇した場合は、Labbyにお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) python(("Python")) -.-> python/BasicConceptsGroup(["Basic Concepts"]) pandas(("Pandas")) -.-> pandas/DataSelectionGroup(["Data Selection"]) pandas(("Pandas")) -.-> pandas/DataCleaningGroup(["Data Cleaning"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) python/BasicConceptsGroup -.-> python/strings("Strings") python/BasicConceptsGroup -.-> python/booleans("Booleans") pandas/DataSelectionGroup -.-> pandas/select_columns("Select Columns") pandas/DataSelectionGroup -.-> pandas/select_rows("Select Rows") pandas/DataCleaningGroup -.-> pandas/handle_missing_values("Handling Missing Values") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills python/strings -.-> lab-68640{{"Pandas DataFrame の isna メソッド"}} python/booleans -.-> lab-68640{{"Pandas DataFrame の isna メソッド"}} pandas/select_columns -.-> lab-68640{{"Pandas DataFrame の isna メソッド"}} pandas/select_rows -.-> lab-68640{{"Pandas DataFrame の isna メソッド"}} pandas/handle_missing_values -.-> lab-68640{{"Pandas DataFrame の isna メソッド"}} python/using_packages -.-> lab-68640{{"Pandas DataFrame の isna メソッド"}} python/data_collections -.-> lab-68640{{"Pandas DataFrame の isna メソッド"}} python/data_analysis -.-> lab-68640{{"Pandas DataFrame の isna メソッド"}} end

DataFrameの作成

まず、pandasライブラリのDataFrame()関数を使って、いくつかの欠損値を持つDataFrameを作成しましょう。必要なライブラリをインポートし、列'a'、'b'、'c'、'd'を持つDataFrameを作成します。

#importing pandas as pd
import pandas as pd
#importing numpy as np
import numpy as np

#creating the DataFrame
df = pd.DataFrame([(0.0, np.nan, -1.0, 1.0),
                   (np.nan, 2.0, np.nan, np.nan),
                   (2.0, 3.0, np.nan, 9.0)],
                  columns=list('abcd'))

print("------The DataFrame is----------")
print(df)

欠損値の検出

次に、DataFrame内の欠損値を検出するためにisna()メソッドを使います。どの要素がnull値であるかを確認するために結果を表示します。

print("---------------------------------")
print(df.isna())

結果の評価

コードを実行することで、isna()メソッドが元のDataFrameの各要素に対するブール値から構成されるDataFrameを返したことがわかります。Falseは要素がnull値でないことを示し、Trueは要素がnull値であることを示します。

空の文字列を考慮する

前の例では、isna()メソッドは空の文字列をnull値としては考慮しませんでした。もう1つのDataFrameを作成し、isna()メソッドが依然として同じように動作するかどうかを確認しましょう。

#creating another DataFrame
df = pd.DataFrame({'a': [0, 1, ''], 'b': ['', None, 3]})

print("------The DataFrame is----------")
print(df)

再度、欠損値を検出する

さて、新しいDataFrameに対してisna()メソッドを使って欠損値を検出しましょう。

print("---------------------------------")
print(df.isna())

まとめ

この実験では、PandasのDataFrame.isna()メソッドを使ってDataFrame内の欠損値を検出する方法を学びました。欠損値が含まれるDataFrameを作成し、isna()メソッドを使ってそれらの欠損値を検出し、結果を観察しました。また、isna()メソッドは空の文字列をnull値としては考慮しないこともわかりました。このメソッドは、PandasのDataFrame内の欠損データを処理する際に役立ちます。


もしさらなるお手伝いが必要であれば、お知らせください。