Pandas DataFrame の head メソッド

Beginner

はじめに

この実験では、Python の pandas ライブラリのhead()メソッドを使って DataFrame の最初の n 行を取得する方法を学びます。このメソッドは、DataFrame 内のデータを迅速に調べ、その構造を理解するために一般的に使用されます。

VM のヒント

VM の起動が完了したら、左上隅をクリックしてノートブックタブに切り替え、Jupyter Notebook を使って練習しましょう。

時々、Jupyter Notebook が読み込み終了するまで数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証は自動化できません。

学習中に問題に遭遇した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。

pandas ライブラリをインポートする

まず、import文を使って pandas ライブラリをインポートする必要があります。

import pandas as pd

DataFrame を作成する

次に、いくつかのサンプルデータを含む DataFrame オブジェクトを作成します。たとえば、「言語」という単一の列を持ち、プログラミング言語のリストを含む DataFrame を作成しましょう。

## Create the DataFrame
df = pd.DataFrame({'Language': ['Kannada','Hindi', 'Telugu', 'Tamil', 'Malyalam','Marathi','Konkani','Tulu']})

head() メソッドを使用する

DataFrame の最初の n 行を取得するには、head()メソッドを使用できます。デフォルトでは、最初の 5 行が返されます。以下は例です:

print("----DataFrame の最初の 5 行は-----")
print(df.head())

行数を指定する

head()メソッドにパラメータを渡すことで、取得したい行数を指定することもできます。これにより、DataFrame の先頭から特定の行数を取得できます。たとえば、最初の 2 行を取得するには、次のコードを使用できます:

print("----DataFrame の最初の 2 行は-----")
print(df.head(n=2))

n に負の値を使用する

head()メソッドにnとして負の値を渡すと、最後のn行を除くすべての行が返されます。これは、スライス表記df[:-n]を使用するのと同等です。以下は例です:

print("----DataFrame の最初の n 行は-----")
print(df.head(-2))

まとめ

この実験では、pandas ライブラリのhead()メソッドを使って DataFrame の最初の n 行を取得する方法を学びました。このメソッドは、データを迅速に調べ、その構造を理解するのに役立ちます。行数を指定することで、DataFrame の特定のサブセットを取得できます。また、nに負の値を使うことで、最後のn行を除くすべての行を取得できます。全体として、head()メソッドは DataFrame の内容を調べる便利なツールです。