はじめに
Pandas ライブラリの hist() メソッドを使用すると、ヒストグラムを作成できます。ヒストグラムは、データの分布を視覚的に表したものです。このメソッドは DataFrame オブジェクトで使用され、DataFrame 内の各シリーズに対して matplotlib.pyplot.hist() 関数を呼び出します。その結果、各列に対して 1 つのヒストグラムが生成されます。
VM のヒント
VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替え、Jupyter Notebook を使用して練習します。
Jupyter Notebook の読み込みには数秒かかる場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。
学習中に問題が発生した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。そうすると、迅速に問題を解決いたします。
必要なライブラリをインポートする
hist() メソッドを使用するには、必要なライブラリである pandas と matplotlib.pyplot をインポートする必要があります。
import pandas as pd
import matplotlib.pyplot as plt
DataFrame を作成する
次に、pd.DataFrame() メソッドを使用して DataFrame オブジェクトを作成する必要があります。辞書を引数として渡すことができ、そのキーが列名を表し、値がデータを表します。
data = {'length': [1.5, 0.5, 1.2, 0.9, 3], 'width': [0.7, 0.2, 0.15, 0.2, 1.1]}
df = pd.DataFrame(data)
ヒストグラムを作成する
今、DataFrame の各列のヒストグラムを作成するために、DataFrame で hist() メソッドを使用できます。
df.hist()
plt.show()
ヒストグラムをカスタマイズする
hist() メソッドに追加のパラメータを指定することで、ヒストグラムをカスタマイズできます。たとえば、ビンの数、ヒストグラムのバーの色、ヒストグラムのタイトルを指定できます。
df.hist(bins=10, color='skyblue')
plt.title('Histogram')
plt.show()
まとめ
Pandas の hist() メソッドを使用すると、DataFrame 内のデータのヒストグラムを作成できます。このメソッドを使用することで、データの分布を視覚化でき、データ分析や探索に役立ちます。また、hist() メソッドに追加のパラメータを指定することで、ヒストグラムの外観をカスタマイズできます。全体として、hist() メソッドは Pandas でデータを分析して視覚化するための便利なツールです。