はじめに
このチュートリアルでは、Matplotlib ライブラリを使ってヒストグラムを作成する方法を学びます。ヒストグラムは、データセットの分布をグラフィカルに表したものです。連続変数の確率分布の推定値です。ヒストグラムを作成するには、値の全範囲を一連の区間またはビンに分割し、その後、各区間にどれだけの値が入るかを数えます。
VM のヒント
VM の起動が完了したら、左上隅をクリックしてノートブックタブに切り替え、Jupyter Notebook を使って練習しましょう。
時々、Jupyter Notebook が読み込み終了するまで数秒待つ必要があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。
学習中に問題に遭遇した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。
必要なライブラリをインポートする
まず、必要なライブラリである NumPy と Matplotlib をインポートする必要があります。
import matplotlib.pyplot as plt
import numpy as np
ランダムなデータを生成する
NumPy のrandom.normal関数を使って、2 セットのランダムなデータを生成します。これらのセットは、異なるスタイルのヒストグラムを作成するために使用されます。
np.random.seed(19680801)
mu_x = 200
sigma_x = 25
x = np.random.normal(mu_x, sigma_x, size=100)
mu_w = 200
sigma_w = 10
w = np.random.normal(mu_w, sigma_w, size=100)
基本的なヒストグラムを作成する
Matplotlib のhist関数を使って基本的なヒストグラムを作成します。このヒストグラムは、同じサイズの 10 個のビンを持ちます。
plt.hist(x, bins=10)
plt.show()
ビンの数を変更する
hist関数のbinsパラメータを指定することで、ビンの数を変更できます。この例では、20 個のビンを持つヒストグラムを作成します。
plt.hist(x, bins=20)
plt.show()
ヒストグラムのスタイルを変更する
hist関数のhisttypeパラメータを指定することで、ヒストグラムのスタイルを変更できます。この例では、色の塗りつぶしがあるステップ曲線のヒストグラムを作成します。
plt.hist(x, bins=20, density=True, histtype='stepfilled', facecolor='g', alpha=0.75)
plt.show()
カスタムのビン幅でヒストグラムを作成する
ビンの境界のリストを提供することで、カスタムで不均等なビン幅のヒストグラムを作成できます。この例では、間隔の不揃いなビンを持つヒストグラムを作成します。
bins = [100, 150, 180, 195, 205, 220, 250, 300]
plt.hist(x, bins=bins, density=True, histtype='bar', rwidth=0.8)
plt.show()
積み重ね棒グラフで 2 つのヒストグラムを作成する
hist関数を 2 回呼び出し、histtypeパラメータを'barstacked'に設定することで、積み重ね棒グラフで 2 つのヒストグラムを作成できます。この例では、積み重ね棒グラフで 2 つのヒストグラムを作成します。
plt.hist(x, density=True, histtype='barstacked', rwidth=0.8)
plt.hist(w, density=True, histtype='barstacked', rwidth=0.8)
plt.show()
まとめ
このチュートリアルでは、Matplotlib ライブラリを使ってヒストグラムを作成する方法を学びました。また、ビンの数を変更する方法、ヒストグラムのスタイルを変更する方法、カスタムのビン幅や積み重ね棒グラフでヒストグラムを作成する方法についても学びました。