はじめに
Matplotlib は、Python における人気のあるデータ可視化ライブラリです。データ分布を可視化する最も一般的な方法の 1 つは、ヒストグラムを使用することです。この実験では、Matplotlib を使ってヒストグラムを作成し、さまざまなカスタマイズオプションを探ります。
VM のヒント
VM の起動が完了したら、左上隅をクリックしてノートブックタブに切り替え、Jupyter Notebook を使って練習しましょう。
時々、Jupyter Notebook が読み込み終わるまで数秒待つ必要があります。Jupyter Notebook の制限により、操作の検証は自動化できません。
学習中に問題に遭遇した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。
必要なライブラリをインポートする
まず、Matplotlib と NumPy を含む必要なライブラリをインポートする必要があります。
import matplotlib.pyplot as plt
import numpy as np
サンプルデータを生成する
次に、ヒストグラムに使用するサンプルデータを生成します。この例では、3 セットのランダムなデータを生成します。
np.random.seed(19680801)
n_bins = 10
x = np.random.randn(1000, 3)
基本的なヒストグラムを描画する
Matplotlib のhist関数を使って、基本的なヒストグラムを作成することができます。この関数には、描画したいデータと使用するビンの数を指定します。
plt.hist(x, n_bins)
plt.show()
ラベルとタイトルを追加する
xlabel、ylabel、title関数を使って、x 軸と y 軸にラベルを付け、グラフにタイトルを追加することができます。
plt.hist(x, n_bins)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.show()
ヒストグラムをカスタマイズする
color、alpha、edgecolorパラメータを使って、棒グラフの色、透明度、枠線の色を変更することで、ヒストグラムをカスタマイズすることができます。
plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black')
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.show()
複数のヒストグラムを描画する
hist関数にデータの配列を渡すことで、同じグラフに複数のヒストグラムを描画することができます。
plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.legend()
plt.show()
積み重ねヒストグラムを描画する
stackedパラメータをTrueに設定することで、積み重ねヒストグラムを描画することができます。
plt.hist(x, n_bins, color=['green', 'blue','red'], alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'], stacked=True)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Stacked Histogram of Random Data')
plt.legend()
plt.show()
ステップヒストグラムを描画する
histtypeパラメータを'step'に設定することで、ステップヒストグラムを描画することができます。
plt.hist(x, n_bins, histtype='step', color=['green', 'blue','red'], label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Step Histogram of Random Data')
plt.legend()
plt.show()
まとめ
この実験では、Matplotlib を使ってヒストグラムを作成する方法を学びました。棒グラフの色、透明度、枠線の色を変更することや、同じグラフに複数のヒストグラムを描画すること、積み重ねヒストグラムを描画すること、ステップヒストグラムを描画することなど、さまざまなカスタマイズオプションを検討しました。これらのツールは、データの分布をよりよく理解するのに役立ちます。