水平バーチャートとしての離散分布

PythonPythonBeginner
今すぐ練習

This tutorial is from open-source community. Access the source code

💡 このチュートリアルは英語版からAIによって翻訳されています。原文を確認するには、 ここをクリックしてください

はじめに

この実験では、水平積み上げバーチャートを使って離散分布を可視化する方法を学びます。Python の人気のあるグラフ作成ライブラリである Matplotlib を使って、アンケート結果の可視化を作成します。

VM のヒント

VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替えて、Jupyter Notebook を使って練習します。

時々、Jupyter Notebook が読み込み終了するまで数秒待つ必要があります。Jupyter Notebook の制限により、操作の検証は自動化できません。

学習中に問題に遭遇した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。

ライブラリのインポート

まず、必要なライブラリをインポートします。この実験では、Matplotlib と Numpy を使用します。

import matplotlib.pyplot as plt
import numpy as np

データの準備

カテゴリとアンケート結果を定義する必要があります。この例では、人々が5段階で質問に対する同意度を評価したアンケートがあります。カテゴリを category_names として、アンケート結果を results として定義します。

category_names = ['Strongly disagree', 'Disagree',
                  'Neither agree nor disagree', 'Agree', 'Strongly agree']
results = {
    'Question 1': [10, 15, 17, 32, 26],
    'Question 2': [26, 22, 29, 10, 13],
    'Question 3': [35, 37, 7, 2, 19],
    'Question 4': [32, 11, 9, 15, 33],
    'Question 5': [21, 29, 5, 5, 40],
    'Question 6': [8, 19, 5, 30, 38]
}

関数の定義

ここで、resultscategory_names を引数に取り、水平積み上げバーチャートの可視化を作成する survey という関数を定義します。

def survey(results, category_names):
    """
    Parameters
    ----------
    results : dict
        質問ラベルから各カテゴリごとの回答のリストへのマッピング。
        すべてのリストが同じ数のエントリを含み、*category_names* の長さと一致すると仮定されます。
    category_names : list of str
        カテゴリのラベル。
    """
    ## 結果とカテゴリをnumpy配列に変換
    labels = list(results.keys())
    data = np.array(list(results.values()))

    ## 水平積み上げ用にデータの累積和を計算
    data_cum = data.cumsum(axis=1)

    ## カテゴリの色を定義
    category_colors = plt.colormaps['RdYlGn'](
        np.linspace(0.15, 0.85, data.shape[1]))

    ## プロットを作成して軸のプロパティを設定
    fig, ax = plt.subplots(figsize=(9.2, 5))
    ax.invert_yaxis()
    ax.xaxis.set_visible(False)
    ax.set_xlim(0, np.sum(data, axis=1).max())

    ## 積み上げバーを作成してバーのラベルを追加
    for i, (colname, color) in enumerate(zip(category_names, category_colors)):
        widths = data[:, i]
        starts = data_cum[:, i] - widths
        rects = ax.barh(labels, widths, left=starts, height=0.5,
                        label=colname, color=color)
        r, g, b, _ = color
        text_color = 'white' if r * g * b < 0.5 else 'darkgrey'
        ax.bar_label(rects, label_type='center', color=text_color)

    ## 凡例を追加
    ax.legend(ncols=len(category_names), bbox_to_anchor=(0, 1),
              loc='lower left', fontsize='small')

    return fig, ax

関数を呼び出して結果を表示する

最後に、resultscategory_names を入力として survey 関数を呼び出し、生成された可視化結果を表示します。

survey(results, category_names)
plt.show()

まとめ

この実験では、Matplotlibを使って離散分布を可視化するための水平積み上げバーチャートを作成する方法を学びました。カテゴリとアンケート結果を定義し、プロットを生成する関数を作成し、結果を表示しました。この手法は、アンケート結果やその他の種類の離散分布を可視化する際に役立つ可能性があります。