Distribuição Discreta como Gráfico de Barras Horizontal

Beginner

This tutorial is from open-source community. Access the source code

Introdução

Neste laboratório, aprenderemos como visualizar distribuições discretas usando gráficos de barras empilhadas horizontais. Usaremos o Matplotlib, uma biblioteca de plotagem popular em Python, para criar uma visualização de resultados de pesquisa.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar Bibliotecas

Primeiramente, importaremos as bibliotecas necessárias. Usaremos Matplotlib e Numpy neste laboratório.

import matplotlib.pyplot as plt
import numpy as np

Preparar Dados

Precisamos definir as categorias e os resultados da pesquisa. Neste exemplo, temos uma pesquisa onde as pessoas avaliaram seu nível de concordância com perguntas em uma escala de cinco elementos. Definiremos as categorias como category_names e os resultados da pesquisa como results.

category_names = ['Discordo totalmente', 'Discordo',
                  'Nem concordo nem discordo', 'Concordo', 'Concordo totalmente']
results = {
    'Question 1': [10, 15, 17, 32, 26],
    'Question 2': [26, 22, 29, 10, 13],
    'Question 3': [35, 37, 7, 2, 19],
    'Question 4': [32, 11, 9, 15, 33],
    'Question 5': [21, 29, 5, 5, 40],
    'Question 6': [8, 19, 5, 30, 38]
}

Definir Função

Agora, definiremos uma função chamada survey que recebe os results e category_names e cria uma visualização de gráfico de barras empilhadas horizontais.

def survey(results, category_names):
    """
    Parâmetros
    ----------
    results : dict
        Um mapeamento de rótulos de perguntas para uma lista de respostas por categoria.
        Assume-se que todas as listas contêm o mesmo número de entradas e que
        corresponde ao comprimento de *category_names*.
    category_names : list of str
        Os rótulos das categorias.
    """
    ## Converter os resultados e categorias para arrays numpy
    labels = list(results.keys())
    data = np.array(list(results.values()))

    ## Calcular somas cumulativas de dados para empilhamento horizontal
    data_cum = data.cumsum(axis=1)

    ## Definir cores das categorias
    category_colors = plt.colormaps['RdYlGn'](
        np.linspace(0.15, 0.85, data.shape[1]))

    ## Criar o gráfico e definir as propriedades dos eixos
    fig, ax = plt.subplots(figsize=(9.2, 5))
    ax.invert_yaxis()
    ax.xaxis.set_visible(False)
    ax.set_xlim(0, np.sum(data, axis=1).max())

    ## Criar as barras empilhadas e adicionar rótulos às barras
    for i, (colname, color) in enumerate(zip(category_names, category_colors)):
        widths = data[:, i]
        starts = data_cum[:, i] - widths
        rects = ax.barh(labels, widths, left=starts, height=0.5,
                        label=colname, color=color)
        r, g, b, _ = color
        text_color = 'white' if r * g * b < 0.5 else 'darkgrey'
        ax.bar_label(rects, label_type='center', color=text_color)

    ## Adicionar legenda
    ax.legend(ncols=len(category_names), bbox_to_anchor=(0, 1),
              loc='lower left', fontsize='small')

    return fig, ax

Chamar Função e Exibir Resultados

Finalmente, chamaremos a função survey com os results e category_names como entradas e exibiremos a visualização resultante.

survey(results, category_names)
plt.show()

Resumo

Neste laboratório, aprendemos como criar um gráfico de barras empilhadas horizontais para visualizar distribuições discretas usando Matplotlib. Definimos as categorias e os resultados da pesquisa, criamos uma função para gerar o gráfico e exibimos os resultados. Essa técnica pode ser útil para visualizar resultados de pesquisas ou outros tipos de distribuições discretas.