Introdução
Neste laboratório, aprenderemos como visualizar distribuições discretas usando gráficos de barras empilhadas horizontais. Usaremos o Matplotlib, uma biblioteca de plotagem popular em Python, para criar uma visualização de resultados de pesquisa.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar Bibliotecas
Primeiramente, importaremos as bibliotecas necessárias. Usaremos Matplotlib e Numpy neste laboratório.
import matplotlib.pyplot as plt
import numpy as np
Preparar Dados
Precisamos definir as categorias e os resultados da pesquisa. Neste exemplo, temos uma pesquisa onde as pessoas avaliaram seu nível de concordância com perguntas em uma escala de cinco elementos. Definiremos as categorias como category_names e os resultados da pesquisa como results.
category_names = ['Discordo totalmente', 'Discordo',
'Nem concordo nem discordo', 'Concordo', 'Concordo totalmente']
results = {
'Question 1': [10, 15, 17, 32, 26],
'Question 2': [26, 22, 29, 10, 13],
'Question 3': [35, 37, 7, 2, 19],
'Question 4': [32, 11, 9, 15, 33],
'Question 5': [21, 29, 5, 5, 40],
'Question 6': [8, 19, 5, 30, 38]
}
Definir Função
Agora, definiremos uma função chamada survey que recebe os results e category_names e cria uma visualização de gráfico de barras empilhadas horizontais.
def survey(results, category_names):
"""
Parâmetros
----------
results : dict
Um mapeamento de rótulos de perguntas para uma lista de respostas por categoria.
Assume-se que todas as listas contêm o mesmo número de entradas e que
corresponde ao comprimento de *category_names*.
category_names : list of str
Os rótulos das categorias.
"""
## Converter os resultados e categorias para arrays numpy
labels = list(results.keys())
data = np.array(list(results.values()))
## Calcular somas cumulativas de dados para empilhamento horizontal
data_cum = data.cumsum(axis=1)
## Definir cores das categorias
category_colors = plt.colormaps['RdYlGn'](
np.linspace(0.15, 0.85, data.shape[1]))
## Criar o gráfico e definir as propriedades dos eixos
fig, ax = plt.subplots(figsize=(9.2, 5))
ax.invert_yaxis()
ax.xaxis.set_visible(False)
ax.set_xlim(0, np.sum(data, axis=1).max())
## Criar as barras empilhadas e adicionar rótulos às barras
for i, (colname, color) in enumerate(zip(category_names, category_colors)):
widths = data[:, i]
starts = data_cum[:, i] - widths
rects = ax.barh(labels, widths, left=starts, height=0.5,
label=colname, color=color)
r, g, b, _ = color
text_color = 'white' if r * g * b < 0.5 else 'darkgrey'
ax.bar_label(rects, label_type='center', color=text_color)
## Adicionar legenda
ax.legend(ncols=len(category_names), bbox_to_anchor=(0, 1),
loc='lower left', fontsize='small')
return fig, ax
Chamar Função e Exibir Resultados
Finalmente, chamaremos a função survey com os results e category_names como entradas e exibiremos a visualização resultante.
survey(results, category_names)
plt.show()
Resumo
Neste laboratório, aprendemos como criar um gráfico de barras empilhadas horizontais para visualizar distribuições discretas usando Matplotlib. Definimos as categorias e os resultados da pesquisa, criamos uma função para gerar o gráfico e exibimos os resultados. Essa técnica pode ser útil para visualizar resultados de pesquisas ou outros tipos de distribuições discretas.