Introdução
Matplotlib é uma popular biblioteca de visualização de dados em Python. Uma das formas mais comuns de visualizar distribuições de dados é usando histogramas. Neste laboratório, aprenderemos como criar histogramas com Matplotlib e explorar diferentes opções de personalização.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar as bibliotecas necessárias
Primeiramente, precisamos importar as bibliotecas necessárias, incluindo Matplotlib e NumPy.
import matplotlib.pyplot as plt
import numpy as np
Gerar dados de amostra
Em seguida, geraremos alguns dados de amostra para usar no histograma. Neste exemplo, geraremos três conjuntos de dados aleatórios.
np.random.seed(19680801)
n_bins = 10
x = np.random.randn(1000, 3)
Plotar um histograma básico
Podemos criar um histograma básico usando a função hist em Matplotlib. Esta função recebe os dados que queremos plotar e o número de bins que queremos usar.
plt.hist(x, n_bins)
plt.show()
Adicionar rótulos e um título
Podemos adicionar rótulos aos eixos x e y e um título ao gráfico usando as funções xlabel, ylabel e title.
plt.hist(x, n_bins)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.show()
Personalizar o histograma
Podemos personalizar o histograma alterando a cor, a transparência e a cor da borda das barras usando os parâmetros color, alpha e edgecolor.
plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black')
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.show()
Plotar múltiplos histogramas
Podemos plotar múltiplos histogramas no mesmo gráfico passando um array de dados para a função hist.
plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.legend()
plt.show()
Plotar histogramas empilhados
Podemos plotar histogramas empilhados definindo o parâmetro stacked como True.
plt.hist(x, n_bins, color=['green', 'blue', 'red'], alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'], stacked=True)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Stacked Histogram of Random Data')
plt.legend()
plt.show()
Plotar histogramas de passos
Podemos plotar histogramas de passos definindo o parâmetro histtype como 'step'.
plt.hist(x, n_bins, histtype='step', color=['green', 'blue', 'red'], label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Step Histogram of Random Data')
plt.legend()
plt.show()
Resumo
Neste laboratório, aprendemos como criar histogramas usando Matplotlib. Exploramos diferentes opções de personalização, incluindo a alteração da cor, transparência e cor da borda das barras, plotando múltiplos histogramas no mesmo gráfico, empilhando histogramas e plotando histogramas de passos. Essas ferramentas podem nos ajudar a entender melhor a distribuição dos nossos dados.