Plotando Histogramas com Matplotlib

Beginner

This tutorial is from open-source community. Access the source code

Introdução

Matplotlib é uma popular biblioteca de visualização de dados em Python. Uma das formas mais comuns de visualizar distribuições de dados é usando histogramas. Neste laboratório, aprenderemos como criar histogramas com Matplotlib e explorar diferentes opções de personalização.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias

Primeiramente, precisamos importar as bibliotecas necessárias, incluindo Matplotlib e NumPy.

import matplotlib.pyplot as plt
import numpy as np

Gerar dados de amostra

Em seguida, geraremos alguns dados de amostra para usar no histograma. Neste exemplo, geraremos três conjuntos de dados aleatórios.

np.random.seed(19680801)
n_bins = 10
x = np.random.randn(1000, 3)

Plotar um histograma básico

Podemos criar um histograma básico usando a função hist em Matplotlib. Esta função recebe os dados que queremos plotar e o número de bins que queremos usar.

plt.hist(x, n_bins)
plt.show()

Adicionar rótulos e um título

Podemos adicionar rótulos aos eixos x e y e um título ao gráfico usando as funções xlabel, ylabel e title.

plt.hist(x, n_bins)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.show()

Personalizar o histograma

Podemos personalizar o histograma alterando a cor, a transparência e a cor da borda das barras usando os parâmetros color, alpha e edgecolor.

plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black')
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.show()

Plotar múltiplos histogramas

Podemos plotar múltiplos histogramas no mesmo gráfico passando um array de dados para a função hist.

plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.legend()
plt.show()

Plotar histogramas empilhados

Podemos plotar histogramas empilhados definindo o parâmetro stacked como True.

plt.hist(x, n_bins, color=['green', 'blue', 'red'], alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'], stacked=True)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Stacked Histogram of Random Data')
plt.legend()
plt.show()

Plotar histogramas de passos

Podemos plotar histogramas de passos definindo o parâmetro histtype como 'step'.

plt.hist(x, n_bins, histtype='step', color=['green', 'blue', 'red'], label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Step Histogram of Random Data')
plt.legend()
plt.show()

Resumo

Neste laboratório, aprendemos como criar histogramas usando Matplotlib. Exploramos diferentes opções de personalização, incluindo a alteração da cor, transparência e cor da borda das barras, plotando múltiplos histogramas no mesmo gráfico, empilhando histogramas e plotando histogramas de passos. Essas ferramentas podem nos ajudar a entender melhor a distribuição dos nossos dados.