Tutorial de Histograma com Python Matplotlib

Beginner

This tutorial is from open-source community. Access the source code

Introdução

Este laboratório é um tutorial passo a passo sobre como usar a biblioteca Python Matplotlib para criar um histograma. Um histograma é uma representação gráfica da distribuição de dados numéricos. É uma estimativa da distribuição de probabilidade de uma variável contínua.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias

Nesta etapa, importaremos duas bibliotecas: numpy e matplotlib. Numpy é uma biblioteca para a linguagem de programação Python, adicionando suporte para arrays e matrizes grandes e multidimensionais. Matplotlib é uma biblioteca de plotagem para a linguagem de programação Python.

import numpy as np
import matplotlib.pyplot as plt

Gerar dados de amostra

Nesta etapa, geraremos dados de amostra usando numpy. Geraremos dados aleatórios de uma distribuição normal com média 100 e desvio padrão 15.

np.random.seed(19680801)
mu = 100  ## mean of distribution
sigma = 15  ## standard deviation of distribution
x = mu + sigma * np.random.randn(437)

Criar um histograma

Nesta etapa, criaremos um histograma usando matplotlib. Definiremos o número de bins para 50 e habilitaremos o parâmetro density para normalizar as alturas dos bins, de modo que a integral do histograma seja 1.

num_bins = 50
fig, ax = plt.subplots()
n, bins, patches = ax.hist(x, num_bins, density=True)

Adicionar uma linha de melhor ajuste

Nesta etapa, adicionaremos uma linha de melhor ajuste ao histograma. Calcularemos os valores y para a linha e a plotaremos sobre o histograma.

y = ((1 / (np.sqrt(2 * np.pi) * sigma)) *
     np.exp(-0.5 * (1 / sigma * (bins - mu))**2))
ax.plot(bins, y, '--')

Personalizar o histograma

Nesta etapa, personalizaremos o histograma adicionando rótulos, título e ajustando o layout.

ax.set_xlabel('Smarts')
ax.set_ylabel('Probability density')
ax.set_title(r'Histogram of IQ: $\mu=100$, $\sigma=15$')
fig.tight_layout()
plt.show()

Resumo

Neste laboratório, aprendemos como usar a biblioteca Python Matplotlib para criar um histograma. Geramos dados de amostra de uma distribuição normal e criamos um histograma usando matplotlib. Também adicionamos uma linha de melhor ajuste e personalizamos o histograma adicionando rótulos e um título.