Plotagem de Histogramas com Matplotlib

Beginner

This tutorial is from open-source community. Access the source code

Introdução

Neste laboratório, aprenderemos como plotar histogramas com Matplotlib. Geraremos dados e plotaremos um histograma simples, atualizaremos as cores do histograma, plotaremos um histograma 2D e personalizaremos seu histograma.

Dicas da VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Gerar Dados e Plotar um Histograma Simples

Para gerar um histograma 1D, precisamos apenas de um único vetor de números. Para um histograma 2D, precisaremos de um segundo vetor. Geraremos ambos abaixo e mostraremos o histograma para cada vetor.

import matplotlib.pyplot as plt
import numpy as np

## Create a random number generator with a fixed seed for reproducibility
rng = np.random.default_rng(19680801)

N_points = 100000
n_bins = 20

## Generate two normal distributions
dist1 = rng.standard_normal(N_points)
dist2 = 0.4 * rng.standard_normal(N_points) + 5

fig, axs = plt.subplots(1, 2, sharey=True, tight_layout=True)

## We can set the number of bins with the *bins* keyword argument.
axs[0].hist(dist1, bins=n_bins)
axs[1].hist(dist2, bins=n_bins)

plt.show()

Atualizando as Cores do Histograma

O método hist (histograma) retorna (entre outras coisas) um objeto patches. Isso nos dá acesso às propriedades dos objetos desenhados. Usando isso, podemos editar o histograma ao nosso gosto. Vamos mudar a cor de cada barra com base em seu valor y.

## N is the count in each bin, bins is the lower-limit of the bin
N, bins, patches = axs[0].hist(dist1, bins=n_bins)

## We'll color code by height, but you could use any scalar
fracs = N / N.max()

## we need to normalize the data to 0..1 for the full range of the colormap
norm = colors.Normalize(fracs.min(), fracs.max())

## Now, we'll loop through our objects and set the color of each accordingly
for thisfrac, thispatch in zip(fracs, patches):
    color = plt.cm.viridis(norm(thisfrac))
    thispatch.set_facecolor(color)

## We can also normalize our inputs by the total number of counts
axs[1].hist(dist1, bins=n_bins, density=True)

## Now we format the y-axis to display percentage
axs[1].yaxis.set_major_formatter(PercentFormatter(xmax=1))

plt.show()

Plotar um Histograma 2D

Para plotar um histograma 2D, basta ter dois vetores do mesmo comprimento, correspondentes a cada eixo do histograma.

fig, ax = plt.subplots(tight_layout=True)
hist = ax.hist2d(dist1, dist2)

plt.show()

Personalizando seu Histograma

Personalizar um histograma 2D é semelhante ao caso 1D, você pode controlar componentes visuais como o tamanho do bin (bin size) ou a normalização de cores.

fig, axs = plt.subplots(3, 1, figsize=(5, 15), sharex=True, sharey=True,
                        tight_layout=True)

## We can increase the number of bins on each axis
axs[0].hist2d(dist1, dist2, bins=40)

## As well as define normalization of the colors
axs[1].hist2d(dist1, dist2, bins=40, norm=colors.LogNorm())

## We can also define custom numbers of bins for each axis
axs[2].hist2d(dist1, dist2, bins=(80, 10), norm=colors.LogNorm())

plt.show()

Resumo

Neste laboratório, aprendemos como plotar histogramas com Matplotlib. Geramos dados e plotamos um histograma simples, atualizamos as cores do histograma, plotamos um histograma 2D e personalizamos nosso histograma. Podemos usar essas técnicas para visualizar e analisar dados em uma variedade de contextos.