Introdução
Neste laboratório, aprenderemos como plotar histogramas com Matplotlib. Geraremos dados e plotaremos um histograma simples, atualizaremos as cores do histograma, plotaremos um histograma 2D e personalizaremos seu histograma.
Dicas da VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Gerar Dados e Plotar um Histograma Simples
Para gerar um histograma 1D, precisamos apenas de um único vetor de números. Para um histograma 2D, precisaremos de um segundo vetor. Geraremos ambos abaixo e mostraremos o histograma para cada vetor.
import matplotlib.pyplot as plt
import numpy as np
## Create a random number generator with a fixed seed for reproducibility
rng = np.random.default_rng(19680801)
N_points = 100000
n_bins = 20
## Generate two normal distributions
dist1 = rng.standard_normal(N_points)
dist2 = 0.4 * rng.standard_normal(N_points) + 5
fig, axs = plt.subplots(1, 2, sharey=True, tight_layout=True)
## We can set the number of bins with the *bins* keyword argument.
axs[0].hist(dist1, bins=n_bins)
axs[1].hist(dist2, bins=n_bins)
plt.show()
Atualizando as Cores do Histograma
O método hist (histograma) retorna (entre outras coisas) um objeto patches. Isso nos dá acesso às propriedades dos objetos desenhados. Usando isso, podemos editar o histograma ao nosso gosto. Vamos mudar a cor de cada barra com base em seu valor y.
## N is the count in each bin, bins is the lower-limit of the bin
N, bins, patches = axs[0].hist(dist1, bins=n_bins)
## We'll color code by height, but you could use any scalar
fracs = N / N.max()
## we need to normalize the data to 0..1 for the full range of the colormap
norm = colors.Normalize(fracs.min(), fracs.max())
## Now, we'll loop through our objects and set the color of each accordingly
for thisfrac, thispatch in zip(fracs, patches):
color = plt.cm.viridis(norm(thisfrac))
thispatch.set_facecolor(color)
## We can also normalize our inputs by the total number of counts
axs[1].hist(dist1, bins=n_bins, density=True)
## Now we format the y-axis to display percentage
axs[1].yaxis.set_major_formatter(PercentFormatter(xmax=1))
plt.show()
Plotar um Histograma 2D
Para plotar um histograma 2D, basta ter dois vetores do mesmo comprimento, correspondentes a cada eixo do histograma.
fig, ax = plt.subplots(tight_layout=True)
hist = ax.hist2d(dist1, dist2)
plt.show()
Personalizando seu Histograma
Personalizar um histograma 2D é semelhante ao caso 1D, você pode controlar componentes visuais como o tamanho do bin (bin size) ou a normalização de cores.
fig, axs = plt.subplots(3, 1, figsize=(5, 15), sharex=True, sharey=True,
tight_layout=True)
## We can increase the number of bins on each axis
axs[0].hist2d(dist1, dist2, bins=40)
## As well as define normalization of the colors
axs[1].hist2d(dist1, dist2, bins=40, norm=colors.LogNorm())
## We can also define custom numbers of bins for each axis
axs[2].hist2d(dist1, dist2, bins=(80, 10), norm=colors.LogNorm())
plt.show()
Resumo
Neste laboratório, aprendemos como plotar histogramas com Matplotlib. Geramos dados e plotamos um histograma simples, atualizamos as cores do histograma, plotamos um histograma 2D e personalizamos nosso histograma. Podemos usar essas técnicas para visualizar e analisar dados em uma variedade de contextos.