Introduction
Ce laboratoire est un tutoriel étape par étape sur la manière d'utiliser la bibliothèque Python Matplotlib pour créer un histogramme. Un histogramme est une représentation graphique de la distribution des données numériques. C'est une estimation de la distribution de probabilité d'une variable continue.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.
Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.
Importez les bibliothèques nécessaires
Dans cette étape, nous allons importer deux bibliothèques : numpy et matplotlib. Numpy est une bibliothèque pour le langage de programmation Python, qui ajoute la prise en charge de tableaux et de matrices multi-dimensionnels de grande taille. Matplotlib est une bibliothèque de tracé pour le langage de programmation Python.
import numpy as np
import matplotlib.pyplot as plt
Générez des données d'échantillonnage
Dans cette étape, nous allons générer des données d'échantillonnage à l'aide de numpy. Nous allons générer des données aléatoires à partir d'une distribution normale avec une moyenne de 100 et un écart-type de 15.
np.random.seed(19680801)
mu = 100 ## moyenne de la distribution
sigma = 15 ## écart-type de la distribution
x = mu + sigma * np.random.randn(437)
Créez un histogramme
Dans cette étape, nous allons créer un histogramme à l'aide de matplotlib. Nous allons définir le nombre de barres à 50 et activer le paramètre de densité pour normaliser les hauteurs des barres de sorte que l'intégrale de l'histogramme soit égale à 1.
num_bins = 50
fig, ax = plt.subplots()
n, bins, patches = ax.hist(x, num_bins, density=True)
Ajoutez une ligne de meilleure ajustement
Dans cette étape, nous allons ajouter une ligne de meilleure ajustement à l'histogramme. Nous allons calculer les valeurs y pour la ligne et la tracer au-dessus de l'histogramme.
y = ((1 / (np.sqrt(2 * np.pi) * sigma)) *
np.exp(-0.5 * (1 / sigma * (bins - mu))**2))
ax.plot(bins, y, '--')
Personnalisez l'histogramme
Dans cette étape, nous allons personnaliser l'histogramme en ajoutant des étiquettes, un titre et en ajustant la mise en page.
ax.set_xlabel('Smarts')
ax.set_ylabel('Probabilité de densité')
ax.set_title(r'Histogramme de l'IQ : $\mu=100$, $\sigma=15$')
fig.tight_layout()
plt.show()
Sommaire
Dans ce laboratoire, nous avons appris à utiliser la bibliothèque Python Matplotlib pour créer un histogramme. Nous avons généré des données d'échantillonnage à partir d'une distribution normale et créé un histogramme à l'aide de matplotlib. Nous avons également ajouté une ligne de meilleure ajustement et personnalisé l'histogramme en ajoutant des étiquettes et un titre.