Introduction
Matplotlib est une bibliothèque populaire de visualisation de données en Python. L'une des façons les plus courantes de visualiser les distributions de données est d'utiliser des histogrammes. Dans ce laboratoire, nous allons apprendre à créer des histogrammes avec Matplotlib et explorer différentes options de personnalisation.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.
Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez des commentaires après la session, et nous réglerons rapidement le problème pour vous.
Importez les bibliothèques nécessaires
Tout d'abord, nous devons importer les bibliothèques nécessaires, y compris Matplotlib et NumPy.
import matplotlib.pyplot as plt
import numpy as np
Générez des données d'échantillonnage
Ensuite, nous allons générer quelques données d'échantillonnage pour les utiliser dans l'histogramme. Dans cet exemple, nous allons générer trois ensembles de données aléatoires.
np.random.seed(19680801)
n_bins = 10
x = np.random.randn(1000, 3)
Tracez un histogramme de base
Nous pouvons créer un histogramme de base en utilisant la fonction hist de Matplotlib. Cette fonction prend les données que nous voulons tracer et le nombre de barres que nous voulons utiliser.
plt.hist(x, n_bins)
plt.show()
Ajoutez des étiquettes et un titre
Nous pouvons ajouter des étiquettes aux axes x et y et un titre au graphique en utilisant les fonctions xlabel, ylabel et title.
plt.hist(x, n_bins)
plt.xlabel('Valeur')
plt.ylabel('Fréquence')
plt.title('Histogramme de données aléatoires')
plt.show()
Personnalisez l'histogramme
Nous pouvons personnaliser l'histogramme en changeant la couleur, la transparence et la couleur des bords des barres en utilisant les paramètres color, alpha et edgecolor.
plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black')
plt.xlabel('Valeur')
plt.ylabel('Fréquence')
plt.title('Histogramme de données aléatoires')
plt.show()
Tracez plusieurs histogrammes
Nous pouvons tracer plusieurs histogrammes sur le même graphique en passant un tableau de données à la fonction hist.
plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Valeur')
plt.ylabel('Fréquence')
plt.title('Histogramme de données aléatoires')
plt.legend()
plt.show()
Tracez des histogrammes superposés
Nous pouvons tracer des histogrammes superposés en définissant le paramètre stacked sur True.
plt.hist(x, n_bins, color=['green', 'blue','red'], alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'], stacked=True)
plt.xlabel('Valeur')
plt.ylabel('Fréquence')
plt.title('Histogramme superposé de données aléatoires')
plt.legend()
plt.show()
Tracez des histogrammes en escalier
Nous pouvons tracer des histogrammes en escalier en définissant le paramètre histtype sur 'step'.
plt.hist(x, n_bins, histtype='step', color=['green', 'blue','red'], label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Valeur')
plt.ylabel('Fréquence')
plt.title('Histogramme en escalier de données aléatoires')
plt.legend()
plt.show()
Sommaire
Dans ce laboratoire, nous avons appris à créer des histogrammes à l'aide de Matplotlib. Nous avons exploré différentes options de personnalisation, notamment le changement de couleur, de transparence et de couleur des bords des barres, le tracé de plusieurs histogrammes sur le même graphique, le chevauchement d'histogrammes et le tracé d'histogrammes en escalier. Ces outils peuvent nous aider à mieux comprendre la distribution de nos données.