Tutoriel sur l'histogramme avec Python Matplotlib

Beginner

This tutorial is from open-source community. Access the source code

Introduction

Ce laboratoire est un tutoriel étape par étape sur la manière d'utiliser la bibliothèque Python Matplotlib pour créer un histogramme. Un histogramme est une représentation graphique de la distribution des données numériques. C'est une estimation de la distribution de probabilité d'une variable continue.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importez les bibliothèques nécessaires

Dans cette étape, nous allons importer deux bibliothèques : numpy et matplotlib. Numpy est une bibliothèque pour le langage de programmation Python, qui ajoute la prise en charge de tableaux et de matrices multi-dimensionnels de grande taille. Matplotlib est une bibliothèque de tracé pour le langage de programmation Python.

import numpy as np
import matplotlib.pyplot as plt

Générez des données d'échantillonnage

Dans cette étape, nous allons générer des données d'échantillonnage à l'aide de numpy. Nous allons générer des données aléatoires à partir d'une distribution normale avec une moyenne de 100 et un écart-type de 15.

np.random.seed(19680801)
mu = 100  ## moyenne de la distribution
sigma = 15  ## écart-type de la distribution
x = mu + sigma * np.random.randn(437)

Créez un histogramme

Dans cette étape, nous allons créer un histogramme à l'aide de matplotlib. Nous allons définir le nombre de barres à 50 et activer le paramètre de densité pour normaliser les hauteurs des barres de sorte que l'intégrale de l'histogramme soit égale à 1.

num_bins = 50
fig, ax = plt.subplots()
n, bins, patches = ax.hist(x, num_bins, density=True)

Ajoutez une ligne de meilleure ajustement

Dans cette étape, nous allons ajouter une ligne de meilleure ajustement à l'histogramme. Nous allons calculer les valeurs y pour la ligne et la tracer au-dessus de l'histogramme.

y = ((1 / (np.sqrt(2 * np.pi) * sigma)) *
     np.exp(-0.5 * (1 / sigma * (bins - mu))**2))
ax.plot(bins, y, '--')

Personnalisez l'histogramme

Dans cette étape, nous allons personnaliser l'histogramme en ajoutant des étiquettes, un titre et en ajustant la mise en page.

ax.set_xlabel('Smarts')
ax.set_ylabel('Probabilité de densité')
ax.set_title(r'Histogramme de l'IQ : $\mu=100$, $\sigma=15$')
fig.tight_layout()
plt.show()

Sommaire

Dans ce laboratoire, nous avons appris à utiliser la bibliothèque Python Matplotlib pour créer un histogramme. Nous avons généré des données d'échantillonnage à partir d'une distribution normale et créé un histogramme à l'aide de matplotlib. Nous avons également ajouté une ligne de meilleure ajustement et personnalisé l'histogramme en ajoutant des étiquettes et un titre.