Création d'un graphique de dispersion avec Matplotlib en Python

Beginner

This tutorial is from open-source community. Access the source code

Introduction

Cette procédure pas à pas vous guidera dans l'utilisation de la bibliothèque Matplotlib de Python pour créer des visualisations. Matplotlib est une bibliothèque de visualisation de données qui permet aux utilisateurs de créer une large gamme de visualisations, y compris des graphiques linéaires, des graphiques de dispersion et des histogrammes. Dans ce laboratoire, nous allons créer un graphique de dispersion simple à l'aide de Matplotlib.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet d'adresses pour accéder au carnet Jupyter pour pratiquer.

Parfois, vous devrez peut-être attendre quelques secondes pour que le carnet Jupyter ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations du carnet Jupyter.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importation des bibliothèques

Avant de commencer à créer notre visualisation, nous devons importer les bibliothèques nécessaires. Dans cet exemple, nous allons utiliser numpy et matplotlib.pyplot.

import matplotlib.pyplot as plt
import numpy as np

Création de données

Ensuite, nous allons créer des données aléatoires à utiliser dans notre visualisation. Dans cet exemple, nous allons créer deux tableaux de données aléatoires à l'aide de numpy.

## Fixing random state for reproducibility
np.random.seed(19680801)

x = np.random.rand(20)
y = 1e7 * np.random.rand(20)

Création du graphique

Maintenant que nous avons nos données, nous pouvons créer notre graphique à l'aide de Matplotlib. Dans cet exemple, nous allons créer un graphique de dispersion à l'aide de la fonction plot().

fig, ax = plt.subplots()
plt.plot(x, y, 'o')

Formater le graphique

Pour rendre notre graphique plus lisible, nous pouvons le formater à l'aide des fonctions de formatage de Matplotlib. Dans cet exemple, nous allons formater les étiquettes de l'axe des y pour afficher les valeurs en millions.

def millions(x):
    return '$%1.1fM' % (x * 1e-6)

ax.fmt_ydata = millions

Afficher le graphique

Enfin, nous pouvons afficher notre graphique à l'aide de la fonction show() de Matplotlib.

plt.show()

Sommaire

Dans ce laboratoire, nous avons appris à utiliser Matplotlib pour créer un graphique de dispersion. Nous avons également appris à formater le graphique et à l'afficher. Matplotlib est une bibliothèque puissante qui peut être utilisée pour créer une large gamme de visualisations.