Introduction
Matplotlib est une bibliothèque populaire de visualisation de données en Python. Elle propose une variété de graphiques personnalisables pour l'exploration et la présentation de données. Dans ce laboratoire, nous allons apprendre à tracer des variables catégorielles à l'aide de Matplotlib.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.
Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez des commentaires après la session, et nous résoudrons rapidement le problème pour vous.
Import Matplotlib
La première étape consiste à importer la bibliothèque Matplotlib. Nous utiliserons également la bibliothèque numpy pour générer quelques données d'échantillonnage.
import matplotlib.pyplot as plt
import numpy as np
Préparer les données
Ensuite, nous allons préparer quelques données d'échantillonnage pour tracer. Nous allons créer un dictionnaire avec les comptes de différents fruits, puis extraire les clés et les valeurs dans des listes séparées.
data = {'apple': 10, 'orange': 15, 'lemon': 5, 'lime': 20}
names = list(data.keys())
values = list(data.values())
Diagramme en barres
Un diagramme en barres est un bon moyen d'afficher des données catégorielles. Nous pouvons créer un diagramme en barres à l'aide de la fonction bar.
plt.bar(names, values)
plt.title('Fruit Counts')
plt.xlabel('Fruit')
plt.ylabel('Count')
plt.show()
Nuage de points
Nous pouvons également créer un nuage de points pour montrer la relation entre deux variables catégorielles. Dans ce cas, nous utiliserons les mêmes données sur les fruits et ajouterons du bruit aléatoire aux comptes pour créer une deuxième variable.
noise = np.random.rand(len(values)) * 5
plt.scatter(names, values + noise)
plt.title('Fruit Counts with Noise')
plt.xlabel('Fruit')
plt.ylabel('Count')
plt.show()
Diagramme en ligne
Un diagramme en ligne peut être utilisé pour montrer comment une variable catégorielle change au fil du temps. Dans cet exemple, nous utiliserons des données sur les niveaux de bonheur des chats et des chiens pendant différentes activités.
cat = ["bored", "happy", "bored", "bored", "happy", "bored"]
dog = ["happy", "happy", "happy", "happy", "bored", "bored"]
activity = ["combing", "drinking", "feeding", "napping", "playing", "washing"]
plt.plot(activity, dog, label="dog")
plt.plot(activity, cat, label="cat")
plt.title('Happiness Levels')
plt.xlabel('Activity')
plt.ylabel('Happiness')
plt.legend()
plt.show()
Sommaire
Dans ce laboratoire, nous avons appris à tracer des variables catégorielles à l'aide de Matplotlib. Nous avons créé des diagrammes en barres, des nuages de points et des diagrammes en ligne pour visualiser différents types de données catégorielles. En personnalisant les étiquettes des axes, les titres et les légendes, nous pouvons créer des graphiques informatifs et visuellement attrayants pour communiquer efficacement nos données.