Tracé de valeurs masquées et de NaN

PythonPythonBeginner
Pratiquer maintenant

This tutorial is from open-source community. Access the source code

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans la visualisation de données, il est courant de rencontrer des données manquantes qui doivent être tracées. Dans ce tutoriel, nous allons apprendre à tracer des données avec des valeurs manquantes à l'aide de Matplotlib. Nous explorerons trois méthodes : supprimer les points de données indésirables, masquer les points et définir des valeurs à NaN.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet d'étude pour accéder au carnet Jupyter pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que le carnet Jupyter ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations du carnet Jupyter.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez des commentaires après la session, et nous réglerons rapidement le problème pour vous.

Importez les bibliothèques requises

Nous devons importer les bibliothèques que nous utiliserons dans ce tutoriel. Nous utiliserons Matplotlib et NumPy.

import matplotlib.pyplot as plt
import numpy as np

Créez des données pour le tracé

Nous allons créer des données pour le tracé à l'aide de NumPy. Nous allons générer 31 points de données entre -pi/2 et pi/2 et calculer le cosinus de ces valeurs élevées à la puissance 3.

x = np.linspace(-np.pi/2, np.pi/2, 31)
y = np.cos(x)**3

Supprimez les points

Nous allons supprimer les points où y > 0,7. Nous allons créer un nouveau tableau x et un tableau y ne contenant que les points restants.

x2 = x[y <= 0.7]
y2 = y[y <= 0.7]

Masquez les points

Nous allons masquer les points où y > 0,7 à l'aide d'un tableau masqué. Nous allons créer un nouveau tableau y avec des valeurs masquées.

y3 = np.ma.masked_where(y > 0.7, y)

Affectez NaN

Nous allons affecter NaN là où y > 0,7. Nous allons créer un nouveau tableau y avec des valeurs NaN.

y4 = y.copy()
y4[y3 > 0.7] = np.nan

Tracez les données

Nous allons tracer les quatre jeux de données en utilisant des marqueurs et des couleurs différents pour les distinguer.

plt.plot(x*0.1, y, 'o-', color='lightgrey', label='No mask')
plt.plot(x2*0.4, y2, 'o-', label='Points removed')
plt.plot(x*0.7, y3, 'o-', label='Masked values')
plt.plot(x*1.0, y4, 'o-', label='NaN values')
plt.legend()
plt.title('Masked and NaN data')
plt.show()

Interprétez le tracé

Le tracé obtenu aura quatre lignes de couleurs et de marqueurs différents. La première ligne (gris clair) représente les données originales sans masquage. La deuxième ligne (orange) représente les données avec les points indésirables supprimés. La troisième ligne (verte) représente les données avec des valeurs masquées. La quatrième ligne (bleue) représente les données avec des valeurs NaN. Ce tracé montre comment les données manquantes peuvent être visualisées en utilisant différentes méthodes.

Sommaire

Dans ce tutoriel, nous avons appris à tracer des données avec des valeurs manquantes à l'aide de Matplotlib. Nous avons exploré trois méthodes : supprimer les points de données indésirables, masquer les points et affecter des valeurs NaN. Nous avons créé des données à tracer à l'aide de NumPy et utilisé différents marqueurs et couleurs pour différencier les jeux de données. Nous avons également interprété le tracé obtenu pour comprendre les différentes méthodes de visualisation des données manquantes.