Streudiagramm mit maskierten Daten mit Matplotlib

PythonPythonBeginner
Jetzt üben

This tutorial is from open-source community. Access the source code

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Tutorial wird Ihnen die Erstellung eines Streudiagramms mit maskierten Datenpunkten mithilfe der Python-Bibliothek Matplotlib gezeigt. Wir werden auch eine Linie hinzufügen, um die maskierten Bereiche zu markieren.

Tipps für die virtuelle Maschine (VM)

Nachdem der Start der VM abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie während des Lernens Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importieren der erforderlichen Bibliotheken und Festlegen des Zufallszufalls

Wir beginnen mit dem Importieren der erforderlichen Bibliotheken und dem Festlegen des Zufallszufalls, um die Reproduzierbarkeit zu gewährleisten.

import matplotlib.pyplot as plt
import numpy as np

## Setting random seed for reproducibility
np.random.seed(19680801)

Generieren von Daten für das Streudiagramm

Als nächstes generieren wir die Daten für das Streudiagramm. Wir erstellen 100 Datenpunkte mit zufälligen x- und y-Werten zwischen 0 und 0,9 und zufälligen Radien zwischen 0 und 10. Die Farbe jedes Datenpunkts wird durch die Quadratwurzel seiner Fläche bestimmt.

N = 100
r0 = 0.6
x = 0.9 * np.random.rand(N)
y = 0.9 * np.random.rand(N)
area = (20 * np.random.rand(N))**2  ## 0 bis 10 Punktradien
c = np.sqrt(area)

Maskieren von Datenpunkten und Erstellen eines Streudiagramms

Wir maskieren die Datenpunkte basierend auf ihrem Abstand vom Ursprung. Datenpunkte mit einem Abstand kleiner als r0 werden in area1 maskiert, und diejenigen mit einem Abstand größer oder gleich r0 werden in area2 maskiert. Anschließend erstellen wir ein Streudiagramm der maskierten Datenpunkte mit marker='^' und marker='o' für area1 und area2 respective.

r = np.sqrt(x ** 2 + y ** 2)
area1 = np.ma.masked_where(r < r0, area)
area2 = np.ma.masked_where(r >= r0, area)
plt.scatter(x, y, s=area1, marker='^', c=c)
plt.scatter(x, y, s=area2, marker='o', c=c)

Hinzufügen einer Linie, um die maskierten Bereiche zu markieren

Schließlich fügen wir eine Linie hinzu, um die maskierten Bereiche zu markieren. Wir erstellen ein Array von theta-Werten und zeichnen einen Kreis mit dem Radius r0 mithilfe von np.cos(theta) und np.sin(theta).

## Show the boundary between the regions:
theta = np.arange(0, np.pi / 2, 0.01)
plt.plot(r0 * np.cos(theta), r0 * np.sin(theta))

Anzeigen des Streudiagramms

Wir zeigen das Streudiagramm mit plt.show() an.

plt.show()

Zusammenfassung

In diesem Tutorial haben wir gelernt, wie man mit der Python-Bibliothek Matplotlib ein Streudiagramm mit maskierten Datenpunkten erstellt. Wir haben auch eine Linie hinzugefügt, um die maskierten Bereiche zu markieren. Wir haben begonnen, indem wir die erforderlichen Bibliotheken importiert und den Zufallszahlengenerator initialisiert haben. Anschließend haben wir die Daten für das Streudiagramm generiert und die Datenpunkte basierend auf ihrem Abstand vom Ursprung maskiert. Danach haben wir ein Streudiagramm der maskierten Datenpunkte erstellt und eine Linie hinzugefügt, um die maskierten Bereiche zu markieren. Schließlich haben wir das Streudiagramm angezeigt.