Das Zeichnen von kategorischen Daten mit Matplotlib

MatplotlibMatplotlibBeginner
Jetzt üben

This tutorial is from open-source community. Access the source code

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

Matplotlib ist eine beliebte Datenvisualisierungsbibliothek in Python. Es bietet eine Vielzahl von anpassbaren Diagrammen und Grafiken für die Datenexploration und -präsentation. In diesem Lab werden wir lernen, wie man kategorische Variablen mit Matplotlib darstellt.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Matplotlib importieren

Der erste Schritt besteht darin, die Matplotlib-Bibliothek zu importieren. Wir werden auch die numpy-Bibliothek verwenden, um einige Beispiel-Daten zu generieren.

import matplotlib.pyplot as plt
import numpy as np

Daten vorbereiten

Als nächstes werden wir einige Beispiel-Daten für das Plotten vorbereiten. Wir werden ein Dictionary mit den Zählungen verschiedener Früchte erstellen und dann die Schlüssel und Werte in separate Listen extrahieren.

data = {'apple': 10, 'orange': 15, 'lemon': 5, 'lime': 20}
names = list(data.keys())
values = list(data.values())

Balkendiagramm

Ein Balkendiagramm ist eine gute Möglichkeit, um kategorische Daten darzustellen. Wir können ein Balkendiagramm mit der bar-Funktion erstellen.

plt.bar(names, values)
plt.title('Fruit Counts')
plt.xlabel('Fruit')
plt.ylabel('Count')
plt.show()

Streudiagramm

Wir können auch ein Streudiagramm erstellen, um die Beziehung zwischen zwei kategorischen Variablen zu zeigen. In diesem Fall werden wir die gleichen Frucht-Daten verwenden und der Anzahl zufälliger Störungen hinzufügen, um eine zweite Variable zu erstellen.

noise = np.random.rand(len(values)) * 5
plt.scatter(names, values + noise)
plt.title('Fruit Counts with Noise')
plt.xlabel('Fruit')
plt.ylabel('Count')
plt.show()

Liniendiagramm

Ein Liniendiagramm kann verwendet werden, um zu zeigen, wie sich eine kategorische Variable über die Zeit ändert. In diesem Beispiel werden wir Daten über die Zufriedenheitsgrade von Katzen und Hunden während verschiedener Aktivitäten verwenden.

cat = ["bored", "happy", "bored", "bored", "happy", "bored"]
dog = ["happy", "happy", "happy", "happy", "bored", "bored"]
activity = ["combing", "drinking", "feeding", "napping", "playing", "washing"]
plt.plot(activity, dog, label="dog")
plt.plot(activity, cat, label="cat")
plt.title('Happiness Levels')
plt.xlabel('Activity')
plt.ylabel('Happiness')
plt.legend()
plt.show()

Zusammenfassung

In diesem Lab haben wir gelernt, wie man kategorische Variablen mit Matplotlib darstellt. Wir haben Balkendiagramme, Streudiagramme und Liniendiagramme erstellt, um verschiedene Arten von kategorischen Daten zu visualisieren. Indem wir die Achsenbeschriftungen, Titel und Legenden anpassen, können wir informierende und visuell ansprechende Diagramme erstellen, um unsere Daten effektiv zu kommunizieren.