Einführung
Matplotlib ist eine beliebte Datenvisualisierungsbibliothek in Python. Es bietet eine Vielzahl von anpassbaren Diagrammen und Grafiken für die Datenexploration und -präsentation. In diesem Lab werden wir lernen, wie man kategorische Variablen mit Matplotlib darstellt.
Tipps für die VM
Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.
Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.
Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.
Matplotlib importieren
Der erste Schritt besteht darin, die Matplotlib-Bibliothek zu importieren. Wir werden auch die numpy-Bibliothek verwenden, um einige Beispiel-Daten zu generieren.
import matplotlib.pyplot as plt
import numpy as np
Daten vorbereiten
Als nächstes werden wir einige Beispiel-Daten für das Plotten vorbereiten. Wir werden ein Dictionary mit den Zählungen verschiedener Früchte erstellen und dann die Schlüssel und Werte in separate Listen extrahieren.
data = {'apple': 10, 'orange': 15, 'lemon': 5, 'lime': 20}
names = list(data.keys())
values = list(data.values())
Balkendiagramm
Ein Balkendiagramm ist eine gute Möglichkeit, um kategorische Daten darzustellen. Wir können ein Balkendiagramm mit der bar-Funktion erstellen.
plt.bar(names, values)
plt.title('Fruit Counts')
plt.xlabel('Fruit')
plt.ylabel('Count')
plt.show()
Streudiagramm
Wir können auch ein Streudiagramm erstellen, um die Beziehung zwischen zwei kategorischen Variablen zu zeigen. In diesem Fall werden wir die gleichen Frucht-Daten verwenden und der Anzahl zufälliger Störungen hinzufügen, um eine zweite Variable zu erstellen.
noise = np.random.rand(len(values)) * 5
plt.scatter(names, values + noise)
plt.title('Fruit Counts with Noise')
plt.xlabel('Fruit')
plt.ylabel('Count')
plt.show()
Liniendiagramm
Ein Liniendiagramm kann verwendet werden, um zu zeigen, wie sich eine kategorische Variable über die Zeit ändert. In diesem Beispiel werden wir Daten über die Zufriedenheitsgrade von Katzen und Hunden während verschiedener Aktivitäten verwenden.
cat = ["bored", "happy", "bored", "bored", "happy", "bored"]
dog = ["happy", "happy", "happy", "happy", "bored", "bored"]
activity = ["combing", "drinking", "feeding", "napping", "playing", "washing"]
plt.plot(activity, dog, label="dog")
plt.plot(activity, cat, label="cat")
plt.title('Happiness Levels')
plt.xlabel('Activity')
plt.ylabel('Happiness')
plt.legend()
plt.show()
Zusammenfassung
In diesem Lab haben wir gelernt, wie man kategorische Variablen mit Matplotlib darstellt. Wir haben Balkendiagramme, Streudiagramme und Liniendiagramme erstellt, um verschiedene Arten von kategorischen Daten zu visualisieren. Indem wir die Achsenbeschriftungen, Titel und Legenden anpassen, können wir informierende und visuell ansprechende Diagramme erstellen, um unsere Daten effektiv zu kommunizieren.