Matplotlib Visualisierungen für die Datenanalyse

Beginner

This tutorial is from open-source community. Access the source code

Einführung

In diesem Tutorial lernen Sie, wie Sie Matplotlib verwenden, um Visualisierungen in Python zu erstellen. Matplotlib ist eine beliebte Datenvisualisierungsbibliothek in Python, die verwendet wird, um eine Vielzahl von Diagrammen und Grafiken zu erstellen. Mit Matplotlib können Sie Linienplots, Streudiagramme, Balkendiagramme, Histogramme und viele andere Arten von Visualisierungen erstellen.

Tipps für die virtuelle Maschine

Nachdem der Start der virtuellen Maschine abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Matplotlib importieren

Bevor wir irgendwelche Visualisierungen erstellen, müssen wir die Matplotlib-Bibliothek importieren. Wir werden auch die NumPy-Bibliothek verwenden, um einige Beispiel-Daten zu generieren.

import matplotlib.pyplot as plt
import numpy as np

Beispiel-Daten erstellen

Lassen Sie uns einige Beispiel-Daten erstellen, die wir verwenden werden, um Visualisierungen zu erstellen. Wir werden vier Datensätze generieren, jeder mit 11 x,y-Datenpunkten.

x = [10, 8, 13, 9, 11, 14, 6, 4, 12, 7, 5]
y1 = [8.04, 6.95, 7.58, 8.81, 8.33, 9.96, 7.24, 4.26, 10.84, 4.82, 5.68]
y2 = [9.14, 8.14, 8.74, 8.77, 9.26, 8.10, 6.13, 3.10, 9.13, 7.26, 4.74]
y3 = [7.46, 6.77, 12.74, 7.11, 7.81, 8.84, 6.08, 5.39, 8.15, 6.42, 5.73]
x4 = [8, 8, 8, 8, 8, 8, 8, 19, 8, 8, 8]
y4 = [6.58, 5.76, 7.71, 8.84, 8.47, 7.04, 5.25, 12.50, 5.56, 7.91, 6.89]

Ein Diagramm mit Teildiagrammen erstellen

Jetzt werden wir ein Diagramm mit vier Teildiagrammen erstellen, eines für jeden Datensatz. Wir werden auch die x- und y-Bereiche für alle Teildiagramme gleich setzen.

fig, axs = plt.subplots(2, 2, sharex=True, sharey=True, figsize=(6, 6),
                        gridspec_kw={'wspace': 0.08, 'hspace': 0.08})
axs[0, 0].set(xlim=(0, 20), ylim=(2, 14))
axs[0, 0].set(xticks=(0, 10, 20), yticks=(4, 8, 12))

Die Daten plotten

Für jedes Teildiagramm werden wir die x- und y-Datenpunkte plotten und eine lineare Regressionslinie hinzufügen. Wir werden auch einen Textrahmen mit einigen Statistiken zu den Daten hinzufügen.

datasets = {
    'I': (x, y1),
    'II': (x, y2),
    'III': (x, y3),
    'IV': (x4, y4)
}

for ax, (label, (x, y)) in zip(axs.flat, datasets.items()):
    ax.text(0.1, 0.9, label, fontsize=20, transform=ax.transAxes, va='top')
    ax.tick_params(direction='in', top=True, right=True)
    ax.plot(x, y, 'o')

    ## lineare Regression
    p1, p0 = np.polyfit(x, y, deg=1)  ## Steigung, Achsenabschnitt
    ax.axline(xy1=(0, p0), slope=p1, color='r', lw=2)

    ## Textrahmen für die Statistiken hinzufügen
    stats = (f'$\\mu$ = {np.mean(y):.2f}\n'
             f'$\\sigma$ = {np.std(y):.2f}\n'
             f'$r$ = {np.corrcoef(x, y)[0][1]:.2f}')
    bbox = dict(boxstyle='round', fc='blanchedalmond', ec='orange', alpha=0.5)
    ax.text(0.95, 0.07, stats, fontsize=9, bbox=bbox,
            transform=ax.transAxes, horizontalalignment='right')

plt.show()

Die Ergebnisse interpretieren

Die resultierende Visualisierung ist eine Gruppe von vier Teildiagrammen, wobei jedes ein unterschiedlicher Datensatz zeigt. Die x- und y-Bereiche sind für alle Teildiagramme gleich. Jedes Teildiagramm enthält die x- und y-Datenpunkte sowie eine lineare Regressionslinie. Der Textrahmen in der unteren rechten Ecke jedes Teildiagramms zeigt einige Statistiken zu den Daten, einschließlich des Mittelwerts, der Standardabweichung und des Korrelationskoeffizienten.

Zusammenfassung

In diesem Tutorial haben Sie gelernt, wie Sie Matplotlib verwenden, um Visualisierungen in Python zu erstellen. Sie haben gelernt, wie Sie ein Diagramm mit Teildiagrammen erstellen, Datenpunkte plotten, eine lineare Regressionslinie hinzufügen und einen Textrahmen mit Statistiken zu den Daten hinzufügen. Mit Matplotlib können Sie eine Vielzahl von Visualisierungen erstellen, um Ihre Daten zu untersuchen und zu analysieren.