Streudiagramm mit Histogrammen

PythonPythonBeginner
Jetzt üben

This tutorial is from open-source community. Access the source code

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden Sie lernen, wie Sie mit Matplotlib einen Streudiagramm mit Histogrammen erstellen. Ein Streudiagramm mit Histogrammen ist eine ausgezeichnete Möglichkeit, die Verteilung zweier Variablen und deren Beziehung zu visualisieren. Das Streudiagramm zeigt die Beziehung zwischen den beiden Variablen, während die Histogramme die Verteilung jeder Variablen unabhängig voneinander darstellen.

Tipps für die virtuelle Maschine (VM)

Nachdem die VM gestartet ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen von Jupyter Notebook nicht automatisiert werden.

Wenn Sie während des Lernens Probleme haben, können Sie Labby um Hilfe bitten. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem für Sie prompt beheben.

Bibliotheken importieren

Bevor wir beginnen können, müssen wir die erforderlichen Bibliotheken importieren. In diesem Lab werden wir Matplotlib und NumPy verwenden.

import matplotlib.pyplot as plt
import numpy as np

Zufällige Daten generieren

Wir werden einige zufällige Daten generieren, um sie für das Streudiagramm und die Histogramme zu verwenden.

## Fixing random state for reproducibility
np.random.seed(19680801)

## Generate random data
x = np.random.randn(1000)
y = np.random.randn(1000)

Definiere die scatter_hist-Funktion

Wir müssen die scatter_hist-Funktion definieren, die x- und y-Daten sowie drei Achsen annimmt: die Hauptachse für das Streudiagramm und zwei Randachsen. Anschließend wird das Streudiagramm und die Histogramme innerhalb der bereitgestellten Achsen erstellt.

def scatter_hist(x, y, ax, ax_histx, ax_histy):
    ## Entferne die Beschriftungen von den Histogrammen
    ax_histx.tick_params(axis="x", labelbottom=False)
    ax_histy.tick_params(axis="y", labelleft=False)

    ## Erstelle das Streudiagramm
    ax.scatter(x, y)

    ## Bestimme schöne Grenzen manuell
    binwidth = 0.25
    xymax = max(np.max(np.abs(x)), np.max(np.abs(y)))
    lim = (int(xymax/binwidth) + 1) * binwidth

    bins = np.arange(-lim, lim + binwidth, binwidth)
    ax_histx.hist(x, bins=bins)
    ax_histy.hist(y, bins=bins, orientation='horizontal')

Definiere die Achsenpositionen mit einem gridspec

Wir werden nun ein gridspec mit ungleichen Breiten- und Höhenverhältnissen definieren, um das gewünschte Layout zu erreichen. Wir werden auch die Achsen erstellen und sie an die scatter_hist-Funktion übergeben.

## Beginne mit einer quadratischen Figur.
fig = plt.figure(figsize=(6, 6))
## Füge ein gridspec mit zwei Zeilen und zwei Spalten und einem Verhältnis von 1 zu 4 zwischen
## der Größe der Randachsen und der Hauptachsen in beiden Richtungen hinzu.
## Passt auch die Subplot-Parameter für ein quadratisches Diagramm an.
gs = fig.add_gridspec(2, 2,  width_ratios=(4, 1), height_ratios=(1, 4),
                      left=0.1, right=0.9, bottom=0.1, top=0.9,
                      wspace=0.05, hspace=0.05)
## Erstelle die Achsen.
ax = fig.add_subplot(gs[1, 0])
ax_histx = fig.add_subplot(gs[0, 0], sharex=ax)
ax_histy = fig.add_subplot(gs[1, 1], sharey=ax)
## Zeichne das Streudiagramm und die Marginalien.
scatter_hist(x, y, ax, ax_histx, ax_histy)

Definiere die Achsenpositionen mit inset_axes

Wir können auch inset_axes verwenden, um die Marginalien außerhalb der Hauptachsen zu positionieren. Der Vorteil dabei ist, dass das Seitenverhältnis der Hauptachsen fixiert werden kann und die Marginalien immer relativ zur Position der Achsen gezeichnet werden.

## Erstelle eine Figur, die nicht quadratisch sein muss.
fig = plt.figure(layout='constrained')
## Erstelle die Hauptachsen, wobei 25% des Figurbereichs oben und rechts für die Positionierung von Marginalien frei gelassen werden.
ax = fig.add_gridspec(top=0.75, right=0.75).subplots()
## Das Seitenverhältnis der Hauptachsen kann fixiert werden.
ax.set(aspect=1)
## Erstelle Marginalachsen, die 25% der Größe der Hauptachsen haben.
## Beachten Sie, dass die inset-Achsen außerhalb (rechts und oben) der Hauptachsen positioniert werden,
## indem Achsenkoordinaten größer als 1 angegeben werden.
## Achsenkoordinaten kleiner als 0 würden ebenfalls Positionen links und unten der Hauptachsen angeben.
ax_histx = ax.inset_axes([0, 1.05, 1, 0.25], sharex=ax)
ax_histy = ax.inset_axes([1.05, 0, 0.25, 1], sharey=ax)
## Zeichne das Streudiagramm und die Marginalien.
scatter_hist(x, y, ax, ax_histx, ax_histy)

Zeige das Diagramm an

Schließlich können wir das Diagramm mit plt.show() anzeigen.

plt.show()

Zusammenfassung

In diesem Lab haben wir gelernt, wie man mit Matplotlib ein Streudiagramm mit Histogrammen erstellt. Wir haben die scatter_hist-Funktion definiert, zufällige Daten generiert, die Achsenpositionen mit einem gridspec und inset_axes definiert und das Diagramm angezeigt. Streudiagramme mit Histogrammen sind eine großartige Möglichkeit, die Verteilung zweier Variablen und deren Beziehung zu visualisieren.