Pandas DataFrame Boxplot Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab lernst du, wie du die boxplot()-Methode in der Pandas-Bibliothek verwendest, um Boxplots aus Spalten eines DataFrames zu erstellen. Ein Boxplot, auch bekannt als Box-and-Whisker Plot, ist eine grafische Darstellung, die die fünf Zahlen der Summen eines Datensatzes zeigt: Minimum, erstes Quartil, Median, drittes Quartil und Maximum.

VM-Tipps

Nachdem der VM-Start abgeschlossen ist, klicke in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal musst du einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn du bei der Lernphase Probleme hast, kannst du Labby gerne fragen. Gib nach der Sitzung Feedback, und wir werden das Problem für dich prompt beheben.

Importiere die erforderlichen Bibliotheken

Um zu beginnen, musst du die erforderlichen Bibliotheken importieren. In diesem Fall wirst du die Pandas-Bibliothek verwenden.

import pandas as pd

Erstelle einen DataFrame

Als nächstes wirst du einen DataFrame erstellen, mit dem du arbeiten kannst. Dies kann durch Übergabe eines Wörterbuchs oder einer Liste von Listen an die pd.DataFrame()-Funktion erreicht werden. Für dieses Beispiel erstellen wir einen DataFrame mit den Noten von Schülern in verschiedenen Fächern.

df = pd.DataFrame([
    ['Abhishek', 75, 80, 90],
    ['Anurag', 80, 90, 95],
    ['Bavya', 80, 82, 85],
    ['Bavana', 95, 92, 92],
    ['Chetan', 85, 90, 89]
], columns=['Name', 'Maths', 'Science', 'Social'])

Generiere einen Boxplot

Jetzt kannst du die boxplot()-Methode verwenden, um einen Boxplot aus den Spalten des DataFrames zu generieren. Dies kann durch Übergabe der Spaltennamen als Liste an den column-Parameter erreicht werden. Beispielsweise um einen Boxplot für die Spalte 'Social' zu erstellen:

boxplot = df.boxplot(column=['Social'])

Die boxplot()-Methode gibt ein Axes-Objekt zurück, das verwendet werden kann, um das Diagramm gegebenenfalls weiter anzupassen.

Anpassen des Boxplots

Du kannst das Aussehen des Boxplots anpassen, indem du verschiedene Parameter der boxplot()-Methode verwendest. Beispielsweise kannst du die Schriftgröße der Skalenbeschriftungen mit dem Parameter fontsize anpassen, die Beschriftungen mit dem Parameter rot drehen und das Gitter mit dem Parameter grid anzeigen oder ausblenden.

boxplot = df.boxplot(column=['Social'], fontsize=12, rot=45, grid=True)

Gruppiere Daten und erstelle mehrere Boxplots

Wenn du die Daten zwischen verschiedenen Gruppen vergleichen möchtest, kannst du den Parameter by verwenden, um die Daten basierend auf einer bestimmten Spalte zu gruppieren. Beispielsweise um einen Boxplot für die Spalte 'Social' zu erstellen, gruppiert nach der Spalte 'DOB':

boxplot = df.boxplot(column=['Social'], by='DOB')

Dies wird für jede einzelne Zahl in der Spalte 'DOB' einen eigenen Boxplot erzeugen.

Zusammenfassung

In diesem Lab hast du gelernt, wie du die boxplot()-Methode in der Pandas-Bibliothek verwendest, um Boxplots aus den Spalten eines DataFrames zu erstellen. Du hast gelernt, wie du das Aussehen des Boxplots anpassen kannst und wie du Daten gruppieren, um mehrere Boxplots zu erstellen. Boxplots sind ein nützliches Visualisierungstool, um die Verteilung und Variabilität von Daten zu verstehen. Sie liefern einen visuellen Überblick, der Informationen wie die Median, Quartile und alle Ausreißer in der Datensatz enthält. Dies kann helfen, Trends, Muster und Anomalien in den Daten zu identifizieren.