Pandas Plotting für die Luftqualitätsanalyse

PythonPythonBeginner
Jetzt üben

This tutorial is from open-source community. Access the source code

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab lernen wir, wie man mit Pandas, einer leistungsstarken Datenmanipulationsbibliothek in Python, Diagramme erstellt. Wir werden reale Luftqualitätsdaten für praktische Illustrationen verwenden. Am Ende dieses Labs sollten Sie in der Lage sein, mit Pandas Linien-, Streu-, Boxplot zu erstellen und Ihre Diagramme anzupassen.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importieren der erforderlichen Bibliotheken

Zunächst müssen wir die erforderlichen Bibliotheken importieren. Wir werden Pandas für die Datenmanipulation und Matplotlib für die Datenvisualisierung verwenden.

## Importing necessary libraries
import pandas as pd
import matplotlib.pyplot as plt

Laden der Daten

Wir werden für diesen Tutorial Luftqualitätsdaten verwenden. Die Daten werden aus einer CSV-Datei in einen Pandas DataFrame geladen.

## Loading the data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
air_quality.head()

Erstellen eines Liniendiagramms

Standardmäßig erstellt Pandas für jede Spalte mit numerischen Daten ein Liniendiagramm. Dies gibt uns einen schnellen visuellen Überblick über die Daten.

## Creating a line plot
air_quality.plot()
plt.show()

Erstellen eines Diagramms für eine bestimmte Spalte

Um ein Diagramm für eine bestimmte Spalte zu erstellen, können wir die Auswahlmethode in Kombination mit der Plotmethode verwenden.

## Creating a plot for a specific column
air_quality["station_paris"].plot()
plt.show()

Erstellen eines Punktdiagramms

Um die gemessenen NO2-Werte in London und Paris visuell zu vergleichen, können wir ein Punktdiagramm erstellen.

## Creating a scatter plot
air_quality.plot.scatter(x="station_london", y="station_paris", alpha=0.5)
plt.show()

Erstellen eines Boxplots

Ein Boxplot gibt uns einen guten Überblick über die Datenverteilung. Wir können einen Boxplot für unsere Luftqualitätsdaten erstellen.

## Creating a box plot
air_quality.plot.box()
plt.show()

Erstellen von Teilplots für jede Spalte

Wir können separate Teilplots für jede der Datenspalten erstellen, indem wir das Argument subplots verwenden.

## Creating subplots for each column
axs = air_quality.plot.area(figsize=(12, 4), subplots=True)
plt.show()

Anpassen und Speichern des Diagramms

Wir können das Diagramm mit den Anpassungsmöglichkeiten von Matplotlib weiter anpassen. Wir können das Diagramm auch in eine Datei speichern.

## Customizing and saving the plot
fig, axs = plt.subplots(figsize=(12, 4))
air_quality.plot.area(ax=axs)
axs.set_ylabel("NO$_2$ Konzentration")
fig.savefig("no2_concentrations.png")
plt.show()

Zusammenfassung

In diesem Lab haben wir gelernt, wie man verschiedene Arten von Diagrammen mit Pandas erstellt. Wir haben auch gelernt, wie man diese Diagramme anpasst und speichert. Dieses Wissen wird sehr nützlich für die Datenanalyse und -visualisierung sein.