Einführung
In diesem Lab lernen wir, wie wir mit Spalten in Pandas arbeiten. Wir werden untersuchen, wie man neue Spalten aus bestehenden erstellt, mathematische und logische Operationen auf Spalten anwendet, Spaltenbezeichnungen umbenennt und Spaltenweise-Operationen mit der apply-Methode durchführt.
VM-Tipps
Nachdem die VM gestartet ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.
Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Operationen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.
Wenn Sie während des Lernens Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.
Pandas importieren und Daten laden
Zunächst importieren wir die pandas-Bibliothek und laden die Luftqualitätsdaten aus einer CSV-Datei.
## Import pandas library
import pandas as pd
## Load air quality data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
Eine neue Spalte erstellen
Wir werden eine neue Spalte namens "london_mg_per_cubic" erstellen, indem wir die Spalte "station_london" mit einem Umrechnungsfaktor multiplizieren.
## Create new column by multiplying "station_london" by conversion factor
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882
Überprüfen des Verhältnisses von Werten in zwei Spalten
Als nächstes überprüfen wir das Verhältnis der Werte in den Spalten "station_paris" und "station_antwerp" und speichern das Ergebnis in einer neuen Spalte.
## Create new column by dividing "station_paris" by "station_antwerp"
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]
Spaltenbezeichnungen umbenennen
Wir werden die Spaltenbezeichnungen umbenennen, um den von OpenAQ verwendeten Stationenbezeichnern zu entsprechen.
## Rename column labels
air_quality_renamed = air_quality.rename(
columns={
"station_antwerp": "BETR801",
"station_paris": "FR04014",
"station_london": "London Westminster",
}
)
Spaltenbezeichnungen in Kleinbuchstaben umwandeln
Schließlich werden wir die Spaltenbezeichnungen mit einer Funktion in Kleinbuchstaben umwandeln.
## Convert column labels to lowercase
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)
Zusammenfassung
In diesem Lab haben wir gelernt, wie man neue Spalten aus vorhandenen erstellt, mathematische und logische Operationen auf Spalten durchführt, Spaltenbezeichnungen umbenennt und Spaltenbezeichnungen in Kleinbuchstaben umwandelt. Mit diesen Fähigkeiten können wir Daten in pandas effektiver manipulieren und transformieren.