Arbeiten mit Spalten in Pandas

Beginner

This tutorial is from open-source community. Access the source code

Einführung

In diesem Lab lernen wir, wie wir mit Spalten in Pandas arbeiten. Wir werden untersuchen, wie man neue Spalten aus bestehenden erstellt, mathematische und logische Operationen auf Spalten anwendet, Spaltenbezeichnungen umbenennt und Spaltenweise-Operationen mit der apply-Methode durchführt.

VM-Tipps

Nachdem die VM gestartet ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Operationen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie während des Lernens Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Dies ist ein Guided Lab, das schrittweise Anweisungen bietet, um Ihnen beim Lernen und Üben zu helfen. Befolgen Sie die Anweisungen sorgfältig, um jeden Schritt abzuschließen und praktische Erfahrungen zu sammeln. Historische Daten zeigen, dass dies ein Labor der Stufe Anfänger mit einer Abschlussquote von 98% ist. Es hat eine positive Bewertungsrate von 100% von den Lernenden erhalten.

Pandas importieren und Daten laden

Zunächst importieren wir die pandas-Bibliothek und laden die Luftqualitätsdaten aus einer CSV-Datei.

## Import pandas library
import pandas as pd

## Load air quality data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)

Eine neue Spalte erstellen

Wir werden eine neue Spalte namens "london_mg_per_cubic" erstellen, indem wir die Spalte "station_london" mit einem Umrechnungsfaktor multiplizieren.

## Create new column by multiplying "station_london" by conversion factor
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882

Überprüfen des Verhältnisses von Werten in zwei Spalten

Als nächstes überprüfen wir das Verhältnis der Werte in den Spalten "station_paris" und "station_antwerp" und speichern das Ergebnis in einer neuen Spalte.

## Create new column by dividing "station_paris" by "station_antwerp"
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]

Spaltenbezeichnungen umbenennen

Wir werden die Spaltenbezeichnungen umbenennen, um den von OpenAQ verwendeten Stationenbezeichnern zu entsprechen.

## Rename column labels
air_quality_renamed = air_quality.rename(
    columns={
        "station_antwerp": "BETR801",
        "station_paris": "FR04014",
        "station_london": "London Westminster",
    }
)

Spaltenbezeichnungen in Kleinbuchstaben umwandeln

Schließlich werden wir die Spaltenbezeichnungen mit einer Funktion in Kleinbuchstaben umwandeln.

## Convert column labels to lowercase
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)

Zusammenfassung

In diesem Lab haben wir gelernt, wie man neue Spalten aus vorhandenen erstellt, mathematische und logische Operationen auf Spalten durchführt, Spaltenbezeichnungen umbenennt und Spaltenbezeichnungen in Kleinbuchstaben umwandelt. Mit diesen Fähigkeiten können wir Daten in pandas effektiver manipulieren und transformieren.