Arbeiten mit Spalten in Pandas

PythonPythonBeginner
Jetzt üben

This tutorial is from open-source community. Access the source code

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab lernen wir, wie wir mit Spalten in Pandas arbeiten. Wir werden untersuchen, wie man neue Spalten aus bestehenden erstellt, mathematische und logische Operationen auf Spalten anwendet, Spaltenbezeichnungen umbenennt und Spaltenweise-Operationen mit der apply-Methode durchführt.

VM-Tipps

Nachdem die VM gestartet ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Operationen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie während des Lernens Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Pandas importieren und Daten laden

Zunächst importieren wir die pandas-Bibliothek und laden die Luftqualitätsdaten aus einer CSV-Datei.

## Import pandas library
import pandas as pd

## Load air quality data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)

Eine neue Spalte erstellen

Wir werden eine neue Spalte namens "london_mg_per_cubic" erstellen, indem wir die Spalte "station_london" mit einem Umrechnungsfaktor multiplizieren.

## Create new column by multiplying "station_london" by conversion factor
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882

Überprüfen des Verhältnisses von Werten in zwei Spalten

Als nächstes überprüfen wir das Verhältnis der Werte in den Spalten "station_paris" und "station_antwerp" und speichern das Ergebnis in einer neuen Spalte.

## Create new column by dividing "station_paris" by "station_antwerp"
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]

Spaltenbezeichnungen umbenennen

Wir werden die Spaltenbezeichnungen umbenennen, um den von OpenAQ verwendeten Stationenbezeichnern zu entsprechen.

## Rename column labels
air_quality_renamed = air_quality.rename(
    columns={
        "station_antwerp": "BETR801",
        "station_paris": "FR04014",
        "station_london": "London Westminster",
    }
)

Spaltenbezeichnungen in Kleinbuchstaben umwandeln

Schließlich werden wir die Spaltenbezeichnungen mit einer Funktion in Kleinbuchstaben umwandeln.

## Convert column labels to lowercase
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)

Zusammenfassung

In diesem Lab haben wir gelernt, wie man neue Spalten aus vorhandenen erstellt, mathematische und logische Operationen auf Spalten durchführt, Spaltenbezeichnungen umbenennt und Spaltenbezeichnungen in Kleinbuchstaben umwandelt. Mit diesen Fähigkeiten können wir Daten in pandas effektiver manipulieren und transformieren.