DataFrame nach einer einzelnen Spalte mit sort_values sortieren
In diesem Schritt lernen Sie die gängigste Sortieroperation kennen: das Sortieren eines DataFrames nach den Werten in einer einzelnen Spalte. Hierfür verwenden wir die Methode sort_values(). Der Parameter by wird verwendet, um die Spalte anzugeben, nach der Sie sortieren möchten.
Öffnen Sie zunächst die Datei main.py im Verzeichnis ~/project über den Dateiexplorer auf der linken Seite. Diese Datei wurde bereits mit einem Beispiel-DataFrame vorab gefüllt.
Fügen Sie nun den folgenden Code am Ende von main.py hinzu, um den DataFrame nach der Spalte Age zu sortieren.
## --- Schritt 1: Nach einer einzelnen Spalte sortieren ---
df_sorted_by_age = df.sort_values(by='Age')
print("\nDataFrame nach Alter sortiert:")
print(df_sorted_by_age)
Ihre vollständige Datei main.py sollte nun wie folgt aussehen:
import pandas as pd
## Erstellen eines Beispiel-DataFrames für unsere Übungen
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
'Age': [25, 22, 25, 28, 22],
'Score': [85, 91, 88, 79, 91]
}
df = pd.DataFrame(data)
print("Original DataFrame:")
print(df)
## --- Schritt 1: Nach einer einzelnen Spalte sortieren ---
df_sorted_by_age = df.sort_values(by='Age')
print("\nDataFrame nach Alter sortiert:")
print(df_sorted_by_age)
Um das Ergebnis zu sehen, führen Sie das Skript im Terminal aus.
python3 main.py
Sie sehen den ursprünglichen DataFrame, gefolgt von dem neuen DataFrame, der nach Alter in aufsteigender Reihenfolge sortiert ist.
Erwartete Ausgabe:
Original DataFrame:
Name Age Score
0 Alice 25 85
1 Bob 22 91
2 Charlie 25 88
3 David 28 79
4 Eve 22 91
DataFrame sorted by Age:
Name Age Score
1 Bob 22 91
4 Eve 22 91
0 Alice 25 85
2 Charlie 25 88
3 David 28 79