使用 sort_values 按单列对 DataFrame 进行排序
在本步骤中,你将学习最常见的排序操作:按单列的值对 DataFrame 进行排序。我们将为此使用 sort_values() 方法。by 参数用于指定你要排序的列。
首先,使用左侧的文件浏览器打开位于 ~/project 目录下的 main.py 文件。此文件已预先填充了一个示例 DataFrame。
现在,将以下代码添加到 main.py 的末尾,以按 Age 列对 DataFrame 进行排序。
## --- Step 1: Sort by a single column ---
df_sorted_by_age = df.sort_values(by='Age')
print("\nDataFrame sorted by Age:")
print(df_sorted_by_age)
你完整的 main.py 文件现在应该如下所示:
import pandas as pd
## Create a sample DataFrame for our exercises
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
'Age': [25, 22, 25, 28, 22],
'Score': [85, 91, 88, 79, 91]
}
df = pd.DataFrame(data)
print("Original DataFrame:")
print(df)
## --- Step 1: Sort by a single column ---
df_sorted_by_age = df.sort_values(by='Age')
print("\nDataFrame sorted by Age:")
print(df_sorted_by_age)
要查看结果,请从终端运行脚本。
python3 main.py
你将看到原始 DataFrame,然后是按年龄升序排序的新 DataFrame。
预期输出:
Original DataFrame:
Name Age Score
0 Alice 25 85
1 Bob 22 91
2 Charlie 25 88
3 David 28 79
4 Eve 22 91
DataFrame sorted by Age:
Name Age Score
1 Bob 22 91
4 Eve 22 91
0 Alice 25 85
2 Charlie 25 88
3 David 28 79