sort_values を使用して単一列で DataFrame をソートする
このステップでは、最も一般的なソート操作である、単一の列の値に基づいて DataFrame をソートする方法を学びます。これには sort_values() メソッドを使用します。by パラメータは、ソートしたい列を指定するために使用されます。
まず、左側のファイルエクスプローラーを使用して、~/project ディレクトリにある main.py ファイルを開きます。このファイルには、サンプル DataFrame が事前に入力されています。
次に、Age 列で DataFrame をソートするために、以下のコードを main.py の末尾に追加します。
## --- ステップ 1: 単一の列でソート ---
df_sorted_by_age = df.sort_values(by='Age')
print("\nDataFrame sorted by Age:")
print(df_sorted_by_age)
これで、完全な main.py ファイルは次のようになります。
import pandas as pd
## 演習用のサンプル DataFrame を作成します
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
'Age': [25, 22, 25, 28, 22],
'Score': [85, 91, 88, 79, 91]
}
df = pd.DataFrame(data)
print("Original DataFrame:")
print(df)
## --- ステップ 1: 単一の列でソート ---
df_sorted_by_age = df.sort_values(by='Age')
print("\nDataFrame sorted by Age:")
print(df_sorted_by_age)
結果を確認するには、ターミナルからスクリプトを実行します。
python3 main.py
元の DataFrame の後に、年齢で昇順にソートされた新しい DataFrame が表示されます。
期待される出力:
Original DataFrame:
Name Age Score
0 Alice 25 85
1 Bob 22 91
2 Charlie 25 88
3 David 28 79
4 Eve 22 91
DataFrame sorted by Age:
Name Age Score
1 Bob 22 91
4 Eve 22 91
0 Alice 25 85
2 Charlie 25 88
3 David 28 79