read_csv でヘッダー行を指定する
このステップでは、read_csv 関数の header パラメータを探求します。
デフォルトでは、read_csv はファイル内のコメント行やスキップされた行を除いた最初の行を、列名を含むヘッダー行とみなします。私たちの data.csv ファイルでは、コメント行をスキップした後、id,name,age,city という行が正しくヘッダーとして推測されます。
header パラメータを使用すると、ヘッダーとして使用する行を明示的に指定できます。これは行インデックス(0 から始まる)を表す整数を受け取ります。コメント後の最初のデータ行がヘッダーであるため、そのインデックスは 0 です。
main.py ファイルを更新して、明示的に header=0 を設定しましょう。この場合、これはデフォルトの動作ですが、明示的に指定することで、異常な形式のファイルによるエラーを防ぐことができます。
main.py を以下のコードで更新してください。
import pandas as pd
## コメント後の最初の行 (インデックス 0) をヘッダーとして明示的に指定する
df = pd.read_csv('data.csv', comment='#', header=0)
print(df)
ターミナルから再度スクリプトを実行します。
python3 main.py
出力は前のステップと同じになります。これは、デフォルトの動作を確認しただけだからです。この方法は、コードの明確さと堅牢性のために役立ちます。
id name age city
0 1 Alice 25 New York
1 2 Bob 30 Los Angeles
2 3 Charlie Not Available London
3 4 David 35 N/A
4 5 Eve 22 Paris