はじめに
この実験では、Pandas の列を操作する方法を学びます。既存の列から新しい列を作成する方法、列に対して数学的および論理演算を適用する方法、列ラベルをリネームする方法、および apply メソッドを使用して列ごとに演算を実行する方法を検討します。
VM のヒント
VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替え、Jupyter Notebook を使用して練習します。
場合によっては、Jupyter Notebook が読み込み完了するまで数秒待つ必要があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。
学習中に問題が発生した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。そうすると、迅速に問題を解決します。
Pandas をインポートしてデータを読み込む
まず、pandas ライブラリをインポートし、CSV ファイルから空気質データを読み込みます。
## Import pandas library
import pandas as pd
## Load air quality data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
新しい列を作成する
「station_london」列に換算係数を掛けることで、新しい列「london_mg_per_cubic」を作成します。
## Create new column by multiplying "station_london" by conversion factor
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882
2 つの列の値の比率を確認する
次に、「station_paris」と「station_antwerp」の列の値の比率を確認し、その結果を新しい列に保存します。
## Create new column by dividing "station_paris" by "station_antwerp"
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]
列ラベルをリネームする
OpenAQ が使用する測定所識別子に一致するように、列ラベルをリネームします。
## Rename column labels
air_quality_renamed = air_quality.rename(
columns={
"station_antwerp": "BETR801",
"station_paris": "FR04014",
"station_london": "London Westminster",
}
)
列ラベルを小文字に変換する
最後に、関数を使って列ラベルを小文字に変換します。
## Convert column labels to lowercase
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)
まとめ
この実験では、既存の列から新しい列を作成し、列に対して数学的および論理的演算を行い、列ラベルをリネームし、列ラベルを小文字に変換する方法を学びました。これらのスキルを使えば、pandas でデータをより効果的に操作および変換できます。