Pandas の列の操作

PythonPythonBeginner
今すぐ練習

This tutorial is from open-source community. Access the source code

💡 このチュートリアルは英語版からAIによって翻訳されています。原文を確認するには、 ここをクリックしてください

はじめに

この実験では、Pandas の列を操作する方法を学びます。既存の列から新しい列を作成する方法、列に対して数学的および論理演算を適用する方法、列ラベルをリネームする方法、および apply メソッドを使用して列ごとに演算を実行する方法を検討します。

VM のヒント

VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替え、Jupyter Notebook を使用して練習します。

場合によっては、Jupyter Notebook が読み込み完了するまで数秒待つ必要があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。

学習中に問題が発生した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。そうすると、迅速に問題を解決します。

Pandas をインポートしてデータを読み込む

まず、pandas ライブラリをインポートし、CSV ファイルから空気質データを読み込みます。

## Import pandas library
import pandas as pd

## Load air quality data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)

新しい列を作成する

「station_london」列に換算係数を掛けることで、新しい列「london_mg_per_cubic」を作成します。

## Create new column by multiplying "station_london" by conversion factor
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882

2 つの列の値の比率を確認する

次に、「station_paris」と「station_antwerp」の列の値の比率を確認し、その結果を新しい列に保存します。

## Create new column by dividing "station_paris" by "station_antwerp"
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]

列ラベルをリネームする

OpenAQ が使用する測定所識別子に一致するように、列ラベルをリネームします。

## Rename column labels
air_quality_renamed = air_quality.rename(
    columns={
        "station_antwerp": "BETR801",
        "station_paris": "FR04014",
        "station_london": "London Westminster",
    }
)

列ラベルを小文字に変換する

最後に、関数を使って列ラベルを小文字に変換します。

## Convert column labels to lowercase
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)

まとめ

この実験では、既存の列から新しい列を作成し、列に対して数学的および論理的演算を行い、列ラベルをリネームし、列ラベルを小文字に変換する方法を学びました。これらのスキルを使えば、pandas でデータをより効果的に操作および変換できます。