はじめに
この実験では、Python の強力なデータ操作ライブラリである Pandas を使ってグラフを作成する方法を学びます。実際の空気質データを使って具体的な例を示します。この実験が終わるとき、Pandas を使って折れ線グラフ、散布図、ボックスプロットを作成し、グラフをカスタマイズできるようになるはずです。
VM のヒント
VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替えて、Jupyter Notebook を使って練習します。
時々、Jupyter Notebook が読み込み終わるまで数秒待つ必要があります。Jupyter Notebook の制限により、操作の検証を自動化できません。
学習中に問題がある場合は、Labby にお問い合わせください。セッション終了後にフィードバックを提供してください。すぐに問題を解決します。
必要なライブラリをインポートする
まず、必要なライブラリをインポートする必要があります。データ操作には Pandas を、データ可視化には Matplotlib を使用します。
## Importing necessary libraries
import pandas as pd
import matplotlib.pyplot as plt
データを読み込む
このチュートリアルでは、空気質データを使用します。このデータは CSV ファイルから Pandas の DataFrame に読み込まれます。
## Loading the data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
air_quality.head()
折れ線グラフを作成する
Pandas は、デフォルトで数値データを持つ各列に対して折れ線グラフを作成します。これにより、データの迅速な視覚的な概要が得られます。
## Creating a line plot
air_quality.plot()
plt.show()
特定の列のグラフを作成する
特定の列をプロットするには、選択方法を plot メソッドと組み合わせて使用できます。
## Creating a plot for a specific column
air_quality["station_paris"].plot()
plt.show()
散布図を作成する
ロンドンとパリで測定された NO2 の値を視覚的に比較するには、散布図を作成できます。
## Creating a scatter plot
air_quality.plot.scatter(x="station_london", y="station_paris", alpha=0.5)
plt.show()
ボックスプロットを作成する
ボックスプロットは、データの分布の良い概要を提供します。私たちは、空気質データに対してボックスプロットを作成できます。
## Creating a box plot
air_quality.plot.box()
plt.show()
各列に対するサブプロットを作成する
subplots 引数を使用して、各データ列に対して個別のサブプロットを作成できます。
## Creating subplots for each column
axs = air_quality.plot.area(figsize=(12, 4), subplots=True)
plt.show()
グラフをカスタマイズして保存する
Matplotlib のカスタマイズオプションを使用して、さらにグラフをカスタマイズすることができます。また、グラフをファイルに保存することもできます。
## Customizing and saving the plot
fig, axs = plt.subplots(figsize=(12, 4))
air_quality.plot.area(ax=axs)
axs.set_ylabel("NO$_2$ concentration")
fig.savefig("no2_concentrations.png")
plt.show()
まとめ
この実験では、Pandas を使ってさまざまな種類のグラフを作成する方法を学びました。また、これらのグラフをカスタマイズして保存する方法も学びました。この知識は、データ分析と可視化のタスクにとても役立ちます。