空気質分析のための Pandas によるグラフ作成

PythonPythonBeginner
オンラインで実践に進む

This tutorial is from open-source community. Access the source code

💡 このチュートリアルは英語版からAIによって翻訳されています。原文を確認するには、 ここをクリックしてください

はじめに

この実験では、Python の強力なデータ操作ライブラリである Pandas を使ってグラフを作成する方法を学びます。実際の空気質データを使って具体的な例を示します。この実験が終わるとき、Pandas を使って折れ線グラフ、散布図、ボックスプロットを作成し、グラフをカスタマイズできるようになるはずです。

VM のヒント

VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替えて、Jupyter Notebook を使って練習します。

時々、Jupyter Notebook が読み込み終わるまで数秒待つ必要があります。Jupyter Notebook の制限により、操作の検証を自動化できません。

学習中に問題がある場合は、Labby にお問い合わせください。セッション終了後にフィードバックを提供してください。すぐに問題を解決します。

これは Guided Lab です。学習と実践を支援するためのステップバイステップの指示を提供します。各ステップを完了し、実践的な経験を積むために、指示に注意深く従ってください。過去のデータによると、この 初級 レベルの実験の完了率は 93%です。学習者から 93% の好評価を得ています。

必要なライブラリをインポートする

まず、必要なライブラリをインポートする必要があります。データ操作には Pandas を、データ可視化には Matplotlib を使用します。

## Importing necessary libraries
import pandas as pd
import matplotlib.pyplot as plt

データを読み込む

このチュートリアルでは、空気質データを使用します。このデータは CSV ファイルから Pandas の DataFrame に読み込まれます。

## Loading the data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
air_quality.head()

折れ線グラフを作成する

Pandas は、デフォルトで数値データを持つ各列に対して折れ線グラフを作成します。これにより、データの迅速な視覚的な概要が得られます。

## Creating a line plot
air_quality.plot()
plt.show()

特定の列のグラフを作成する

特定の列をプロットするには、選択方法を plot メソッドと組み合わせて使用できます。

## Creating a plot for a specific column
air_quality["station_paris"].plot()
plt.show()

散布図を作成する

ロンドンとパリで測定された NO2 の値を視覚的に比較するには、散布図を作成できます。

## Creating a scatter plot
air_quality.plot.scatter(x="station_london", y="station_paris", alpha=0.5)
plt.show()

ボックスプロットを作成する

ボックスプロットは、データの分布の良い概要を提供します。私たちは、空気質データに対してボックスプロットを作成できます。

## Creating a box plot
air_quality.plot.box()
plt.show()

各列に対するサブプロットを作成する

subplots 引数を使用して、各データ列に対して個別のサブプロットを作成できます。

## Creating subplots for each column
axs = air_quality.plot.area(figsize=(12, 4), subplots=True)
plt.show()

グラフをカスタマイズして保存する

Matplotlib のカスタマイズオプションを使用して、さらにグラフをカスタマイズすることができます。また、グラフをファイルに保存することもできます。

## Customizing and saving the plot
fig, axs = plt.subplots(figsize=(12, 4))
air_quality.plot.area(ax=axs)
axs.set_ylabel("NO$_2$ concentration")
fig.savefig("no2_concentrations.png")
plt.show()

まとめ

この実験では、Pandas を使ってさまざまな種類のグラフを作成する方法を学びました。また、これらのグラフをカスタマイズして保存する方法も学びました。この知識は、データ分析と可視化のタスクにとても役立ちます。