Построение графиков с использованием Pandas для анализа качества воздуха

PythonPythonBeginner
Практиковаться сейчас

This tutorial is from open-source community. Access the source code

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом практическом занятии мы научимся создавать графики с использованием Pandas - мощной библиотеки для манипуляции данными в Python. В качестве примера для практики мы будем использовать реальные данные о качестве воздуха. В конце занятия вы должны уметь создавать линейные графики, точечные графики, коробчатые диаграммы с использованием Pandas и настраивать их.

Советы по работе с ВМ

После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Это Guided Lab, который предоставляет пошаговые инструкции, чтобы помочь вам учиться и практиковаться. Внимательно следуйте инструкциям, чтобы выполнить каждый шаг и получить практический опыт. Исторические данные показывают, что это лабораторная работа уровня начальный с процентом завершения 93%. Он получил 93% положительных отзывов от учащихся.

Импортируем необходимые библиотеки

Сначала нам нужно импортировать необходимые библиотеки. Мы будем использовать Pandas для манипуляции данными и Matplotlib для визуализации данных.

## Importing necessary libraries
import pandas as pd
import matplotlib.pyplot as plt

Загружаем данные

В этом уроке мы будем использовать данные о качестве воздуха. Данные будут загружены из CSV-файла в DataFrame Pandas.

## Loading the data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
air_quality.head()

Создаем линейный график

По умолчанию Pandas создает линейный график для каждого столбца с числовыми данными. Это позволяет получить быстрый визуальный обзор данных.

## Creating a line plot
air_quality.plot()
plt.show()

Создаем график для определенного столбца

Для построения графика для определенного столбца мы можем использовать метод выбора в сочетании с методом plot.

## Creating a plot for a specific column
air_quality["station_paris"].plot()
plt.show()

Создаем точечный график

Для визуального сравнения значений NO2, измеренных в Лондоне и Париже, мы можем создать точечный график.

## Creating a scatter plot
air_quality.plot.scatter(x="station_london", y="station_paris", alpha=0.5)
plt.show()

Создаем ящик с усами

Ящик с усами позволяет получить хороший обзор распределения данных. Мы можем создать ящик с усами для наших данных о качестве воздуха.

## Creating a box plot
air_quality.plot.box()
plt.show()

Создаем дополнительные графики для каждого столбца

Мы можем создать отдельные дополнительные графики для каждого столбца данных, используя аргумент subplots.

## Creating subplots for each column
axs = air_quality.plot.area(figsize=(12, 4), subplots=True)
plt.show()

Настраиваем и сохраняем график

Мы можем дополнительно настроить график, используя параметры настройки Matplotlib. Мы также можем сохранить график в файл.

## Customizing and saving the plot
fig, axs = plt.subplots(figsize=(12, 4))
air_quality.plot.area(ax=axs)
axs.set_ylabel("NO$_2$ concentration")
fig.savefig("no2_concentrations.png")
plt.show()

Резюме

В этом практическом занятии мы научились создавать различные виды графиков с использованием Pandas. Мы также узнали, как настраивать и сохранять эти графики. Эти знания будут очень полезны для задач анализа и визуализации данных.