Введение
В этом практическом занятии мы научимся создавать графики с использованием Pandas - мощной библиотеки для манипуляции данными в Python. В качестве примера для практики мы будем использовать реальные данные о качестве воздуха. В конце занятия вы должны уметь создавать линейные графики, точечные графики, коробчатые диаграммы с использованием Pandas и настраивать их.
Советы по работе с ВМ
После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.
Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импортируем необходимые библиотеки
Сначала нам нужно импортировать необходимые библиотеки. Мы будем использовать Pandas для манипуляции данными и Matplotlib для визуализации данных.
## Importing necessary libraries
import pandas as pd
import matplotlib.pyplot as plt
Загружаем данные
В этом уроке мы будем использовать данные о качестве воздуха. Данные будут загружены из CSV-файла в DataFrame Pandas.
## Loading the data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
air_quality.head()
Создаем линейный график
По умолчанию Pandas создает линейный график для каждого столбца с числовыми данными. Это позволяет получить быстрый визуальный обзор данных.
## Creating a line plot
air_quality.plot()
plt.show()
Создаем график для определенного столбца
Для построения графика для определенного столбца мы можем использовать метод выбора в сочетании с методом plot.
## Creating a plot for a specific column
air_quality["station_paris"].plot()
plt.show()
Создаем точечный график
Для визуального сравнения значений NO2, измеренных в Лондоне и Париже, мы можем создать точечный график.
## Creating a scatter plot
air_quality.plot.scatter(x="station_london", y="station_paris", alpha=0.5)
plt.show()
Создаем ящик с усами
Ящик с усами позволяет получить хороший обзор распределения данных. Мы можем создать ящик с усами для наших данных о качестве воздуха.
## Creating a box plot
air_quality.plot.box()
plt.show()
Создаем дополнительные графики для каждого столбца
Мы можем создать отдельные дополнительные графики для каждого столбца данных, используя аргумент subplots.
## Creating subplots for each column
axs = air_quality.plot.area(figsize=(12, 4), subplots=True)
plt.show()
Настраиваем и сохраняем график
Мы можем дополнительно настроить график, используя параметры настройки Matplotlib. Мы также можем сохранить график в файл.
## Customizing and saving the plot
fig, axs = plt.subplots(figsize=(12, 4))
air_quality.plot.area(ax=axs)
axs.set_ylabel("NO$_2$ concentration")
fig.savefig("no2_concentrations.png")
plt.show()
Резюме
В этом практическом занятии мы научились создавать различные виды графиков с использованием Pandas. Мы также узнали, как настраивать и сохранять эти графики. Эти знания будут очень полезны для задач анализа и визуализации данных.