Создайте настраиваемые ящики с усами в Python

PythonPythonBeginner
Практиковаться сейчас

This tutorial is from open-source community. Access the source code

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

Ящик с усами - это тип графика, используемый для отображения распределения данных на основе пятичисловой характеристики ("минимальное значение", первый квартиль (Q1), медиана, третий квартиль (Q3) и "максимальное значение"). Они широко используются в анализе данных для идентификации и визуализации выбросов, а также для сравнения распределения различных групп данных. В этом практическом занятии вы научитесь создавать и настраивать ящики с усами в Python с использованием библиотеки Matplotlib.

Советы по работе с ВМ

После запуска ВМ кликните в верхнем левом углу, чтобы переключиться на вкладку Ноутбук и получить доступ к Jupyter Notebook для практики.

Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем необходимые библиотеки

Прежде чем начать создавать ящики с усами, нам нужно импортировать необходимые библиотеки, в том числе NumPy и Matplotlib:

import matplotlib.pyplot as plt
import numpy as np

Генерируем данные

Далее мы сгенерируем некоторые образцовые данные, которые будем использовать в наших ящиках с усами. Для этого урока мы будем использовать следующие данные:

spread = np.random.rand(50) * 100
center = np.ones(25) * 50
flier_high = np.random.rand(10) * 100 + 100
flier_low = np.random.rand(10) * -100
data = np.concatenate((spread, center, flier_high, flier_low))

Создаем базовый ящик с усами

Мы можем создать базовый ящик с усами с использованием функции boxplot() из Matplotlib. Функция boxplot() принимает данные в качестве первого аргумента и другие необязательные параметры для настройки графика. Вот код для создания базового ящика с усами:

plt.boxplot(data)
plt.show()

Настраиваем ящик с усами

Мы можем настроить ящик с усами, изменив внешний вид коробки, усов и выбросов. Мы также можем создать несколько ящиков с усами на одном графике, чтобы сравнить разные группы данных. Вот некоторые примеры того, как настроить ящик с усами:

## Создаем ящик с усами с вырезом
plt.boxplot(data, notch=True)
plt.show()

## Меняем символы точек выбросов на зеленые ромбы
plt.boxplot(data, flierprops=dict(marker='D', markerfacecolor='g', markersize=8))
plt.show()

## Создаем горизонтальные ящики с усами
plt.boxplot(data, vert=False)
plt.show()

## Создаем несколько ящиков с усами на одном графике
data1 = np.random.normal(0, 1, 50)
data2 = np.random.normal(1, 1, 50)
data3 = np.random.normal(2, 1, 50)

plt.boxplot([data1, data2, data3])
plt.show()

Добавляем метки и заголовки

Наконец, мы можем добавить метки и заголовки к нашему ящику с усами, чтобы сделать его более информативным. Мы можем добавить метки к осям x и y, а также заголовок к графику. Мы также можем изменить размер и стиль шрифта меток и заголовка. Вот пример того, как добавить метки и заголовки:

plt.boxplot([data1, data2, data3])
plt.xlabel('Group')
plt.ylabel('Value')
plt.title('Comparison of Three Groups')
plt.xticks([1, 2, 3], ['Group 1', 'Group 2', 'Group 3'])
plt.show()

Резюме

В этом практическом занятии вы узнали, как создавать и настраивать ящики с усами в Python с использованием библиотеки Matplotlib. Вы узнали, как генерировать образцовые данные, создавать базовый ящик с усами, настраивать внешний вид ящика с усами и добавлять метки и заголовки к графику. Ящики с усами - это мощный инструмент для визуализации и сравнения распределения данных, и знание, как создавать и настраивать их, - важный навык для аналитиков и учёных данных.