Введение
Matplotlib - популярная библиотека визуализации данных на Python. Одним из самых распространенных способов визуализации распределений данных является использование гистограмм. В этом практическом занятии мы научимся создавать гистограммы с использованием Matplotlib и изучать различные параметры настройки.
Советы по работе с ВМ
После завершения запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.
Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импортируем необходимые библиотеки
Сначала нам нужно импортировать необходимые библиотеки, в том числе Matplotlib и NumPy.
import matplotlib.pyplot as plt
import numpy as np
Генерируем примерные данные
Далее мы сгенерируем некоторые примерные данные для гистограммы. В этом примере мы сгенерируем три набора случайных данных.
np.random.seed(19680801)
n_bins = 10
x = np.random.randn(1000, 3)
Построение базовой гистограммы
Мы можем создать базовую гистограмму с использованием функции hist в Matplotlib. Эта функция принимает на вход данные, которые мы хотим отобразить, и количество интервалов (bins), которое мы хотим использовать.
plt.hist(x, n_bins)
plt.show()
Добавляем метки и заголовок
Мы можем добавить метки к осям x и y и заголовок к графику с использованием функций xlabel, ylabel и title.
plt.hist(x, n_bins)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.show()
Настраиваем гистограмму
Мы можем настроить гистограмму, изменив цвет, прозрачность и цвет границ столбцов с использованием параметров color, alpha и edgecolor.
plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black')
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.show()
Строим несколько гистограмм
Мы можем построить несколько гистограмм на одном графике, передав массив данных в функцию hist.
plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.legend()
plt.show()
Строим накопленные гистограммы
Мы можем построить накопленные гистограммы, установив параметр stacked в значение True.
plt.hist(x, n_bins, color=['green', 'blue','red'], alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'], stacked=True)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Stacked Histogram of Random Data')
plt.legend()
plt.show()
Строим ступенчатые гистограммы
Мы можем построить ступенчатые гистограммы, установив параметр histtype в значение 'step'.
plt.hist(x, n_bins, histtype='step', color=['green', 'blue','red'], label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Step Histogram of Random Data')
plt.legend()
plt.show()
Резюме
В этом практическом занятии мы узнали, как создавать гистограммы с использованием Matplotlib. Мы изучили различные параметры настройки, включая изменение цвета, прозрачности и цвета границ столбцов, построение нескольких гистограмм на одном графике, накопление гистограмм и построение ступенчатых гистограмм. Эти инструменты помогут нам лучше понять распределение наших данных.