Построение гистограмм с использованием Matplotlib

PythonPythonBeginner
Практиковаться сейчас

This tutorial is from open-source community. Access the source code

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

Matplotlib - популярная библиотека визуализации данных на Python. Одним из самых распространенных способов визуализации распределений данных является использование гистограмм. В этом практическом занятии мы научимся создавать гистограммы с использованием Matplotlib и изучать различные параметры настройки.

Советы по работе с ВМ

После завершения запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.

Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем необходимые библиотеки

Сначала нам нужно импортировать необходимые библиотеки, в том числе Matplotlib и NumPy.

import matplotlib.pyplot as plt
import numpy as np

Генерируем примерные данные

Далее мы сгенерируем некоторые примерные данные для гистограммы. В этом примере мы сгенерируем три набора случайных данных.

np.random.seed(19680801)
n_bins = 10
x = np.random.randn(1000, 3)

Построение базовой гистограммы

Мы можем создать базовую гистограмму с использованием функции hist в Matplotlib. Эта функция принимает на вход данные, которые мы хотим отобразить, и количество интервалов (bins), которое мы хотим использовать.

plt.hist(x, n_bins)
plt.show()

Добавляем метки и заголовок

Мы можем добавить метки к осям x и y и заголовок к графику с использованием функций xlabel, ylabel и title.

plt.hist(x, n_bins)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.show()

Настраиваем гистограмму

Мы можем настроить гистограмму, изменив цвет, прозрачность и цвет границ столбцов с использованием параметров color, alpha и edgecolor.

plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black')
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.show()

Строим несколько гистограмм

Мы можем построить несколько гистограмм на одном графике, передав массив данных в функцию hist.

plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.legend()
plt.show()

Строим накопленные гистограммы

Мы можем построить накопленные гистограммы, установив параметр stacked в значение True.

plt.hist(x, n_bins, color=['green', 'blue','red'], alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'], stacked=True)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Stacked Histogram of Random Data')
plt.legend()
plt.show()

Строим ступенчатые гистограммы

Мы можем построить ступенчатые гистограммы, установив параметр histtype в значение 'step'.

plt.hist(x, n_bins, histtype='step', color=['green', 'blue','red'], label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Step Histogram of Random Data')
plt.legend()
plt.show()

Резюме

В этом практическом занятии мы узнали, как создавать гистограммы с использованием Matplotlib. Мы изучили различные параметры настройки, включая изменение цвета, прозрачности и цвета границ столбцов, построение нескольких гистограмм на одном графике, накопление гистограмм и построение ступенчатых гистограмм. Эти инструменты помогут нам лучше понять распределение наших данных.