Построение категориальных данных с использованием Matplotlib

MatplotlibMatplotlibBeginner
Практиковаться сейчас

This tutorial is from open-source community. Access the source code

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

Matplotlib - популярная библиотека визуализации данных на Python. Она предоставляет широкий спектр настраиваемых графиков и диаграмм для исследования и представления данных. В этом практическом занятии мы научимся строить графики категориальных переменных с использованием Matplotlib.

Советы по работе с ВМ

После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике с использованием Jupyter Notebook.

Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импорт Matplotlib

Первым шагом является импорт библиотеки Matplotlib. Мы также будем использовать библиотеку numpy для генерации некоторых примерных данных.

import matplotlib.pyplot as plt
import numpy as np

Подготовка данных

Далее мы подготовим некоторые примерные данные для построения графика. Создадим словарь с количеством различных фруктов, а затем извлечем ключи и значения в отдельные списки.

data = {'apple': 10, 'orange': 15, 'lemon': 5, 'lime': 20}
names = list(data.keys())
values = list(data.values())

Столбчатая диаграмма

Столбчатая диаграмма - хороший способ визуализации категориальных данных. Мы можем создать столбчатую диаграмму с использованием функции bar.

plt.bar(names, values)
plt.title('Fruit Counts')
plt.xlabel('Fruit')
plt.ylabel('Count')
plt.show()

Диаграмма рассеяния

Мы также можем создать диаграмму рассеяния, чтобы показать связь между двумя категориальными переменными. В этом случае мы будем использовать те же данные о фруктах и добавить некоторый случайный шум к значениям количества, чтобы создать вторую переменную.

noise = np.random.rand(len(values)) * 5
plt.scatter(names, values + noise)
plt.title('Fruit Counts with Noise')
plt.xlabel('Fruit')
plt.ylabel('Count')
plt.show()

Линейная диаграмма

Линейная диаграмма может быть использована для показа, как категориальная переменная меняется в течение времени. В этом примере мы будем использовать данные о уровнях счастья кошек и собак во время различных активностей.

cat = ["bored", "happy", "bored", "bored", "happy", "bored"]
dog = ["happy", "happy", "happy", "happy", "bored", "bored"]
activity = ["combing", "drinking", "feeding", "napping", "playing", "washing"]
plt.plot(activity, dog, label="dog")
plt.plot(activity, cat, label="cat")
plt.title('Happiness Levels')
plt.xlabel('Activity')
plt.ylabel('Happiness')
plt.legend()
plt.show()

Резюме

В этом практическом занятии мы узнали, как строить графики категориальных переменных с использованием Matplotlib. Мы создали столбчатые диаграммы, диаграммы рассеяния и линейные диаграммы для визуализации различных типов категориальных данных. С помощью настройки подписей осей, заголовков и легенды мы можем создавать информативные и визуально привлекательные графики для эффективного представления наших данных.