Визуализация связей между переменными

PythonPythonBeginner
Практиковаться сейчас

This tutorial is from open-source community. Access the source code

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом практическом занятии мы научимся создавать простую точечную диаграмму с использованием библиотеки Matplotlib для Python. Точечная диаграмма - это тип диаграммы, на которой значения двух переменных отображаются в виде набора точек. Каждая точка представляет значения двух переменных, а положение точки определяет значения этих двух переменных. Точечные диаграммы полезны для выявления взаимосвязей между переменными и для обнаружения выбросов.

Советы по работе с ВМ

После запуска виртуальной машины щелкните в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем необходимые библиотеки

В этом шаге мы импортируем необходимые библиотеки для создания точечной диаграммы. Для создания диаграммы мы будем использовать библиотеку Matplotlib, а для генерации случайных данных - библиотеку NumPy.

import matplotlib.pyplot as plt
import numpy as np

Генерируем случайные данные

В этом шаге мы сгенерируем случайные данные для нашей точечной диаграммы. Мы будем генерировать 50 точек данных для каждой переменной с использованием библиотеки NumPy.

np.random.seed(19680801)

N = 50
x = np.random.rand(N)
y = np.random.rand(N)

Определяем размер и цвет точек

В этом шаге мы определим размер и цвет точек в нашей точечной диаграмме. Мы будем использовать библиотеку NumPy для генерации случайных значений для размера и цвета точек.

colors = np.random.rand(N)
area = (30 * np.random.rand(N))**2

Создаем точечную диаграмму

В этом шаге мы создадим точечную диаграмму с использованием библиотеки Matplotlib. Мы будем использовать функцию scatter для создания диаграммы и укажем размер и цвет точек.

plt.scatter(x, y, s=area, c=colors, alpha=0.5)
plt.show()

Резюме

В этом практическом занятии мы узнали, как создать простую точечную диаграмму с использованием библиотеки Matplotlib для Python. Мы сгенерировали случайные данные для диаграммы с использованием библиотеки NumPy, определили размер и цвет точек и создали диаграмму с использованием функции scatter из библиотеки Matplotlib. Точечные диаграммы полезны для выявления связей между переменными и для выявления выбросов.