Построение графиков функций принятия решений | Взвешенные наборы данных | Scikit-Learn

Введение

В этом уроке мы научимся строить функцию принятия решений для взвешенного набора данных с использованием scikit-learn. Мы также узнаем, как назначать разные веса для образцов в наборе данных, чтобы показать, как веса влияют на функцию принятия решений.

Советы по работе с ВМ

После запуска ВМ перейдите в левый верхний угол и переключитесь на вкладку Notebook, чтобы получить доступ к Jupyter Notebook для практики.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем необходимые библиотеки

Начнем с импорта необходимых библиотек для нашего проекта.

import numpy as np
import matplotlib.pyplot as plt
from sklearn import linear_model

Создаем взвешенный набор данных

Мы создаем взвешенный набор данных с использованием библиотеки numpy. Мы генерируем 20 точек со случайными значениями и назначаем больший вес последним 10 образцам.

np.random.seed(0)
X = np.r_[np.random.randn(10, 2) + [1, 1], np.random.randn(10, 2)]
y = [1] * 10 + [-1] * 10
sample_weight = 100 * np.abs(np.random.randn(20))
sample_weight[:10] *= 10

Построим график для взвешенного набора данных

Мы строим график для взвешенного набора данных с использованием библиотеки matplotlib. Размер точек пропорционален их весу.

xx, yy = np.meshgrid(np.linspace(-4, 5, 500), np.linspace(-4, 5, 500))
fig, ax = plt.subplots()
ax.scatter(
    X[:, 0],
    X[:, 1],
    c=y,
    s=sample_weight,
    alpha=0.9,
    cmap=plt.cm.bone,
    edgecolor="black",
)

Обучим модель без весов

Мы обучаем модель без весов с использованием алгоритма SGDClassifier из библиотеки scikit-learn. Затем мы строим график функции принятия решений для модели без весов.

clf = linear_model.SGDClassifier(alpha=0.01, max_iter=100)
clf.fit(X, y)
Z = clf.decision_function(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)
no_weights = ax.contour(xx, yy, Z, levels=[0], linestyles=["solid"])

Обучим взвешенную модель

Мы обучаем взвешенную модель с использованием того же алгоритма, что и в шаге 4, но на этот раз мы передаем аргумент sample_weight в метод fit. Затем мы строим график функции принятия решений для взвешенной модели.

clf = linear_model.SGDClassifier(alpha=0.01, max_iter=100)
clf.fit(X, y, sample_weight=sample_weight)
Z = clf.decision_function(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)
samples_weights = ax.contour(xx, yy, Z, levels=[0], linestyles=["dashed"])

Добавим легенду и выведем график

Мы добавляем легенду на график, чтобы отличить между моделями без весов и с весами. Затем мы выводим график.

no_weights_handles, _ = no_weights.legend_elements()
weights_handles, _ = samples_weights.legend_elements()
ax.legend(
    [no_weights_handles[0], weights_handles[0]],
    ["no weights", "with weights"],
    loc="lower left",
)

ax.set(xticks=(), yticks=())
plt.show()

Резюме

В этом уроке мы узнали, как построить график функции принятия решений для взвешенного набора данных с использованием scikit-learn. Мы также узнали, как назначать разные веса для образцов в наборе данных, чтобы показать, как веса влияют на функцию принятия решений.

Построение графика функции принятия решений для взвешенного набора данных