Мастерство в использовании классификатора SVM на наборе данных Iris

Введение

Датасет iris - это классический датасет, используемый для задач классификации. В этом практическом занятии мы научимся строить различные классификаторы SVM на датасете iris с использованием библиотеки scikit - learn для Python. Мы сравним различные линейные классификаторы SVM на 2D - проекции датасета iris.

Советы по работе с ВМ

После запуска ВМ кликните в верхнем левом углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится полностью. Валидация операций не может быть автоматизирована из - за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем необходимые библиотеки и загружаем датасет

import matplotlib.pyplot as plt
from sklearn import svm, datasets
from sklearn.inspection import DecisionBoundaryDisplay

## import some data to play with
iris = datasets.load_iris()
## Take the first two features. We could avoid this by using a two-dim dataset
X = iris.data[:, :2]
y = iris.target

Создаем классификаторы SVM и настраиваем их на данные

C = 1.0  ## Параметр регуляризации SVM
models = (
    svm.SVC(kernel="linear", C=C),
    svm.LinearSVC(C=C, max_iter=10000, dual="auto"),
    svm.SVC(kernel="rbf", gamma=0.7, C=C),
    svm.SVC(kernel="poly", degree=3, gamma="auto", C=C),
)
models = (clf.fit(X, y) for clf in models)

Построим поверхность решения для классификаторов

## Создадим сетку 2x2 для построения графиков.
fig, sub = plt.subplots(2, 2)
plt.subplots_adjust(wspace=0.4, hspace=0.4)

X0, X1 = X[:, 0], X[:, 1]

## создадим DecisionBoundaryDisplay для каждого классификатора
for clf, title, ax in zip(models, titles, sub.flatten()):
    disp = DecisionBoundaryDisplay.from_estimator(
        clf,
        X,
        response_method="predict",
        cmap=plt.cm.coolwarm,
        alpha=0.8,
        ax=ax,
        xlabel=iris.feature_names[0],
        ylabel=iris.feature_names[1],
    )
    ## построим точки данных
    ax.scatter(X0, X1, c=y, cmap=plt.cm.coolwarm, s=20, edgecolors="k")
    ax.set_xticks(())
    ax.set_yticks(())
    ax.set_title(title)

plt.show()

Интерпретация результатов

Вышеприведенный код сгенерирует график с четырьмя подграфиками. Каждый подграфик показывает поверхность решения для различных классификаторов SVM. Заголовок каждого подграфика указывает на тип ядра SVM, используемого в этом классификаторе. Точки данных окрашены в соответствии с их целевым классом.

Резюме

В этом практическом занятии мы узнали, как построить различные классификаторы SVM в наборе данных iris с использованием библиотеки scikit - learn для Python. Мы сравнили разные линейные классификаторы SVM на 2D - проекции набора данных iris и интерпретировали результаты. Классификаторы SVM - мощные инструменты для задач классификации и могут быть использованы для широкого спектра наборов данных.

Классификатор SVM на наборе данных Iris