Введение
Датасет iris - это классический датасет, используемый для задач классификации. В этом практическом занятии мы научимся строить различные классификаторы SVM на датасете iris с использованием библиотеки scikit - learn для Python. Мы сравним различные линейные классификаторы SVM на 2D - проекции датасета iris.
Советы по работе с ВМ
После запуска ВМ кликните в верхнем левом углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится полностью. Валидация операций не может быть автоматизирована из - за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импортируем необходимые библиотеки и загружаем датасет
import matplotlib.pyplot as plt
from sklearn import svm, datasets
from sklearn.inspection import DecisionBoundaryDisplay
## import some data to play with
iris = datasets.load_iris()
## Take the first two features. We could avoid this by using a two-dim dataset
X = iris.data[:, :2]
y = iris.target
Создаем классификаторы SVM и настраиваем их на данные
C = 1.0 ## Параметр регуляризации SVM
models = (
svm.SVC(kernel="linear", C=C),
svm.LinearSVC(C=C, max_iter=10000, dual="auto"),
svm.SVC(kernel="rbf", gamma=0.7, C=C),
svm.SVC(kernel="poly", degree=3, gamma="auto", C=C),
)
models = (clf.fit(X, y) for clf in models)
Построим поверхность решения для классификаторов
## Создадим сетку 2x2 для построения графиков.
fig, sub = plt.subplots(2, 2)
plt.subplots_adjust(wspace=0.4, hspace=0.4)
X0, X1 = X[:, 0], X[:, 1]
## создадим DecisionBoundaryDisplay для каждого классификатора
for clf, title, ax in zip(models, titles, sub.flatten()):
disp = DecisionBoundaryDisplay.from_estimator(
clf,
X,
response_method="predict",
cmap=plt.cm.coolwarm,
alpha=0.8,
ax=ax,
xlabel=iris.feature_names[0],
ylabel=iris.feature_names[1],
)
## построим точки данных
ax.scatter(X0, X1, c=y, cmap=plt.cm.coolwarm, s=20, edgecolors="k")
ax.set_xticks(())
ax.set_yticks(())
ax.set_title(title)
plt.show()
Интерпретация результатов
Вышеприведенный код сгенерирует график с четырьмя подграфиками. Каждый подграфик показывает поверхность решения для различных классификаторов SVM. Заголовок каждого подграфика указывает на тип ядра SVM, используемого в этом классификаторе. Точки данных окрашены в соответствии с их целевым классом.
Резюме
В этом практическом занятии мы узнали, как построить различные классификаторы SVM в наборе данных iris с использованием библиотеки scikit - learn для Python. Мы сравнили разные линейные классификаторы SVM на 2D - проекции набора данных iris и интерпретировали результаты. Классификаторы SVM - мощные инструменты для задач классификации и могут быть использованы для широкого спектра наборов данных.