Настройка параметров SVM с ядром RBF

Beginner

This tutorial is from open-source community. Access the source code

Введение

В этом практическом занятии показано, как настраивать параметры RBF-ядра SVM. Параметры gamma и C RBF-ядра являются决定性 для производительности модели SVM. Цель - выбрать оптимальные значения этих параметров, которые максимизируют точность модели.

Советы по использованию ВМ

После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Загрузка и подготовка набора данных

  • Загрузите набор данных iris из scikit-learn.
  • Разделите данные на матрицу признаков X и целевое вектор y.
  • Стандартизируйте матрицу признаков X с использованием StandardScaler.
  • Создайте упрощенную версию набора данных для визуализации функции принятия решений, оставив только первые два признака в X и уменьшив размер набора данных, чтобы оставить только два класса и превратить его в задачу бинарной классификации.

Обучение классификаторов

  • Создайте логарифмическую сетку параметров gamma и C с использованием np.logspace.
  • Разделите данные на тренировочный и тестовый наборы с использованием StratifiedShuffleSplit.
  • Выполните сеточный поиск с использованием GridSearchCV, чтобы найти наилучшие параметры для модели SVM.
  • Обучите классификатор для всех параметров в 2D-версии.

Визуализация

  • Визуализируйте функцию принятия решений для различных значений параметров на упрощенной задаче классификации, которая включает только 2 входных признака и 2 возможных целевых класса (бинарная классификация).
  • Визуализируйте тепловую карту точности кросс-валидации классификатора в зависимости от C и gamma.

Интерпретация

  • Интерпретируйте результаты визуализации и выберите оптимальные значения для C и gamma.

Резюме

В этом практическом занятии показано, как настраивать параметры SVM с ядром радиальной базисной функции (RBF). Параметры gamma и C ядра RBF являются决定性 для производительности модели SVM, и наилучшие значения для этих параметров можно найти с использованием комбинации сеточного поиска и техник визуализации.