Введение
В этом практическом занятии показано, как настраивать параметры RBF-ядра SVM. Параметры gamma и C RBF-ядра являются决定性 для производительности модели SVM. Цель - выбрать оптимальные значения этих параметров, которые максимизируют точность модели.
Советы по использованию ВМ
После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Загрузка и подготовка набора данных
- Загрузите набор данных iris из scikit-learn.
- Разделите данные на матрицу признаков
Xи целевое векторy. - Стандартизируйте матрицу признаков
Xс использованиемStandardScaler. - Создайте упрощенную версию набора данных для визуализации функции принятия решений, оставив только первые два признака в
Xи уменьшив размер набора данных, чтобы оставить только два класса и превратить его в задачу бинарной классификации.
Обучение классификаторов
- Создайте логарифмическую сетку параметров
gammaиCс использованиемnp.logspace. - Разделите данные на тренировочный и тестовый наборы с использованием
StratifiedShuffleSplit. - Выполните сеточный поиск с использованием
GridSearchCV, чтобы найти наилучшие параметры для модели SVM. - Обучите классификатор для всех параметров в 2D-версии.
Визуализация
- Визуализируйте функцию принятия решений для различных значений параметров на упрощенной задаче классификации, которая включает только 2 входных признака и 2 возможных целевых класса (бинарная классификация).
- Визуализируйте тепловую карту точности кросс-валидации классификатора в зависимости от
Cиgamma.
Интерпретация
- Интерпретируйте результаты визуализации и выберите оптимальные значения для
Cиgamma.
Резюме
В этом практическом занятии показано, как настраивать параметры SVM с ядром радиальной базисной функции (RBF). Параметры gamma и C ядра RBF являются决定性 для производительности модели SVM, и наилучшие значения для этих параметров можно найти с использованием комбинации сеточного поиска и техник визуализации.