Ajuste de parámetros del SVM con kernel RBF

Beginner

This tutorial is from open-source community. Access the source code

Introducción

Esta práctica demuestra cómo ajustar los parámetros de un SVM con kernel de Función Básica Radial (RBF). Los parámetros gamma y C del kernel RBF son cruciales para el rendimiento del modelo SVM. El objetivo es elegir los valores óptimos de estos parámetros que maximicen la precisión del modelo.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Cargar y preparar el conjunto de datos

  • Cargar el conjunto de datos iris de scikit-learn.
  • Separar los datos en la matriz de características X y el vector de destino y.
  • Estandarizar la matriz de características X utilizando StandardScaler.
  • Crear una versión simplificada del conjunto de datos para la visualización de la función de decisión manteniendo solo las dos primeras características en X y submuestreando el conjunto de datos para mantener solo dos clases y convertirlo en un problema de clasificación binaria.

Entrenar clasificadores

  • Crear una cuadrícula logarítmica de los parámetros gamma y C utilizando np.logspace.
  • Dividir los datos en conjuntos de entrenamiento y prueba utilizando StratifiedShuffleSplit.
  • Realizar una búsqueda en cuadrícula utilizando GridSearchCV para encontrar los mejores parámetros para el modelo SVM.
  • Ajustar un clasificador para todos los parámetros en la versión bidimensional.

Visualización

  • Visualizar la función de decisión para una variedad de valores de parámetros en un problema de clasificación simplificado que involucre solo 2 características de entrada y 2 posibles clases de destino (clasificación binaria).
  • Visualizar el mapa de calor de la precisión de validación cruzada del clasificador en función de C y gamma.

Interpretación

  • Interpretar los resultados de la visualización y elegir los valores óptimos para C y gamma.

Resumen

Esta práctica demostró cómo ajustar los parámetros de un SVM con kernel de Función Básica Radial (RBF). Los parámetros gamma y C del kernel RBF son cruciales para el rendimiento del modelo SVM, y los valores óptimos de estos parámetros se pueden encontrar utilizando una combinación de técnicas de búsqueda en cuadrícula y visualización.