Comprender la complejidad del modelo en el aprendizaje automático

Introducción

En este laboratorio, exploraremos cómo la complejidad del modelo influye en la precisión de predicción y el rendimiento computacional. Utilizaremos dos conjuntos de datos: el Conjunto de Datos de Diabetes para regresión y el Conjunto de Datos 20newsgroups para clasificación. Modelaremos la influencia de la complejidad en tres estimadores diferentes:

SGDClassifier (para datos de clasificación) que implementa el aprendizaje por descenso de gradiente estocástico
NuSVR (para datos de regresión) que implementa la regresión de vectores de soporte Nu
GradientBoostingRegressor que construye un modelo aditivo de manera secuencial en etapas

Variaremos la complejidad del modelo a través de la selección de parámetros de modelo relevantes en cada uno de nuestros modelos seleccionados. A continuación, mediremos la influencia en el rendimiento computacional (latencia) y la capacidad predictiva (MSE o Pérdida de Hamming).

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de operaciones no puede automatizarse debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y resolveremos rápidamente el problema para usted.

Cargar los datos

Cargamos ambos conjuntos de datos: el conjunto de datos de diabetes para regresión y el conjunto de datos 20newsgroups para clasificación.

Elegir parámetros

Elegimos los parámetros para cada uno de nuestros estimadores creando un diccionario con todos los valores necesarios. Definimos el parámetro variable, la etiqueta de complejidad, el computador de complejidad, los datos y otros valores de configuración para cada estimador.

Influencia de la prueba de rendimiento

Calculamos la influencia de los parámetros en el estimador dado. En cada ronda, configuramos el estimador con el nuevo valor del parámetro variable y recolectamos los tiempos de predicción, el rendimiento de predicción y las complejidades para ver cómo esos cambios afectan al estimador. Calculamos la complejidad utilizando el computador de complejidad pasado como parámetro.

Representar los resultados

Representamos la influencia de la complejidad del modelo tanto en la precisión como en la latencia. Utilizamos el error de predicción en el eje y y la complejidad del modelo en el eje x. Representamos tanto el error de predicción como la latencia de predicción en la misma gráfica.

Resumen

En este laboratorio, exploramos cómo la complejidad del modelo influye tanto en la precisión de predicción como en el rendimiento computacional. Variamos la complejidad del modelo a través de la selección de parámetros de modelo relevantes en cada uno de nuestros modelos seleccionados. Luego medimos la influencia en el rendimiento computacional (latencia) y en el poder predictivo (MSE o Pérdida de Hamming). Concluimos que un modelo más complejo requiere más tiempo de entrenamiento y no garantiza reducir el error de predicción.