Introducción
En este laboratorio, aprenderá a realizar la clasificación semi-supervisada en un conjunto de datos de texto utilizando scikit-learn. El aprendizaje semi-supervisado es un tipo de aprendizaje automático en el que un modelo se entrena con datos etiquetados y no etiquetados. Este laboratorio cubrirá cómo utilizar los algoritmos de Autoentrenamiento y Propagación de Etiquetas para la clasificación de texto semi-supervisada. Utilizaremos el conjunto de datos 20 newsgroups para entrenar y probar nuestros modelos.
Consejos sobre la VM
Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.