Introduction
Dans ce laboratoire, vous allez apprendre à effectuer une classification semi-supervisée sur un ensemble de données textuelles à l'aide de scikit-learn. L'apprentissage semi-supervisé est un type d'apprentissage automatique où un modèle est entraîné sur des données étiquetées et non étiquetées. Ce laboratoire couvrira la manière d'utiliser les algorithmes Self-Training et LabelSpreading pour la classification textuelle semi-supervisée. Nous utiliserons l'ensemble de données 20 newsgroups pour entraîner et tester nos modèles.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.
Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.