Introduction
Dans ce laboratoire, nous allons explorer le concept d'apprentissage semi-supervisé, qui est un type d'apprentissage automatique où une partie des données d'entraînement est étiquetée et une partie est non étiquetée. Les algorithmes d'apprentissage semi-supervisé peuvent exploiter les données non étiquetées pour améliorer les performances du modèle et généraliser mieux à de nouvelles échantillons. Cela est particulièrement utile lorsque nous disposons d'un faible nombre de données étiquetées mais d'un grand nombre de données non étiquetées.
Dans ce laboratoire, nous allons nous concentrer sur deux algorithmes d'apprentissage semi-supervisé : l'auto-apprentissage et la propagation d'étiquettes. Nous allons apprendre à implémenter et à utiliser ces algorithmes à l'aide de scikit-learn, une bibliothèque populaire d'apprentissage automatique en Python.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder au carnet Jupyter Notebook pour la pratique.
Parfois, vous devrez peut-être attendre quelques secondes pour que le carnet Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations du carnet Jupyter Notebook.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.