Introduction
Ce laboratoire montrera comment comparer la classification par plus proches voisins avec et sans Analyse des Composantes du Voisinage (NCA). Nous tracerons les limites de décision de classe données par un classifieur des plus proches voisins lorsqu'on utilise la distance euclidienne sur les caractéristiques d'origine, par rapport à l'utilisation de la distance euclidienne après la transformation apprise par l'Analyse des Composantes du Voisinage. Ce dernier vise à trouver une transformation linéaire qui maximise la précision de classification par plus proches voisins (stochastique) sur l'ensemble d'entraînement. Nous utiliserons le jeu de données Iris qui contient 3 classes de 50 instances chacune.
Conseils sur la VM
Une fois le démarrage de la VM terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder au carnet Jupyter pour la pratique.
Parfois, vous devrez attendre quelques secondes pour que le carnet Jupyter ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limites du carnet Jupyter.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous réglerons rapidement le problème pour vous.