Introduction
Ce laboratoire montre comment utiliser l'importance de permutation sur l'ensemble de données du cancer du sein du Wisconsin à l'aide de la fonction permutation_importance
de sklearn.inspection
. Le classifieur Random Forest est utilisé pour classifier les données et calculer sa précision sur un ensemble de test. Nous montrerons également comment gérer la multicolinéarité dans les fonctionnalités en utilisant l'agrégation hiérarchique.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder au carnet Jupyter pour pratiquer.
Parfois, vous devrez attendre quelques secondes pour que le carnet Jupyter ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations du carnet Jupyter.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.