Introduction
Dans ce laboratoire, nous comparerons les performances de différents encoders catégoriels sur un ensemble de données d'évaluation de vins. Nous utiliserons la colonne cible 'points' comme variable cible à prédire. Nous comparerons les encoders suivants : TargetEncoder, OneHotEncoder, OrdinalEncoder et la suppression de la catégorie. Nous examinerons également comment utiliser la prise en charge native des fonctionnalités catégorielles dans HistGradientBoostingRegressor
.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder au carnet Jupyter pour pratiquer.
Parfois, vous devrez peut-être attendre quelques secondes pour que le carnet Jupyter ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations du carnet Jupyter.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez des commentaires après la session et nous résoudrons rapidement le problème pour vous.