Introduction
De nombreux jeux de données du monde réel contiennent des valeurs manquantes, ce qui peut poser des problèmes lorsqu'on utilise des algorithmes d'apprentissage automatique qui supposent des données complètes et numériques. Dans de tels cas, il est important de traiter les valeurs manquantes de manière appropriée pour tirer le meilleur parti des données disponibles. Une stratégie courante est l'imputation, qui consiste à remplir les valeurs manquantes sur la base de la partie connue des données.
Dans ce tutoriel, nous allons explorer différentes stratégies d'imputation des valeurs manquantes à l'aide de scikit-learn, une bibliothèque populaire d'apprentissage automatique en Python.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder à Jupyter Notebook pour la pratique.
Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limites de Jupyter Notebook.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous réglerons rapidement le problème pour vous.