Introducción
Esta práctica muestra cómo imputar datos faltantes en un conjunto de datos utilizando diferentes técnicas en scikit-learn. Los conjuntos de datos utilizados aquí son el conjunto de datos de diabetes con 10 características y el conjunto de datos de viviendas de California con 8 características. Los valores faltantes se pueden reemplazar por la media, la mediana o el valor más frecuente utilizando SimpleImputer. Esta práctica investigará diferentes técnicas de imputación, como la imputación por un valor constante, la imputación por la media de cada característica combinada con una variable auxiliar indicadora de ausencia de datos, la imputación de los k vecinos más cercanos y la imputación iterativa.
Consejos sobre la VM
Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.