Introducción
Esta práctica muestra cómo imputar datos faltantes en un conjunto de datos utilizando diferentes técnicas en scikit-learn. Los conjuntos de datos utilizados aquí son el conjunto de datos de diabetes con 10 características y el conjunto de datos de viviendas de California con 8 características. Los valores faltantes se pueden reemplazar por la media, la mediana o el valor más frecuente utilizando SimpleImputer. Esta práctica investigará diferentes técnicas de imputación, como la imputación por un valor constante, la imputación por la media de cada característica combinada con una variable auxiliar indicadora de ausencia de datos, la imputación de los k vecinos más cercanos y la imputación iterativa.
Consejos sobre la VM
Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.
Skills Graph
%%%%{init: {'theme':'neutral'}}%%%%
flowchart RL
sklearn(("Sklearn")) -.-> sklearn/DataPreprocessingandFeatureEngineeringGroup(["Data Preprocessing and Feature Engineering"])
sklearn(("Sklearn")) -.-> sklearn/ModelSelectionandEvaluationGroup(["Model Selection and Evaluation"])
sklearn(("Sklearn")) -.-> sklearn/UtilitiesandDatasetsGroup(["Utilities and Datasets"])
ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"])
sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"])
sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/ensemble("Ensemble Methods")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/pipeline("Pipeline")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/impute("Impute")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/model_selection("Model Selection")
sklearn/UtilitiesandDatasetsGroup -.-> sklearn/datasets("Datasets")
sklearn/UtilitiesandDatasetsGroup -.-> sklearn/experimental("Experimental")
ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn")
subgraph Lab Skills
sklearn/ensemble -.-> lab-49213{{"Imputar Datos Faltantes"}}
sklearn/pipeline -.-> lab-49213{{"Imputar Datos Faltantes"}}
sklearn/impute -.-> lab-49213{{"Imputar Datos Faltantes"}}
sklearn/model_selection -.-> lab-49213{{"Imputar Datos Faltantes"}}
sklearn/datasets -.-> lab-49213{{"Imputar Datos Faltantes"}}
sklearn/experimental -.-> lab-49213{{"Imputar Datos Faltantes"}}
ml/sklearn -.-> lab-49213{{"Imputar Datos Faltantes"}}
end