Introducción
Esta práctica ilustra cómo aplicar diferentes flujos de preprocesamiento y extracción de características a diferentes subconjuntos de características, utilizando ColumnTransformer. Esto es particularmente útil en el caso de conjuntos de datos que contienen diferentes tipos de datos heterogéneos, ya que es posible que queramos escalar las características numéricas y codificar en caliente las categóricas.
En esta práctica, utilizaremos el conjunto de datos del Titanic de OpenML para construir un flujo de trabajo que preprocese datos categóricos y numéricos utilizando ColumnTransformer y lo utilice para entrenar un modelo de regresión logística.
Consejos sobre la VM
Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.