Introducción
Esta práctica ilustra cómo aplicar diferentes flujos de preprocesamiento y extracción de características a diferentes subconjuntos de características, utilizando ColumnTransformer
. Esto es particularmente útil en el caso de conjuntos de datos que contienen diferentes tipos de datos heterogéneos, ya que es posible que queramos escalar las características numéricas y codificar en caliente las categóricas.
En esta práctica, utilizaremos el conjunto de datos del Titanic de OpenML para construir un flujo de trabajo que preprocese datos categóricos y numéricos utilizando ColumnTransformer
y lo utilice para entrenar un modelo de regresión logística.
Consejos sobre la VM
Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.
Skills Graph
%%%%{init: {'theme':'neutral'}}%%%%
flowchart RL
sklearn(("Sklearn")) -.-> sklearn/DataPreprocessingandFeatureEngineeringGroup(["Data Preprocessing and Feature Engineering"])
sklearn(("Sklearn")) -.-> sklearn/ModelSelectionandEvaluationGroup(["Model Selection and Evaluation"])
ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"])
sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"])
sklearn(("Sklearn")) -.-> sklearn/UtilitiesandDatasetsGroup(["Utilities and Datasets"])
sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/linear_model("Linear Models")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/preprocessing("Preprocessing and Normalization")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/feature_selection("Feature Selection")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/pipeline("Pipeline")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/impute("Impute")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/model_selection("Model Selection")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/compose("Composite Estimators")
sklearn/UtilitiesandDatasetsGroup -.-> sklearn/datasets("Datasets")
ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn")
subgraph Lab Skills
sklearn/linear_model -.-> lab-49086{{"Column Transformer con Tipos Mixtos"}}
sklearn/preprocessing -.-> lab-49086{{"Column Transformer con Tipos Mixtos"}}
sklearn/feature_selection -.-> lab-49086{{"Column Transformer con Tipos Mixtos"}}
sklearn/pipeline -.-> lab-49086{{"Column Transformer con Tipos Mixtos"}}
sklearn/impute -.-> lab-49086{{"Column Transformer con Tipos Mixtos"}}
sklearn/model_selection -.-> lab-49086{{"Column Transformer con Tipos Mixtos"}}
sklearn/compose -.-> lab-49086{{"Column Transformer con Tipos Mixtos"}}
sklearn/datasets -.-> lab-49086{{"Column Transformer con Tipos Mixtos"}}
ml/sklearn -.-> lab-49086{{"Column Transformer con Tipos Mixtos"}}
end