Introducción
En el aprendizaje automático, una canalización es una serie de pasos que se realizan secuencialmente para transformar los datos de entrada y luego construir un modelo. Scikit-learn proporciona una clase de canalización que se puede utilizar para encadenar múltiples pasos de procesamiento juntos, lo que facilita la construcción de modelos complejos que implican múltiples pasos de preprocesamiento y modelado.
En este tutorial, demostraremos cómo construir una canalización con selección de características y clasificación SVM utilizando Scikit-learn. Mostraremos cómo integrar la selección de características dentro de la canalización para evitar el sobreajuste y cómo inspeccionar la canalización para entender mejor el modelo.
Consejos sobre la VM
Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.
Skills Graph
%%%%{init: {'theme':'neutral'}}%%%%
flowchart RL
ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"])
sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"])
sklearn(("Sklearn")) -.-> sklearn/DataPreprocessingandFeatureEngineeringGroup(["Data Preprocessing and Feature Engineering"])
sklearn(("Sklearn")) -.-> sklearn/ModelSelectionandEvaluationGroup(["Model Selection and Evaluation"])
sklearn(("Sklearn")) -.-> sklearn/UtilitiesandDatasetsGroup(["Utilities and Datasets"])
sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/svm("Support Vector Machines")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/feature_selection("Feature Selection")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/pipeline("Pipeline")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/model_selection("Model Selection")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/metrics("Metrics")
sklearn/UtilitiesandDatasetsGroup -.-> sklearn/datasets("Datasets")
ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn")
subgraph Lab Skills
sklearn/svm -.-> lab-49126{{"Construyendo tuberías de aprendizaje automático con Scikit-Learn"}}
sklearn/feature_selection -.-> lab-49126{{"Construyendo tuberías de aprendizaje automático con Scikit-Learn"}}
sklearn/pipeline -.-> lab-49126{{"Construyendo tuberías de aprendizaje automático con Scikit-Learn"}}
sklearn/model_selection -.-> lab-49126{{"Construyendo tuberías de aprendizaje automático con Scikit-Learn"}}
sklearn/metrics -.-> lab-49126{{"Construyendo tuberías de aprendizaje automático con Scikit-Learn"}}
sklearn/datasets -.-> lab-49126{{"Construyendo tuberías de aprendizaje automático con Scikit-Learn"}}
ml/sklearn -.-> lab-49126{{"Construyendo tuberías de aprendizaje automático con Scikit-Learn"}}
end