Introduction
En machine learning, un pipeline est une série d'étapes effectuées séquentiellement pour transformer les données d'entrée puis construire un modèle. Scikit-learn fournit une classe pipeline qui peut être utilisée pour chaîner plusieurs étapes de traitement ensemble, facilitant la construction de modèles complexes impliquant plusieurs étapes de prétraitement et de modélisation.
Dans ce tutoriel, nous allons démontrer comment construire un pipeline avec une sélection de caractéristiques et une classification SVM à l'aide de Scikit-learn. Nous montrerons comment intégrer la sélection de caractéristiques dans le pipeline pour éviter le surapprentissage, et comment examiner le pipeline pour mieux comprendre le modèle.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.
Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez des commentaires après la session, et nous réglerons rapidement le problème pour vous.
Skills Graph
%%%%{init: {'theme':'neutral'}}%%%%
flowchart RL
sklearn(("Sklearn")) -.-> sklearn/UtilitiesandDatasetsGroup(["Utilities and Datasets"])
ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"])
sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"])
sklearn(("Sklearn")) -.-> sklearn/DataPreprocessingandFeatureEngineeringGroup(["Data Preprocessing and Feature Engineering"])
sklearn(("Sklearn")) -.-> sklearn/ModelSelectionandEvaluationGroup(["Model Selection and Evaluation"])
sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/svm("Support Vector Machines")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/feature_selection("Feature Selection")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/pipeline("Pipeline")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/model_selection("Model Selection")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/metrics("Metrics")
sklearn/UtilitiesandDatasetsGroup -.-> sklearn/datasets("Datasets")
ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn")
subgraph Lab Skills
sklearn/svm -.-> lab-49126{{"Construire des pipelines d'apprentissage automatique avec Scikit-Learn"}}
sklearn/feature_selection -.-> lab-49126{{"Construire des pipelines d'apprentissage automatique avec Scikit-Learn"}}
sklearn/pipeline -.-> lab-49126{{"Construire des pipelines d'apprentissage automatique avec Scikit-Learn"}}
sklearn/model_selection -.-> lab-49126{{"Construire des pipelines d'apprentissage automatique avec Scikit-Learn"}}
sklearn/metrics -.-> lab-49126{{"Construire des pipelines d'apprentissage automatique avec Scikit-Learn"}}
sklearn/datasets -.-> lab-49126{{"Construire des pipelines d'apprentissage automatique avec Scikit-Learn"}}
ml/sklearn -.-> lab-49126{{"Construire des pipelines d'apprentissage automatique avec Scikit-Learn"}}
end