Введение
В машинном обучении конвейер (pipeline) — это последовательность шагов, которые выполняются по порядку для преобразования входных данных и затем построения модели. Scikit-learn предоставляет класс конвейера, который можно использовать для объединения нескольких этапов обработки в цепочку, что делает легким построение сложных моделей, которые включают несколько этапов предварительной обработки и моделирования.
В этом руководстве мы покажем, как построить конвейер с отбором признаков и классификацией с использованием SVM с помощью Scikit-learn. Мы покажем, как интегрировать отбор признаков в конвейер для предотвращения переобучения, и как изучить конвейер, чтобы лучше понять модель.
Советы по работе с ВМ
После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами при обучении, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Skills Graph
%%%%{init: {'theme':'neutral'}}%%%%
flowchart RL
sklearn(("Sklearn")) -.-> sklearn/ModelSelectionandEvaluationGroup(["Model Selection and Evaluation"])
sklearn(("Sklearn")) -.-> sklearn/UtilitiesandDatasetsGroup(["Utilities and Datasets"])
ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"])
sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"])
sklearn(("Sklearn")) -.-> sklearn/DataPreprocessingandFeatureEngineeringGroup(["Data Preprocessing and Feature Engineering"])
sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/svm("Support Vector Machines")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/feature_selection("Feature Selection")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/pipeline("Pipeline")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/model_selection("Model Selection")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/metrics("Metrics")
sklearn/UtilitiesandDatasetsGroup -.-> sklearn/datasets("Datasets")
ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn")
subgraph Lab Skills
sklearn/svm -.-> lab-49126{{"Построение конвейеров машинного обучения с использованием Scikit - Learn"}}
sklearn/feature_selection -.-> lab-49126{{"Построение конвейеров машинного обучения с использованием Scikit - Learn"}}
sklearn/pipeline -.-> lab-49126{{"Построение конвейеров машинного обучения с использованием Scikit - Learn"}}
sklearn/model_selection -.-> lab-49126{{"Построение конвейеров машинного обучения с использованием Scikit - Learn"}}
sklearn/metrics -.-> lab-49126{{"Построение конвейеров машинного обучения с использованием Scikit - Learn"}}
sklearn/datasets -.-> lab-49126{{"Построение конвейеров машинного обучения с использованием Scikit - Learn"}}
ml/sklearn -.-> lab-49126{{"Построение конвейеров машинного обучения с использованием Scikit - Learn"}}
end