Введение
В этом практическом занятии показано, как применить разные конвейеры предварительной обработки и извлечения признаков к различным подмножествам признаков с использованием ColumnTransformer
. Это особенно удобно в случае датасетов, содержащих различные типы данных, так как мы, возможно, захотим масштабировать числовые признаки и применить one-hot кодирование к категориальным.
В этом практическом занятии мы будем использовать датасет Titanic из OpenML для построения конвейера, который предварительно обрабатывает как категориальные, так и числовые данные с использованием ColumnTransformer
, и используем его для обучения модели логистической регрессии.
Советы по использованию ВМ
После запуска ВМ кликните в верхнем левом углу, чтобы переключиться на вкладку Ноутбук, чтобы получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Skills Graph
%%%%{init: {'theme':'neutral'}}%%%%
flowchart RL
sklearn(("Sklearn")) -.-> sklearn/DataPreprocessingandFeatureEngineeringGroup(["Data Preprocessing and Feature Engineering"])
sklearn(("Sklearn")) -.-> sklearn/ModelSelectionandEvaluationGroup(["Model Selection and Evaluation"])
sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"])
ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"])
sklearn(("Sklearn")) -.-> sklearn/UtilitiesandDatasetsGroup(["Utilities and Datasets"])
sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/linear_model("Linear Models")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/preprocessing("Preprocessing and Normalization")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/feature_selection("Feature Selection")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/pipeline("Pipeline")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/impute("Impute")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/model_selection("Model Selection")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/compose("Composite Estimators")
sklearn/UtilitiesandDatasetsGroup -.-> sklearn/datasets("Datasets")
ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn")
subgraph Lab Skills
sklearn/linear_model -.-> lab-49086{{"Column Transformer с смешанными типами"}}
sklearn/preprocessing -.-> lab-49086{{"Column Transformer с смешанными типами"}}
sklearn/feature_selection -.-> lab-49086{{"Column Transformer с смешанными типами"}}
sklearn/pipeline -.-> lab-49086{{"Column Transformer с смешанными типами"}}
sklearn/impute -.-> lab-49086{{"Column Transformer с смешанными типами"}}
sklearn/model_selection -.-> lab-49086{{"Column Transformer с смешанными типами"}}
sklearn/compose -.-> lab-49086{{"Column Transformer с смешанными типами"}}
sklearn/datasets -.-> lab-49086{{"Column Transformer с смешанными типами"}}
ml/sklearn -.-> lab-49086{{"Column Transformer с смешанными типами"}}
end