Введение
Регрессия по главным компонентам (PCR - Principal Component Regression) и частичная наименьших квадратов регрессия (PLS - Partial Least Squares Regression) - это два метода, используемые в анализе регрессии. PCR заключается в применении PCA (Principal Component Analysis) к тренировочным данным, за которым следует обучение регрессора на преобразованных образцах. Преобразование PCA является ненаправленным, что означает, что никакой информации о целевых переменных не используется. В результате PCR может показать плохие результаты в некоторых наборах данных, где целевая переменная сильно коррелирует с направлениями, имеющими низкую дисперсию.
PLS является и трансформером, и регрессором, и он весьма похож на PCR. Он также применяет понижение размерности к образцам перед применением линейного регрессора к преобразованным данным. Основное отличие от PCR заключается в том, что преобразование PLS является направленным. Поэтому он не страдает от вышеупомянутой проблемы.
В этом лабе мы сравним PCR и PLS на наборе данных для экспериментов.
Советы по работе с ВМ
После запуска ВМ кликните в левом верхнем углу, чтобы переключиться на вкладку Notebook, чтобы получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Skills Graph
%%%%{init: {'theme':'neutral'}}%%%%
flowchart RL
ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"])
sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"])
sklearn(("Sklearn")) -.-> sklearn/DataPreprocessingandFeatureEngineeringGroup(["Data Preprocessing and Feature Engineering"])
sklearn(("Sklearn")) -.-> sklearn/ModelSelectionandEvaluationGroup(["Model Selection and Evaluation"])
sklearn(("Sklearn")) -.-> sklearn/AdvancedDataAnalysisandDimensionalityReductionGroup(["Advanced Data Analysis and Dimensionality Reduction"])
sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/linear_model("Linear Models")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/preprocessing("Preprocessing and Normalization")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/pipeline("Pipeline")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/model_selection("Model Selection")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/cross_decomposition("Cross decomposition")
sklearn/AdvancedDataAnalysisandDimensionalityReductionGroup -.-> sklearn/decomposition("Matrix Decomposition")
ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn")
subgraph Lab Skills
sklearn/linear_model -.-> lab-49243{{"Построение графика PCR против PLS"}}
sklearn/preprocessing -.-> lab-49243{{"Построение графика PCR против PLS"}}
sklearn/pipeline -.-> lab-49243{{"Построение графика PCR против PLS"}}
sklearn/model_selection -.-> lab-49243{{"Построение графика PCR против PLS"}}
sklearn/cross_decomposition -.-> lab-49243{{"Построение графика PCR против PLS"}}
sklearn/decomposition -.-> lab-49243{{"Построение графика PCR против PLS"}}
ml/sklearn -.-> lab-49243{{"Построение графика PCR против PLS"}}
end