简介
主成分回归(Principal Component Regression,PCR)和偏最小二乘回归(Partial Least Squares Regression,PLS)是回归分析中使用的两种方法。PCR 涉及对训练数据应用主成分分析(PCA),然后在变换后的样本上训练回归器。PCA 变换是无监督的,这意味着不使用关于目标的任何信息。因此,在某些目标与低方差方向高度相关的数据集中,PCR 的性能可能较差。
PLS 既是一个变换器又是一个回归器,它与 PCR 非常相似。它也在对变换后的数据应用线性回归器之前对样本进行降维。与 PCR 的主要区别在于,PLS 变换是有监督的。因此,它不会受到上述问题的影响。
在本实验中,我们将在一个简单的数据集上比较 PCR 和 PLS。
虚拟机使用提示
虚拟机启动完成后,点击左上角切换到“笔记本”标签以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作的验证无法自动化。
如果你在学习过程中遇到问题,随时向 Labby 提问。课程结束后提供反馈,我们将为你迅速解决问题。