简介
本实验将展示如何比较使用和不使用邻域成分分析(Neighborhood Components Analysis,NCA)的最近邻分类。我们将绘制最近邻分类器在原始特征上使用欧几里得距离时给出的类别决策边界,与在通过邻域成分分析学习到的变换之后使用欧几里得距离时的情况进行对比。后者旨在找到一个线性变换,使训练集上的(随机)最近邻分类准确率最大化。我们将使用鸢尾花数据集,它包含 3 个类别,每个类别有 50 个实例。
虚拟机使用提示
虚拟机启动完成后,点击左上角切换到笔记本标签页,以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作的验证无法自动化。
如果你在学习过程中遇到问题,可以随时向 Labby 提问。课程结束后提供反馈,我们会及时为你解决问题。