简介
本实验将演示如何在 scikit-learn 中使用多项式核近似来高效地生成多项式核特征空间近似。这用于训练线性分类器,使其近似核化分类器的准确率。我们将使用 Covtype 数据集,该数据集包含 581,012 个样本,每个样本有 54 个特征,分布在 6 个类别中。该数据集的目标是仅根据地图变量预测森林覆盖类型(无遥感数据)。加载后,我们将其转换为二分类问题,以匹配 LIBSVM 网页上的数据集版本,该版本是原始论文中使用的版本。
虚拟机提示
虚拟机启动完成后,点击左上角切换到“笔记本”标签页,以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。
如果你在学习过程中遇到问题,请随时向 Labby 提问。课程结束后提供反馈,我们将立即为你解决问题。