简介
在本实验中,我们将探讨模型复杂度如何影响预测准确性和计算性能。我们将使用两个数据集 —— 用于回归的糖尿病数据集和用于分类的20新闻组数据集。我们将针对三种不同的估计器对复杂度影响进行建模:
- SGDClassifier(用于分类数据),它实现了随机梯度下降学习
- NuSVR(用于回归数据),它实现了Nu支持向量回归
- GradientBoostingRegressor以前向逐步方式构建加法模型
我们将通过在每个选定模型中选择相关模型参数来改变模型复杂度。接下来,我们将测量对计算性能(延迟)和预测能力(均方误差或汉明损失)的影响。
虚拟机使用提示
虚拟机启动完成后,点击左上角切换到“笔记本”标签页,以访问Jupyter Notebook进行练习。
有时,你可能需要等待几秒钟让Jupyter Notebook完成加载。由于Jupyter Notebook的限制,操作验证无法自动化。
如果你在学习过程中遇到问题,随时向Labby提问。课程结束后提供反馈,我们将立即为你解决问题。