简介
在机器学习中,每个估计器都有其优点和缺点。估计器的泛化误差可以分解为偏差、方差和噪声。估计器的偏差是不同训练集的平均误差,而方差表示其对不同训练集的敏感性。噪声是数据的一种属性。
在本实验中,我们将探索如何使用验证曲线来评估机器学习模型的性能。验证曲线使我们能够绘制单个超参数对训练分数和验证分数的影响,帮助我们确定模型对于不同超参数值是过拟合还是欠拟合。
虚拟机使用提示
虚拟机启动完成后,点击左上角切换到“笔记本”标签页,以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。
如果你在学习过程中遇到问题,随时向 Labby 提问。课程结束后提供反馈,我们将立即为你解决问题。
Skills Graph
%%%%{init: {'theme':'neutral'}}%%%%
flowchart RL
sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"])
sklearn(("Sklearn")) -.-> sklearn/ModelSelectionandEvaluationGroup(["Model Selection and Evaluation"])
sklearn(("Sklearn")) -.-> sklearn/UtilitiesandDatasetsGroup(["Utilities and Datasets"])
ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"])
sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/linear_model("Linear Models")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/model_selection("Model Selection")
sklearn/UtilitiesandDatasetsGroup -.-> sklearn/datasets("Datasets")
ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn")
subgraph Lab Skills
sklearn/linear_model -.-> lab-71125{{"验证曲线:绘制分数以评估模型"}}
sklearn/model_selection -.-> lab-71125{{"验证曲线:绘制分数以评估模型"}}
sklearn/datasets -.-> lab-71125{{"验证曲线:绘制分数以评估模型"}}
ml/sklearn -.-> lab-71125{{"验证曲线:绘制分数以评估模型"}}
end