简介
在机器学习中,我们经常使用一个分数来评估分类模型的性能。然而,我们还需要检验这个分数的显著性,以确保模型性能不只是偶然因素导致的。这就是排列检验分数(permutation test score)发挥作用的地方。它通过计算分类器在数据集的 1000 种不同排列上的准确率来生成一个零分布。然后,将获得的分数大于使用原始数据获得的分数的排列所占的百分比计算为经验 p 值。在这个实验中,我们将使用 sklearn.model_selection
中的 permutation_test_score
函数,通过排列来评估交叉验证分数的显著性。
虚拟机使用提示
虚拟机启动完成后,点击左上角切换到“笔记本”标签页,以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。
如果你在学习过程中遇到问题,随时向 Labby 提问。课程结束后提供反馈,我们会及时为你解决问题。