简介
在机器学习中,特征重要性是理解哪些特征对目标变量影响最大的一个有价值的工具。在本实验中,我们将比较两种计算特征重要性的方法:基于杂质的特征重要性和排列重要性。我们将在泰坦尼克号数据集上使用随机森林分类器来说明这两种方法之间的差异。
虚拟机使用提示
虚拟机启动完成后,点击左上角切换到“笔记本”标签页,以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。
如果你在学习过程中遇到问题,随时向 Labby 提问。课程结束后提供反馈,我们会及时为你解决问题。