简介
本实验展示了在多标签数据集上使用分类器链的示例。分类器链算法是对多标签分类问题转换方法的一种改进。该方法通过构建二元分类器链来利用类别之间的相关性。每个模型将链中前序模型的预测结果作为特征。我们将使用 “酵母”(yeast)数据集,该数据集包含2417个数据点,每个数据点有103个特征和14个可能的标签。每个数据点至少有一个标签。作为基线,我们首先为14个标签中的每一个训练一个逻辑回归分类器。为了评估这些分类器的性能,我们在一个留出的测试集上进行预测,并计算每个样本的杰卡德分数。
虚拟机使用提示
虚拟机启动完成后,点击左上角切换到 “笔记本”(Notebook)标签页,以访问Jupyter Notebook进行练习。
有时,你可能需要等待几秒钟让Jupyter Notebook完成加载。由于Jupyter Notebook的限制,操作的验证无法自动化。
如果你在学习过程中遇到问题,随时向Labby提问。课程结束后提供反馈,我们会及时为你解决问题。
Skills Graph
%%%%{init: {'theme':'neutral'}}%%%%
flowchart RL
ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"])
ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn")
subgraph Lab Skills
ml/sklearn -.-> lab-49079{{"分类器链集成模型"}}
end