简介
在本实验中,我们将探索半监督学习的概念,它是机器学习的一种类型,其中一些训练数据被标记,而一些未被标记。半监督学习算法可以利用未标记的数据来提高模型的性能,并更好地推广到新样本。当我们有少量标记数据但大量未标记数据时,这特别有用。
在本实验中,我们将专注于两种半监督学习算法:自训练(Self Training)和标签传播(Label Propagation)。我们将学习如何使用 scikit-learn(Python 中一个流行的机器学习库)来实现和使用这些算法。
虚拟机使用提示
虚拟机启动完成后,点击左上角切换到“笔记本”标签以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。
如果你在学习过程中遇到问题,随时向 Labby 提问。课程结束后提供反馈,我们将立即为你解决问题。
Skills Graph
%%%%{init: {'theme':'neutral'}}%%%%
flowchart RL
sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"])
sklearn(("Sklearn")) -.-> sklearn/AdvancedDataAnalysisandDimensionalityReductionGroup(["Advanced Data Analysis and Dimensionality Reduction"])
ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"])
sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/linear_model("Linear Models")
sklearn/AdvancedDataAnalysisandDimensionalityReductionGroup -.-> sklearn/semi_supervised("Semi-Supervised Learning")
ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn")
subgraph Lab Skills
sklearn/linear_model -.-> lab-71111{{"半监督学习算法"}}
sklearn/semi_supervised -.-> lab-71111{{"半监督学习算法"}}
ml/sklearn -.-> lab-71111{{"半监督学习算法"}}
end