简介
在本实验中,我们将探索聚类,这是一种流行的无监督机器学习技术。聚类用于根据数据点的特征或属性将相似的数据点分组在一起,而无需标记的训练数据。有各种聚类算法可供选择,每种算法都有其自身的优缺点。在本实验中,我们将重点关注 k 均值聚类算法。
虚拟机使用提示
虚拟机启动完成后,点击左上角切换到“笔记本”标签,以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。
如果你在学习过程中遇到问题,随时向 Labby 提问。课程结束后提供反馈,我们将立即为你解决问题。
Skills Graph
%%%%{init: {'theme':'neutral'}}%%%%
flowchart RL
sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"])
sklearn(("Sklearn")) -.-> sklearn/UtilitiesandDatasetsGroup(["Utilities and Datasets"])
ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"])
sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/cluster("Clustering")
sklearn/UtilitiesandDatasetsGroup -.-> sklearn/datasets("Datasets")
ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn")
subgraph Lab Skills
sklearn/cluster -.-> lab-71116{{"使用 K 均值的无监督聚类"}}
sklearn/datasets -.-> lab-71116{{"使用 K 均值的无监督聚类"}}
ml/sklearn -.-> lab-71116{{"使用 K 均值的无监督聚类"}}
end