Введение
В этом практическом занятии мы будем изучать алгоритм кластеризации K-Means с использованием библиотеки scikit-learn в Python. Мы будем использовать набор данных с рукописными цифрами, который содержит 64 признака, представляющих 8x8 изображение цифры, и попытаемся сгруппировать изображения в соответствии с цифрой, которую они представляют. Мы сравним различные методы инициализации для K-Means и оценим производительность кластеризации с использованием различных метрик.
Советы по работе с ВМ
После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.