Дендрограмма иерархической кластеризации

Machine LearningMachine LearningBeginner
Практиковаться сейчас

This tutorial is from open-source community. Access the source code

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом практическом занятии мы научимся строить соответствующую дендрограмму иерархической кластеризации с использованием AgglomerativeClustering и метода дендрограммы из scipy.

Советы по работе с ВМ

После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Ноутбук и получить доступ к Jupyter Notebook для практики.

Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем необходимые библиотеки

Начнем с импорта необходимых библиотек для этого практического занятия.

import numpy as np
from matplotlib import pyplot as plt
from scipy.cluster.hierarchy import dendrogram
from sklearn.datasets import load_iris
from sklearn.cluster import AgglomerativeClustering

Загружаем датасет

Мы будем использовать функцию load_iris() из модуля sklearn.datasets для загрузки датасета iris.

iris = load_iris()
X = iris.data

Создаем модель

Далее мы создадим модель агломеративной кластеризации с использованием функции AgglomerativeClustering() из модуля sklearn.cluster.

model = AgglomerativeClustering(distance_threshold=0, n_clusters=None)

Обучаем модель

Мы обучим модель агломеративной кластеризации с использованием метода fit() объекта модели.

model = model.fit(X)

Построение дендрограммы

Мы построим дендрограмму с использованием функции dendrogram() из модуля scipy.cluster.hierarchy и функции plot_dendrogram(), определенной в исходном коде.

plt.title("Hierarchical Clustering Dendrogram")
plot_dendrogram(model, truncate_mode="level", p=3)
plt.xlabel("Number of points in node (or index of point if no parenthesis).")
plt.show()

Резюме

В этом практическом занятии мы узнали, как построить соответствующую дендрограмму иерархической кластеризации с использованием AgglomerativeClustering и метода дендрограммы из scipy. Мы загрузили датасет iris, создали модель агломеративной кластеризации и обучили ее. Наконец, мы построили дендрограмму с использованием функции dendrogram() из модуля scipy.cluster.hierarchy и функции plot_dendrogram(), определенной в исходном коде.