Введение
В этом практическом занятии мы научимся строить соответствующую дендрограмму иерархической кластеризации с использованием AgglomerativeClustering и метода дендрограммы из scipy.
Советы по работе с ВМ
После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Ноутбук и получить доступ к Jupyter Notebook для практики.
Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импортируем необходимые библиотеки
Начнем с импорта необходимых библиотек для этого практического занятия.
import numpy as np
from matplotlib import pyplot as plt
from scipy.cluster.hierarchy import dendrogram
from sklearn.datasets import load_iris
from sklearn.cluster import AgglomerativeClustering
Загружаем датасет
Мы будем использовать функцию load_iris() из модуля sklearn.datasets для загрузки датасета iris.
iris = load_iris()
X = iris.data
Создаем модель
Далее мы создадим модель агломеративной кластеризации с использованием функции AgglomerativeClustering() из модуля sklearn.cluster.
model = AgglomerativeClustering(distance_threshold=0, n_clusters=None)
Обучаем модель
Мы обучим модель агломеративной кластеризации с использованием метода fit() объекта модели.
model = model.fit(X)
Построение дендрограммы
Мы построим дендрограмму с использованием функции dendrogram() из модуля scipy.cluster.hierarchy и функции plot_dendrogram(), определенной в исходном коде.
plt.title("Hierarchical Clustering Dendrogram")
plot_dendrogram(model, truncate_mode="level", p=3)
plt.xlabel("Number of points in node (or index of point if no parenthesis).")
plt.show()
Резюме
В этом практическом занятии мы узнали, как построить соответствующую дендрограмму иерархической кластеризации с использованием AgglomerativeClustering и метода дендрограммы из scipy. Мы загрузили датасет iris, создали модель агломеративной кластеризации и обучили ее. Наконец, мы построили дендрограмму с использованием функции dendrogram() из модуля scipy.cluster.hierarchy и функции plot_dendrogram(), определенной в исходном коде.