계층적 군집 데ンドログラム | 데이터 과학 튜토리얼

소개

이 실습에서는 scipy 에서 제공하는 AgglomerativeClustering 과 dendrogram 메서드를 사용하여 계층적 군집화의 해당 데ンドログラム을 그리는 방법을 배웁니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 연습을 위한 Jupyter Notebook에 접근합니다.

때때로 Jupyter Notebook 이 완전히 로드되기까지 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사를 자동화할 수 없습니다.

학습 중 문제가 발생하면 Labby 에게 문의하십시오. 세션 후 피드백을 제공하면 문제를 신속하게 해결해 드리겠습니다.

필요한 라이브러리 가져오기

이 실습에서는 필요한 라이브러리를 가져오는 것으로 시작합니다.

import numpy as np
from matplotlib import pyplot as plt
from scipy.cluster.hierarchy import dendrogram
from sklearn.datasets import load_iris
from sklearn.cluster import AgglomerativeClustering

데이터셋 로드

sklearn.datasets 모듈의 load_iris() 함수를 사용하여 아이리스 데이터셋을 로드합니다.

iris = load_iris()
X = iris.data

모델 생성

다음으로 sklearn.cluster 모듈의 AgglomerativeClustering() 함수를 사용하여 계층적 군집화 모델을 생성합니다.

model = AgglomerativeClustering(distance_threshold=0, n_clusters=None)

모델 적용

모델 객체의 fit() 메서드를 사용하여 계층적 군집화 모델을 적용합니다.

model = model.fit(X)

데ンドログラム 시각화

scipy.cluster.hierarchy 모듈의 dendrogram() 함수와 원본 코드에서 정의된 plot_dendrogram() 함수를 사용하여 데ンドログラム을 시각화합니다.

plt.title("계층적 군집 데ンドログラム")
plot_dendrogram(model, truncate_mode="level", p=3)
plt.xlabel("노드 내 점의 개수 (괄호 없으면 점의 인덱스).")
plt.show()

요약

이 실습에서는 AgglomerativeClustering 과 scipy 에서 제공하는 dendrogram 메서드를 사용하여 계층적 군집화의 해당 데ンドログラム을 시각화하는 방법을 배웠습니다. iris 데이터셋을 로드하고, 계층적 군집화 모델을 생성한 후 모델을 적용했습니다. 마지막으로 scipy.cluster.hierarchy 모듈의 dendrogram() 함수와 원본 코드에서 정의된 plot_dendrogram() 함수를 사용하여 데ンドログラム을 시각화했습니다.

계층적 군집 데ンドログラム 시각화

소개