소개
이 튜토리얼에서는 가우시안 혼합 모델 (GMM) 의 다양한 공분산 유형의 사용법을 보여줍니다. GMM 은 종종 클러스터링에 사용되며, 얻은 클러스터를 데이터 세트의 실제 클래스와 비교할 수 있습니다. 이러한 비교를 유효하게 하기 위해 가우시안의 평균을 훈련 세트의 클래스 평균으로 초기화합니다. 우리는 아이리스 데이터 세트에서 다양한 GMM 공분산 유형을 사용하여 훈련 및 홀드아웃 테스트 데이터에 예측된 레이블을 플롯합니다. 우리는 구형, 대각, 전체 및 결합된 공분산 행렬의 GMM 을 성능이 증가하는 순서대로 비교합니다.
일반적으로 전체 공분산이 가장 좋은 성능을 보일 것으로 예상되지만, 작은 데이터 세트에서 과적합되기 쉽고 홀드아웃 테스트 데이터에 잘 일반화되지 않습니다.
플롯에서 훈련 데이터는 점으로, 테스트 데이터는 십자표시로 표시됩니다. 아이리스 데이터 세트는 4 차원입니다. 여기서는 앞의 두 차원만 표시되므로 일부 점은 다른 차원에서 분리됩니다.
VM 팁
VM 시작이 완료되면 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 연습을 위한 Jupyter Notebook에 접근할 수 있습니다.
때때로 Jupyter Notebook 이 완전히 로드되기까지 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사를 자동화할 수 없습니다.
학습 중 문제가 발생하면 Labby 에 문의하십시오. 세션 후 피드백을 제공하면 문제를 신속하게 해결해 드리겠습니다.