Введение
В этом руководстве демонстрируется использование различных типов ковариации для смесей Гаусса (GMM). GMM часто используются для кластеризации, и мы можем сравнить полученные кластеры с фактическими классами из набора данных. Мы инициализируем средние значения Гауссов с помощью средних значений классов из обучающего набора, чтобы сделать этот сравнение действительным. Мы строим предсказанные метки на обучающих и тестовых данных, используя различные типы ковариации GMM на наборе данных iris. Мы сравниваем GMM с сферическими, диагональными, полными и связанными матрицами ковариации в порядке возрастания производительности.
Хотя можно ожидать, что полная ковариация будет в целом давать наилучшие результаты, она склонна к переобучению на малых наборах данных и плохо обобщается на тестовые данные.
На графиках обучающие данные показываются в виде точек, а тестовые данные - в виде крестов. Набор данных iris четырехмерный. Здесь показаны только первые два измерения, и поэтому некоторые точки разделены в других измерениях.
Советы по работе с ВМ
После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.