はじめに
このチュートリアルでは、ガウス混合モデル (GMM) で異なる共分散タイプを使用する方法を示します。GMM は頻繁にクラスタリングに使用され、取得したクラスタとデータセットの実際のクラスを比較することができます。この比較を有効にするために、ガウス分布の平均値を訓練セットのクラスの平均値で初期化します。アイリスデータセットでさまざまな GMM 共分散タイプを使用して、訓練データとホールドアウトテストデータの両方に予測ラベルをプロットします。性能の昇順で、球状、対角線、完全、および結合された共分散行列を持つ GMM を比較します。
一般的には完全共分散が最適な性能を発揮すると予想されますが、小さなデータセットではオーバーフィッティングの傾向があり、ホールドアウトテストデータに対する汎化性能は良好ではありません。
プロットでは、訓練データはドットとして表示され、テストデータはクロスとして表示されます。アイリスデータセットは 4 次元です。ここでは最初の 2 次元のみが表示されており、したがって一部の点は他の次元で分離されています。
VM のヒント
VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替え、Jupyter Notebook を使用して練習します。
場合によっては、Jupyter Notebook が読み込み完了するまで数秒待つ必要があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。
学習中に問題に遭遇した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。