はじめに
この実験では、モデルの複雑さが予測精度と計算性能にどのように影響するかを調べます。回帰用のデータセットであるDiabetes Datasetと分類用のデータセットである20newsgroups Datasetの2つのデータセットを使用します。3つの異なる推定器に対する複雑さの影響をモデル化します。
- 確率的勾配降下法学習を実装するSGDClassifier(分類データ用)
- Nuサポートベクトル回帰を実装するNuSVR(回帰データ用)
- GradientBoostingRegressorは、順次前方ステージ方式で加法的モデルを構築します
選択した各モデルの関連するモデルパラメータの選択を通じて、モデルの複雑さを変化させます。次に、計算性能(レイテンシ)と予測力(MSEまたはハミング損失)の両方に対する影響を測定します。
VMのヒント
VMの起動が完了したら、左上隅をクリックしてノートブックタブに切り替えて、Jupyter Notebookを使って練習しましょう。
Jupyter Notebookが読み込み終わるまで数秒待つことがあります。Jupyter Notebookの制限により、操作の検証は自動化できません。
学習中に問題がある場合は、Labbyにお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決します。