はじめに
機械学習において、パイプラインとは、入力データを変換してからモデルを構築するために順次実行される一連のステップです。Scikit-learn は、複数の処理ステップをチェーン化するために使用できるパイプラインクラスを提供しており、複数の前処理とモデリングステップを含む複雑なモデルを構築するのを簡単にします。
このチュートリアルでは、Scikit-learn を使用して特徴選択と SVM 分類を備えたパイプラインを構築する方法を示します。パイプライン内に特徴選択を統合して過学習を防止する方法と、モデルをよりよく理解するためにパイプラインを調べる方法を示します。
VM のヒント
VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替えて、Jupyter Notebook を使って練習しましょう。
Jupyter Notebook の読み込みには数秒かかる場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。
学習中に問題が発生した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。