はじめに
この実験では、scikit-learn で多項式カーネル近似を使用して、効率的に多項式カーネル特徴空間近似を生成する方法を示します。これは、カーネル化された分類器の精度に近似する線形分類器を訓練するために使用されます。私たちは、581,012 個のサンプルと 54 個の特徴を持ち、6 つのクラスに分布する Covtype データセットを使用します。このデータセットの目的は、地図学的変数のみから森林被覆タイプを予測することです (遠隔センシングデータは使用しません)。読み込んだ後、LIBSVM のウェブページにあるデータセットのバージョンに一致させるために、2 値分類問題に変換します。これは、元の論文で使用されたものです。
VM のヒント
VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替えて、Jupyter Notebook を使用して練習します。
Jupyter Notebook の読み込みには数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。
学習中に問題が発生した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。私たちは迅速に問題を解決します。