はじめに
この実験では、ColumnTransformer
を使用して、異なる特徴量のサブセットに対してさまざまな前処理と特徴量抽出パイプラインを適用する方法を示します。これは、異種データ型を含むデータセットの場合に特に便利です。なぜなら、数値型の特徴量をスケーリングし、カテゴリ型の特徴量をワンホットエンコードする必要がある場合があるからです。
この実験では、OpenML からのタイタニック号のデータセットを使用して、ColumnTransformer
を使ってカテゴリデータと数値データの両方を前処理するパイプラインを構築し、それを使ってロジスティック回帰モデルを学習させます。
VM のヒント
VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替え、Jupyter Notebook を使って練習しましょう。
時々、Jupyter Notebook が読み込み終わるまで数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証は自動化できません。
学習中に問題に遭遇した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。そうすれば、迅速に問題を解決します。