はじめに
多くの現実世界のデータセットには欠損値が含まれており、完全な数値データを想定する機械学習アルゴリズムを使用する際に問題を引き起こす可能性があります。このような場合、利用可能なデータを最大限活用するために欠損値を適切に処理することが重要です。一般的な戦略の 1 つは補完であり、これはデータの既知の部分に基づいて欠損値を埋めることを含みます。
このチュートリアルでは、Python の人気のある機械学習ライブラリである scikit-learn を使用して欠損値を補完するさまざまな戦略を探ります。
VM のヒント
VM の起動が完了したら、左上隅をクリックしてノートブックタブに切り替え、Jupyter Notebook を使って練習しましょう。
時々、Jupyter Notebook が読み込み終了するまで数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。
学習中に問題に遭遇した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。そうすれば、迅速に問題を解決します。