はじめに
多くの現実世界のデータセットには欠損値が含まれており、完全な数値データを想定する機械学習アルゴリズムを使用する際に問題を引き起こす可能性があります。このような場合、利用可能なデータを最大限活用するために欠損値を適切に処理することが重要です。一般的な戦略の1つは補完であり、これはデータの既知の部分に基づいて欠損値を埋めることを含みます。
このチュートリアルでは、Pythonの人気のある機械学習ライブラリであるscikit-learnを使用して欠損値を補完するさまざまな戦略を探ります。
VMのヒント
VMの起動が完了したら、左上隅をクリックしてノートブックタブに切り替え、Jupyter Notebookを使って練習しましょう。
時々、Jupyter Notebookが読み込み終了するまで数秒待つ必要がある場合があります。Jupyter Notebookの制限により、操作の検証を自動化することはできません。
学習中に問題に遭遇した場合は、Labbyにお問い合わせください。セッション後にフィードバックを提供してください。そうすれば、迅速に問題を解決します。