はじめに
この実験では、半教師あり学習の概念を探ります。半教師あり学習は、学習データの一部がラベル付けされており、一部がラベル付けされていない機械学習の一種です。半教師あり学習アルゴリズムは、ラベル付けされていないデータを活用して、モデルの性能を向上させ、新しいサンプルに対してより良く汎化させることができます。これは、ラベル付けされたデータが少なく、ラベル付けされていないデータが多い場合に特に役立ちます。
この実験では、Self Training と Label Propagation の 2 つの半教師あり学習アルゴリズムに焦点を当てます。Python の人気のある機械学習ライブラリである scikit-learn を使用して、これらのアルゴリズムを実装して使用する方法を学びます。
VM のヒント
VM の起動が完了したら、左上隅をクリックして Notebook タブに切り替え、Jupyter Notebook を使って練習しましょう。
時々、Jupyter Notebook が読み込み完了するまで数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。
学習中に問題に遭遇した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。そうすれば、迅速に問題を解決します。
Skills Graph
%%%%{init: {'theme':'neutral'}}%%%%
flowchart RL
sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"])
sklearn(("Sklearn")) -.-> sklearn/AdvancedDataAnalysisandDimensionalityReductionGroup(["Advanced Data Analysis and Dimensionality Reduction"])
ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"])
sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/linear_model("Linear Models")
sklearn/AdvancedDataAnalysisandDimensionalityReductionGroup -.-> sklearn/semi_supervised("Semi-Supervised Learning")
ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn")
subgraph Lab Skills
sklearn/linear_model -.-> lab-71111{{"半教師あり学習アルゴリズム"}}
sklearn/semi_supervised -.-> lab-71111{{"半教師あり学習アルゴリズム"}}
ml/sklearn -.-> lab-71111{{"半教師あり学習アルゴリズム"}}
end