Einführung
In diesem Lab werden wir das Konzept des halbüberwachten Lernens untersuchen, das eine Art Maschinelles Lernen ist, bei dem einige der Trainingsdaten markiert und einige unmarkiert sind. Halbüberwachte Lernalgorithmen können die unmarkierten Daten nutzen, um die Leistung des Modells zu verbessern und besser auf neue Proben zu generalisieren. Dies ist besonders nützlich, wenn wir nur eine kleine Menge markierter Daten haben, aber eine große Menge unmarkierter Daten.
In diesem Lab werden wir uns auf zwei halbüberwachte Lernalgorithmen konzentrieren: Selbsttraining und Labelpropagation. Wir werden lernen, wie wir diese Algorithmen mit scikit-learn, einer beliebten Maschinelles Lernen-Bibliothek in Python, implementieren und verwenden.
VM-Tipps
Nachdem die VM gestartet ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.
Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.
Wenn Sie bei der Lernphase Probleme haben, können Sie Labby fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.