Einführung
In scikit-learn werden Pipelines und zusammengesetzte Schätzer verwendet, um mehrere Transformatoren und Schätzer zu einem einzelnen Modell zu kombinieren. Dies ist nützlich, wenn es eine feste Sequenz von Schritten für die Datenverarbeitung gibt, wie die Feature-Selektion, die Normalisierung und die Klassifikation. Pipelines können auch für die gemeinsame Parameterauswahl verwendet werden und sicherstellen, dass Statistiken aus den Testdaten nicht in das trainierte Modell während der Kreuzvalidierung "lecken".
Tipps für die VM
Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.
Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen in Jupyter Notebook nicht automatisiert werden.
Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.