Einführung
Viele Echtwelt-Datenmengen enthalten fehlende Werte, was Probleme verursachen kann, wenn maschinelle Lernalgorithmen verwendet werden, die vollständige und numerische Daten voraussetzen. In solchen Fällen ist es wichtig, fehlende Werte angemessen zu behandeln, um die verfügbaren Daten optimal zu nutzen. Eine häufige Strategie ist die Imputation, die darin besteht, die fehlenden Werte auf der Grundlage des bekannten Teils der Daten auszufüllen.
In diesem Tutorial werden wir verschiedene Strategien zur Imputation fehlender Werte mit scikit-learn, einer beliebten Python-Bibliothek für maschinelles Lernen, erkunden.
VM-Tipps
Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.
Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.
Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.