Einführung
In diesem Lab wird gezeigt, wie man die Parameter eines Radial Basis Function (RBF)-Kernels für eine Support Vector Machine (SVM) einstellt. Die Parameter gamma und C des RBF-Kernels sind entscheidend für die Leistung des SVM-Modells. Ziel ist es, die optimalen Werte dieser Parameter auszuwählen, um die Genauigkeit des Modells zu maximieren.
Tipps für die virtuelle Maschine
Nachdem der Start der virtuellen Maschine abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.
Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen von Jupyter Notebook nicht automatisiert werden.
Wenn Sie während des Lernens Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem für Sie prompt beheben.
Lade und bereite den Datensatz vor
- Lade den Iris-Datensatz aus scikit-learn.
- Trenne die Daten in die Merkmalsmatrix
Xund den Zielvektoryauf. - Standardisiere die Merkmalsmatrix
XmitStandardScaler. - Erstelle eine vereinfachte Version des Datensatzes für die Visualisierung der Entscheidungsfunktion, indem du nur die ersten beiden Merkmale in
Xbeibehältst und den Datensatz sub-samplest, um nur zwei Klassen zu behalten und es zu einem binären Klassifizierungsproblem zu machen.
Trainiere Klassifizierer
- Erstelle ein logarithmisches Gitter der
gamma- undC-Parameter mitnp.logspace. - Teile die Daten in Trainings- und Testsets auf mit
StratifiedShuffleSplit. - Führe eine Gittersuche mit
GridSearchCVdurch, um die besten Parameter für das SVM-Modell zu finden. - Trainiere einen Klassifizierer für alle Parameter in der 2D-Version.
Visualisierung
- Visualisiere die Entscheidungsfunktion für eine Vielzahl von Parameternwerten bei einem vereinfachten Klassifizierungsproblem, das nur 2 Eingangsmerkmale und 2 mögliche Zielklassen (binäre Klassifizierung) umfasst.
- Visualisiere die Heatmap der Kreuzvalidierungsgenauigkeit des Klassifizierers als Funktion von
Cundgamma.
Interpretation
- Interpretiere die Ergebnisse der Visualisierung und wähle die optimalen Werte für
Cundgamma.
Zusammenfassung
In diesem Lab wurde gezeigt, wie man die Parameter eines Radial Basis Function (RBF)-Kernels in einem SVM justiert. Die gamma- und C-Parameter des RBF-Kernels sind entscheidend für die Leistung des SVM-Modells, und die optimalen Werte für diese Parameter können mit einer Kombination aus Gittersuche und Visualisierungstechniken gefunden werden.