简介
本实验展示了如何在运行支持向量分类器(SVC)之前执行单变量特征选择,以提高分类分数。我们将使用鸢尾花数据集(4个特征)并添加36个无信息特征。我们会发现,当我们选择大约10%的特征时,我们的模型能达到最佳性能。
虚拟机使用提示
虚拟机启动完成后,点击左上角切换到“笔记本”标签页,以访问Jupyter Notebook进行练习。
有时,你可能需要等待几秒钟让Jupyter Notebook完成加载。由于Jupyter Notebook的限制,操作验证无法自动化。
如果你在学习过程中遇到问题,随时向Labby提问。课程结束后提供反馈,我们会立即为你解决问题。
Skills Graph
%%%%{init: {'theme':'neutral'}}%%%%
flowchart RL
sklearn(("Sklearn")) -.-> sklearn/ModelSelectionandEvaluationGroup(["Model Selection and Evaluation"])
sklearn(("Sklearn")) -.-> sklearn/UtilitiesandDatasetsGroup(["Utilities and Datasets"])
ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"])
sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"])
sklearn(("Sklearn")) -.-> sklearn/DataPreprocessingandFeatureEngineeringGroup(["Data Preprocessing and Feature Engineering"])
sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/svm("Support Vector Machines")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/preprocessing("Preprocessing and Normalization")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/feature_selection("Feature Selection")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/pipeline("Pipeline")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/model_selection("Model Selection")
sklearn/UtilitiesandDatasetsGroup -.-> sklearn/datasets("Datasets")
ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn")
subgraph Lab Skills
sklearn/svm -.-> lab-49306{{"鸢尾花数据集上支持向量分类器的特征选择"}}
sklearn/preprocessing -.-> lab-49306{{"鸢尾花数据集上支持向量分类器的特征选择"}}
sklearn/feature_selection -.-> lab-49306{{"鸢尾花数据集上支持向量分类器的特征选择"}}
sklearn/pipeline -.-> lab-49306{{"鸢尾花数据集上支持向量分类器的特征选择"}}
sklearn/model_selection -.-> lab-49306{{"鸢尾花数据集上支持向量分类器的特征选择"}}
sklearn/datasets -.-> lab-49306{{"鸢尾花数据集上支持向量分类器的特征选择"}}
ml/sklearn -.-> lab-49306{{"鸢尾花数据集上支持向量分类器的特征选择"}}
end