Introdução
Este laboratório demonstra como ajustar os parâmetros de um kernel de Função de Base Radial (RBF) SVM. Os parâmetros gamma e C do kernel RBF são cruciais para o desempenho do modelo SVM. O objetivo é escolher os valores ótimos destes parâmetros que maximizem a precisão do modelo.
Dicas da Máquina Virtual
Após o arranque da máquina virtual, clique no canto superior esquerdo para mudar para a aba Notebook para aceder ao Jupyter Notebook para a prática.
Por vezes, pode ser necessário esperar alguns segundos para o Jupyter Notebook terminar de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se tiver problemas durante a aprendizagem, não hesite em contactar o Labby. Forneça feedback após a sessão e resolveremos prontamente o problema para si.
Carregar e Preparar o Conjunto de Dados
- Carregar o conjunto de dados iris do scikit-learn.
- Separar os dados em matriz de características
Xe vetor alvoy. - Padronizar a matriz de características
XusandoStandardScaler. - Criar uma versão simplificada do conjunto de dados para visualização da função de decisão, mantendo apenas as duas primeiras características em
Xe subamostragem do conjunto de dados para manter apenas duas classes, transformando-o num problema de classificação binária.
Treinar Classificadores
- Criar uma grade logarítmica dos parâmetros
gammaeCusandonp.logspace. - Dividir os dados em conjuntos de treino e teste usando
StratifiedShuffleSplit. - Executar uma busca em grade usando
GridSearchCVpara encontrar os melhores parâmetros para o modelo SVM. - Ajustar um classificador para todos os parâmetros na versão 2D.
Visualização
- Visualizar a função de decisão para uma variedade de valores de parâmetros num problema de classificação simplificado envolvendo apenas 2 características de entrada e 2 classes alvo possíveis (classificação binária).
- Visualizar o mapa de calor da precisão de validação cruzada do classificador em função de
Cegamma.
Interpretação
- Interpretar os resultados da visualização e escolher os valores ótimos para
Cegamma.
Resumo
Este laboratório demonstrou como afinar os parâmetros de um SVM com kernel de Função de Base Radial (RBF). Os parâmetros gamma e C do kernel RBF são cruciais para o desempenho do modelo SVM, e os valores ótimos para estes parâmetros podem ser encontrados usando uma combinação de busca em grade e técnicas de visualização.