Introdução
Este laboratório fornece um guia passo a passo sobre como usar núcleos SVM para classificar pontos de dados. Os núcleos SVM são especialmente úteis quando os pontos de dados não são linearmente separáveis. Usaremos a biblioteca Python scikit-learn para realizar esta tarefa.
Dicas da Máquina Virtual
Após o arranque da VM, clique no canto superior esquerdo para mudar para a aba Notebook para aceder ao Jupyter Notebook para a prática.
Por vezes, pode ser necessário esperar alguns segundos para o Jupyter Notebook terminar de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se tiver problemas durante o aprendizado, não hesite em contactar o Labby. Forneça feedback após a sessão e resolveremos o problema rapidamente para si.
Importar Bibliotecas
Neste passo, importamos as bibliotecas necessárias para realizar a tarefa de classificação.
import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm
Criar Conjunto de Dados e Alvos
Neste passo, criaremos um conjunto de dados e alvos para a nossa tarefa de classificação. Usaremos a biblioteca numpy para criar o conjunto de dados e os alvos.
X = np.c_[
(0.4, -0.7),
(-1.5, -1),
(-1.4, -0.9),
(-1.3, -1.2),
(-1.1, -0.2),
(-1.2, -0.4),
(-0.5, 1.2),
(-1.5, 2.1),
(1, 1),
## --
(1.3, 0.8),
(1.2, 0.5),
(0.2, -2),
(0.5, -2.4),
(0.2, -2.3),
(0, -2.7),
(1.3, 2.1),
].T
Y = [0] * 8 + [1] * 8
Criar o Modelo
Neste passo, criaremos o modelo SVM-Kernel com três núcleos diferentes: linear, polinomial e de função de base radial (RBF). O núcleo linear é usado para pontos de dados linearmente separáveis, enquanto os núcleos polinomial e RBF são úteis para pontos de dados não linearmente separáveis.
## ajustar o modelo
for kernel in ("linear", "poly", "rbf"):
clf = svm.SVC(kernel=kernel, gamma=2)
clf.fit(X, Y)
Visualizar o Modelo
Neste passo, visualizaremos o modelo SVM-Kernel traçando a linha, os pontos e os vetores mais próximos do plano.
## plotar a linha, os pontos e os vetores mais próximos do plano
plt.figure(fignum, figsize=(4, 3))
plt.clf()
plt.scatter(
clf.support_vectors_[:, 0],
clf.support_vectors_[:, 1],
s=80,
facecolors="none",
zorder=10,
edgecolors="k",
)
plt.scatter(X[:, 0], X[:, 1], c=Y, zorder=10, cmap=plt.cm.Paired, edgecolors="k")
plt.axis("tight")
x_min = -3
x_max = 3
y_min = -3
y_max = 3
XX, YY = np.mgrid[x_min:x_max:200j, y_min:y_max:200j]
Z = clf.decision_function(np.c_[XX.ravel(), YY.ravel()])
## Colocar o resultado num gráfico de cores
Z = Z.reshape(XX.shape)
plt.figure(fignum, figsize=(4, 3))
plt.pcolormesh(XX, YY, Z > 0, cmap=plt.cm.Paired)
plt.contour(
XX,
YY,
Z,
colors=["k", "k", "k"],
linestyles=["--", "-", "--"],
levels=[-0.5, 0, 0.5],
)
plt.xlim(x_min, x_max)
plt.ylim(y_min, y_max)
plt.xticks(())
plt.yticks(())
fignum = fignum + 1
plt.show()
Resumo
Neste laboratório, aprendemos a utilizar SVM-Kernels para classificar pontos de dados. Criámos um conjunto de dados e alvos, criámos o modelo SVM-Kernel com três núcleos diferentes e visualizámos o modelo. Os SVM-Kernels são particularmente úteis quando os pontos de dados não são linearmente separáveis.