소개
이 실습에서는 SVM 커널을 사용하여 데이터 포인트를 분류하는 단계별 가이드를 제공합니다. SVM 커널은 데이터 포인트가 선형적으로 분리되지 않을 때 특히 유용합니다. 이 작업을 수행하기 위해 Python scikit-learn 을 사용할 것입니다.
VM 팁
VM 시작이 완료되면 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 연습을 위한 Jupyter Notebook에 접근합니다.
때때로 Jupyter Notebook 이 완전히 로드되기까지 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사를 자동화할 수 없습니다.
학습 중 문제가 발생하면 Labby 에 문의하십시오. 세션 후 피드백을 제공하면 문제를 신속하게 해결해 드리겠습니다.
라이브러리 가져오기
이 단계에서는 분류 작업을 수행하기 위한 필요한 라이브러리를 가져옵니다.
import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm
데이터셋 및 타겟 생성
이 단계에서는 분류 작업을 위한 데이터셋과 타겟을 생성합니다. numpy 라이브러리를 사용하여 데이터셋과 타겟을 생성합니다.
X = np.c_[
(0.4, -0.7),
(-1.5, -1),
(-1.4, -0.9),
(-1.3, -1.2),
(-1.1, -0.2),
(-1.2, -0.4),
(-0.5, 1.2),
(-1.5, 2.1),
(1, 1),
## --
(1.3, 0.8),
(1.2, 0.5),
(0.2, -2),
(0.5, -2.4),
(0.2, -2.3),
(0, -2.7),
(1.3, 2.1),
].T
Y = [0] * 8 + [1] * 8
모델 생성
이 단계에서는 선형, 다항식, 그리고 방사 기저 함수 (RBF) 세 가지 다른 커널을 사용하는 SVM 모델을 생성합니다. 선형 커널은 선형적으로 분리 가능한 데이터 포인트에 사용되며, 다항식 및 RBF 커널은 비선형적으로 분리 가능한 데이터 포인트에 유용합니다.
## 모델 학습
for kernel in ("linear", "poly", "rbf"):
clf = svm.SVC(kernel=kernel, gamma=2)
clf.fit(X, Y)
모델 시각화
이 단계에서는 SVM 커널 모델을 시각화하여 직선, 점, 그리고 평면에 가장 가까운 벡터들을 플롯합니다.
## 직선, 점, 평면에 가장 가까운 벡터들을 플롯합니다.
plt.figure(fignum, figsize=(4, 3))
plt.clf()
plt.scatter(
clf.support_vectors_[:, 0],
clf.support_vectors_[:, 1],
s=80,
facecolors="none",
zorder=10,
edgecolors="k",
)
plt.scatter(X[:, 0], X[:, 1], c=Y, zorder=10, cmap=plt.cm.Paired, edgecolors="k")
plt.axis("tight")
x_min = -3
x_max = 3
y_min = -3
y_max = 3
XX, YY = np.mgrid[x_min:x_max:200j, y_min:y_max:200j]
Z = clf.decision_function(np.c_[XX.ravel(), YY.ravel()])
## 결과를 색상 플롯으로 표시합니다.
Z = Z.reshape(XX.shape)
plt.figure(fignum, figsize=(4, 3))
plt.pcolormesh(XX, YY, Z > 0, cmap=plt.cm.Paired)
plt.contour(
XX,
YY,
Z,
colors=["k", "k", "k"],
linestyles=["--", "-", "--"],
levels=[-0.5, 0, 0.5],
)
plt.xlim(x_min, x_max)
plt.ylim(y_min, y_max)
plt.xticks(())
plt.yticks(())
fignum = fignum + 1
plt.show()
요약
이 실험에서는 데이터 포인트를 분류하기 위해 SVM 커널을 사용하는 방법을 배웠습니다. 데이터 세트와 목표를 생성하고, 세 가지 다른 커널을 사용하여 SVM 커널 모델을 만들었으며, 모델을 시각화했습니다. SVM 커널은 데이터 포인트가 선형적으로 분리되지 않을 때 특히 유용합니다.