SVM 커널 데이터 분류

Beginner

This tutorial is from open-source community. Access the source code

소개

이 실습에서는 SVM 커널을 사용하여 데이터 포인트를 분류하는 단계별 가이드를 제공합니다. SVM 커널은 데이터 포인트가 선형적으로 분리되지 않을 때 특히 유용합니다. 이 작업을 수행하기 위해 Python scikit-learn 을 사용할 것입니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 연습을 위한 Jupyter Notebook에 접근합니다.

때때로 Jupyter Notebook 이 완전히 로드되기까지 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사를 자동화할 수 없습니다.

학습 중 문제가 발생하면 Labby 에 문의하십시오. 세션 후 피드백을 제공하면 문제를 신속하게 해결해 드리겠습니다.

라이브러리 가져오기

이 단계에서는 분류 작업을 수행하기 위한 필요한 라이브러리를 가져옵니다.

import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm

데이터셋 및 타겟 생성

이 단계에서는 분류 작업을 위한 데이터셋과 타겟을 생성합니다. numpy 라이브러리를 사용하여 데이터셋과 타겟을 생성합니다.

X = np.c_[
    (0.4, -0.7),
    (-1.5, -1),
    (-1.4, -0.9),
    (-1.3, -1.2),
    (-1.1, -0.2),
    (-1.2, -0.4),
    (-0.5, 1.2),
    (-1.5, 2.1),
    (1, 1),
    ## --
    (1.3, 0.8),
    (1.2, 0.5),
    (0.2, -2),
    (0.5, -2.4),
    (0.2, -2.3),
    (0, -2.7),
    (1.3, 2.1),
].T
Y = [0] * 8 + [1] * 8

모델 생성

이 단계에서는 선형, 다항식, 그리고 방사 기저 함수 (RBF) 세 가지 다른 커널을 사용하는 SVM 모델을 생성합니다. 선형 커널은 선형적으로 분리 가능한 데이터 포인트에 사용되며, 다항식 및 RBF 커널은 비선형적으로 분리 가능한 데이터 포인트에 유용합니다.

## 모델 학습
for kernel in ("linear", "poly", "rbf"):
    clf = svm.SVC(kernel=kernel, gamma=2)
    clf.fit(X, Y)

모델 시각화

이 단계에서는 SVM 커널 모델을 시각화하여 직선, 점, 그리고 평면에 가장 가까운 벡터들을 플롯합니다.

    ## 직선, 점, 평면에 가장 가까운 벡터들을 플롯합니다.
    plt.figure(fignum, figsize=(4, 3))
    plt.clf()

    plt.scatter(
        clf.support_vectors_[:, 0],
        clf.support_vectors_[:, 1],
        s=80,
        facecolors="none",
        zorder=10,
        edgecolors="k",
    )
    plt.scatter(X[:, 0], X[:, 1], c=Y, zorder=10, cmap=plt.cm.Paired, edgecolors="k")

    plt.axis("tight")
    x_min = -3
    x_max = 3
    y_min = -3
    y_max = 3

    XX, YY = np.mgrid[x_min:x_max:200j, y_min:y_max:200j]
    Z = clf.decision_function(np.c_[XX.ravel(), YY.ravel()])

    ## 결과를 색상 플롯으로 표시합니다.
    Z = Z.reshape(XX.shape)
    plt.figure(fignum, figsize=(4, 3))
    plt.pcolormesh(XX, YY, Z > 0, cmap=plt.cm.Paired)
    plt.contour(
        XX,
        YY,
        Z,
        colors=["k", "k", "k"],
        linestyles=["--", "-", "--"],
        levels=[-0.5, 0, 0.5],
    )

    plt.xlim(x_min, x_max)
    plt.ylim(y_min, y_max)

    plt.xticks(())
    plt.yticks(())
    fignum = fignum + 1
plt.show()

요약

이 실험에서는 데이터 포인트를 분류하기 위해 SVM 커널을 사용하는 방법을 배웠습니다. 데이터 세트와 목표를 생성하고, 세 가지 다른 커널을 사용하여 SVM 커널 모델을 만들었으며, 모델을 시각화했습니다. SVM 커널은 데이터 포인트가 선형적으로 분리되지 않을 때 특히 유용합니다.