RBF SVM 매개변수 최적화

Beginner

This tutorial is from open-source community. Access the source code

소개

이 실습에서는 Radial Basis Function (RBF) 커널 SVM 의 매개변수를 조정하는 방법을 보여줍니다. RBF 커널의 gammaC 매개변수는 SVM 모델의 성능에 매우 중요합니다. 목표는 모델의 정확도를 극대화하는 최적의 매개변수 값을 선택하는 것입니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 연습을 위한 Jupyter Notebook에 접근합니다.

때때로 Jupyter Notebook 이 로드되는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사를 자동화할 수 없습니다.

학습 중 문제가 발생하면 Labby 에게 문의하십시오. 세션 후 피드백을 제공하면 문제를 신속하게 해결해 드리겠습니다.

데이터셋 로드 및 준비

  • scikit-learn 에서 iris 데이터셋을 로드합니다.
  • 데이터를 특징 행렬 X와 목표 벡터 y로 분리합니다.
  • StandardScaler를 사용하여 특징 행렬 X를 표준화합니다.
  • 의사결정 함수 시각화를 위해 데이터셋의 단순화된 버전을 만듭니다. X에서 처음 두 개의 특징만 유지하고, 데이터셋에서 두 개의 클래스만 유지하여 이진 분류 문제로 만듭니다.

분류기 학습

  • np.logspace를 사용하여 gammaC 매개변수의 로그 스케일 그리드를 생성합니다.
  • StratifiedShuffleSplit를 사용하여 데이터를 학습 및 테스트 세트로 분할합니다.
  • GridSearchCV를 사용하여 SVM 모델에 대한 최적의 매개변수를 찾습니다.
  • 2 차원 버전의 모든 매개변수에 대해 분류기를 학습합니다.

시각화

  • 2 개의 입력 특징과 2 개의 가능한 목표 클래스 (이진 분류) 를 포함하는 단순화된 분류 문제에 대한 다양한 매개변수 값에 대한 의사결정 함수를 시각화합니다.
  • Cgamma의 함수로서 분류기의 교차 검증 정확도의 히트맵을 시각화합니다.

해석

  • 시각화 결과를 해석하여 Cgamma의 최적 값을 선택합니다.

요약

이 실험에서는 방사 기저 함수 (RBF) 커널 SVM 의 매개변수를 어떻게 조정하는지 보여주었습니다. RBF 커널의 gammaC 매개변수는 SVM 모델의 성능에 중요하며, 이러한 매개변수의 최적 값은 그리드 검색 및 시각화 기법을 결합하여 찾을 수 있습니다.