- 지지 벡터 기계(SVM, Support vector machine)
- 벡터 공간에서 두 범주의 결정 경계를 가장 넓게 유지하게 하는 이진 선형 분류기임
15.1 지지 벡터 기계: 선형 분리 문제
- 한계(Margin)
- 결정선 혹은 결정면으로부터 가장 가까이에 있는 자료(벡터 공간의 한 점)까지의 거리
- 지지 벡터(Support vectors)
- 벡터 공간의 점들 중 결정선 혹은 결정면으로부터 가장 가까이에 있는 점들
- 가중치 벡터(Weight vector) 혹은 결정 초평면 법선 벡터
- 결정 초평면에 직교하는 법선 벡터(w)
- SVM에서 범주는 0과 1 대신 +1과 -1로 나타나며, -1이면 특정 범주를 나타내고 +1이면 다른 범주를 나타냄
- 기하 한계(Geometric margin)
- 두 범주의 지지 벡터를 나누는 최대 넓이
- SVM의 목적은 기하 한계를 최대화하는 것
- 선형 제약을 가지는 이차 최적화(Quadratic optimization)를 수행해야 하며, 원리적으로 SVM은 표준 이차 계획법(QP, Quadric Programming) 라이브러리를 많이 이용함
15.2 지지 벡터 기계 모델의 확장
- 학습 문헌 집합 D가 선형 분리할 수 없다면 일반적으로 결정 한계를 늘려서 오류를 줄일 수 있음
- 커널 기법(Kernel trick)
- 고차원 공간으로 자료를 사상하여 선형적으로 분리하는 방법
'Study > Information Retrieval' 카테고리의 다른 글
정보검색론 공부 - 계층 군집화 (0) | 2019.01.23 |
---|---|
정보검색론 공부 - 평면 군집화 (0) | 2019.01.23 |
정보검색론 공부 - 벡터 공간 분류 (0) | 2019.01.23 |
정보검색론 공부 - 문서 분류와 Naive Bayes (0) | 2019.01.23 |
정보검색론 공부 - 정보 검색을 위한 언어 모델 (0) | 2019.01.23 |