본문 바로가기

ML9

ML 101 : 서포트 벡터 머신(Support Vector Machine, SVM) - Margin 서포트 벡터 머신 (Support Vector Machine, SVM) 서포트 벡터 머신은 Linear Classification, 즉 선형 분류 중 하나 입니다. 위의 그림과 같이 별모양과 동그라미가 있을 때 두 도형을 나누는 가장 좋은 boundary 를 찾아야 한다고 할 때 사용되는 머신 러닝 기법 중 하나 입니다. 그림 처럼 2차원일 경우 이 boundary 를 선으로 표현할 수 있지만 더 고차원으로 가게 될 경우 단순히 선형이라 표현하지 않고 hyperplane 이라 부르게 됩니다. 서포트 벡터 머신을 알기 위해서 중요한 기본 개념으로 3가지와 이에 따르는 몇가지 서브 개념들이 있습니다.1. Margin ( VC Dimension, Shattering, Dichotomy )2. Support V.. 2017. 3. 20.
ML101 : 나이브 베이즈 (Naive Bayes) : 분류 2017/03/09 - [CS/ML] - ML101 : 나이브 베이즈 (Naive Bayes) : 베이즈 정리 이전 글에서 알아본 베이즈 정리에 이어, 나이브 베이즈 분류에 대해서 알아보도록 하겠습니다. 아래 그림은 필기체 숫자를 인식하는 나이브 베이즈 분류기의 예제 입니다. 8 x 8 의 행렬이 있고, 해당 행렬에는 총 64개의 feature 값들이 있습니다. 각 feature 의 색이 칠해져 있는 상태에 따라서 숫자를 판별합니다. 예를들어, 3 이라는 숫자의 경우 3행 1열에 색이 칠해져 있을 확률이 매우 낮을 것입니다. 반면에 5행 5열에 색이 칠해져 있다면 3일 숫자의 확률은 매우 높을 것 입니다. 이러한 조건에 대한 확률을 표현한 표를 Conditional Probability Table 이라 .. 2017. 3. 13.
ML101 : 나이브 베이즈 (Naive Bayes) : 베이즈 정리 Bayes rule일반인이 암 환자를 진단하는 신규 검사법을 사용하여 검사해본 결과가 양성 반응일 때, 실제로 암에 걸렸을 확률을 구하는 문제가 있다고 해보겠습니다. 이 문제를 풀기 위해 주어진 조건과 조건부 확률을 다음과 같다고 가정하겠습니다. Y -> 실제 병에 걸렸을 경우 { 1 : true, 0 : false } X -> 검사 결과 경우 { 1 : 양성, 0 : 음성 } P ( X = 1 | Y = 1 ) = 0.8 검사의 정확도로 실제 병에 걸렸을 경우, 검사 결과도 양성일 확률즉, 본 검사는 80% 의 확률로 정확한 진단을 내리고 20% 확률로 실제 병이 걸린 환자에 대해 음성이라는 오진을 내리게 됩니다. P ( X = 1 | Y = 0) = 0.1 일명 False positive 로 병이 없.. 2017. 3. 9.
ML101 : weka practical exercise / 의사결정트리 (2) 2017/02/15 - [CS/ML] - ML 101 : weka practical exercise / 의사결정트리 (1) Weka 를 이용해 소스 코드를 생성하고 난 후 해당 코드를 살펴보면, Visualize 를 통해 살펴본 의사 결정 트리의 모양을 그대로 코드로 옮겨 왔음을 확인 하실 수 있습니다. 메소드 명이 임의의 문자로 만들어져 있어 읽기 어려우나, 메소드 내용으로 보았을 때, 최상위 root 부터 leaf 로의 if-else 의 집합임을 확인할 수 있습니다. 그럼 이 코드를 어떻게 활용해 볼 수 있을까요? 우선, 지난 글에서 다운 받으신 .arff 파일의 내용을 아래와 같이 바꾸어 줍니다. @data end_rack,85,85,FALSE,? end_rack,80,90,TRUE,? cd_spe.. 2017. 2. 28.
반응형