본문 바로가기
AI월드/⚙️AI BOOTCAMP_Section 2

혼동행렬, 정확도, 정밀도, 재현율 한번더정리

by khalidpark 2021. 2. 9.

분류모델에서 정확도만이 최적의 결정포인트가 아닌 이유는 모든 데이터가 공평하게 나뉘어 있지 않기 때문이다

 

예를들어

100개의 라벨중 A가 50개 , B가 50개라면 A와 B를 구분하는 분류모델에서 정확도가 중요한 평가지표가 된다

하지만 A가 90개, B가 10개 라벨의 모델이라면 무작정 A라고 분류해도 90%의 정확도를 나타내기 때문이다

 

그래서 필요한 개념이

혼동행렬, 정확도 , 정밀도 , 재현율의 개념이다

 

각 요소를 정확하게 이해하는 것이 가장 중요하다

포인트는 !!! 뒤에서 부터 해석 !!! 

!!!앞은 예측의 맞음과틀림, 뒤는 모델의 예측!!!

 

백신접종을 예로 들면

TP : 모델의 예측 positive = 백신 맞았을거야 , 예측 True = 예측 맞음

즉, 백신을 맞았을 거라고 예측했고 , 예측이 맞았으므로 , 실제로 백신을 맞음 사람임

TN : 모델의 예측 Negaive= 백신 안맞을거야 , 예측 True = 예측 맞음

즉, 백신을 안맞을 거라고 예측했고, 예측이 맞았으므로 , 실제로 백신을 안맞은 사람임

FP : 모델의 예측 positive = 백신 맞았을거야 , 예측 False = 예측 틀림

즉, 백신을 맞았을 거라고 예측했으나, 예측이 틀렸으므로 , 실제로 백신을 안맞음

FN : 모델의 예측 Negative = 백신 안맞았을거야 , 예측 False = 예측 틀림

즉, 백신을 안맞은 거라고 예측했으나, 예측이 틀렸으므로, 실제로는 백신을 맞음

 

 

Accuracy (정확도) :

전체 데이터 중 올바르게 예측한 비율

TP + TN / (TP + FN + FP + TN)

단점 : 예측하려고 하는 종속변수의 비율이 불균형할때 가치가 낮아집니다

 

Recall (재현율) :

TP / (TP + FN)

총 백신을 맞은 사람들 중 (TP와 FN) 백신을 맞았을거라고 예측한 비율

(맞았을거라고 예측했고 그 예측이 맞은 경우안맞았을거라고 예측했으나 그 예측이 틀린 경우__즉 맞은경우)

예시) 암진단

암인 사람을 음성으로 판단하면 매우 위험해집니다

음성인 사람을 양성으로 판단할 가능성이 높아지는 단점 (이부분은 결과적으로 환자한테 괜찮으니까) 

 

Precision (정밀도) :

TP / (TP + FP)

백신을 맞았을 거라고 예측한 사람들 중 (TP + FP) 실제로 백신을 맞은 비율

(맞았을거라고 예측했고 그 예측이 맞은 경우 맞았을거라고 예측했으나 그 예측이 틀린 경우__즉 안맞은경우)

 

출처 : velog.io/@skyepodium/%EB%B6%84%EB%A5%98-%EB%AA%A8%EB%8D%B8-%ED%8F%89%EA%B0%80-%EB%B0%A9%EB%B2%95

 

분류 모델의 평가 방법

분류모델의 평가방법에 대해 알아봅시다.정확도만 가지고 분류 모델을 평가하면 안될까?(정확도: 전체의 데이터 중에서 올바르게 예측한 비율)결론은 아니다.다음과 같은 예시가 있다.전체 데

velog.io

출처 : m.blog.naver.com/PostView.nhn?blogId=cbads&logNo=221123656438&proxyReferer=https:%2F%2Fwww.google.com%2F

 

Confusion Matrix (TP, TN, FP, FN)

처음 머신러닝이나 통계가 가미된 논문을 읽을 때 Sensitivity, Specificity, Precision, AUC 등의 ...

blog.naver.com

 

728x90

댓글