혼동행렬, 정확도, 정밀도, 재현율 한번더정리
분류모델에서 정확도만이 최적의 결정포인트가 아닌 이유는 모든 데이터가 공평하게 나뉘어 있지 않기 때문이다 예를들어 100개의 라벨중 A가 50개 , B가 50개라면 A와 B를 구분하는 분류모델에서 정확도가 중요한 평가지표가 된다 하지만 A가 90개, B가 10개 라벨의 모델이라면 무작정 A라고 분류해도 90%의 정확도를 나타내기 때문이다 그래서 필요한 개념이 혼동행렬, 정확도 , 정밀도 , 재현율의 개념이다 각 요소를 정확하게 이해하는 것이 가장 중요하다 포인트는 !!! 뒤에서 부터 해석 !!! !!!앞은 예측의 맞음과틀림, 뒤는 모델의 예측!!! 백신접종을 예로 들면 TP : 모델의 예측 positive = 백신 맞았을거야 , 예측 True = 예측 맞음 즉, 백신을 맞았을 거라고 예측했고 , 예측이 ..
2021. 2. 9.
Precision,Recall,F-Measure,정밀도,재현율,정확도란?_Day28(2)
분류문제에서 95% 정확도는 명확하게 설명이 가능하나 회귀문제에서 95% 정확도는 과연 어떨까? 600,000$ 실제 가격 집을 400,000$ 로 예측했다면 틀린것인가? 그렇다면 599,999$로 예측했다면 이는 틀린것인가 맞은것인가? 이번 강의에서는 classification 만 다루기로 한다 아래와 같은 단순 정확도 계산은 모순 존재 만약 10,000 켤레의 신발을 모두 나이키 신발이 아니라고 구분한다고 가정하면 (10,000 켤레중 나이키 신발은 오직 10 , 나머지는 전부 다른 브랜드의 신발이라면 정확도는 99.9%) 잘못되었다. 그래서 아래와 같이 정밀도와 재현율을 사용한다 (Precision & Recall) 10,000켤레 (9,990 + 10) 신발을 모두 나이키 신발이 아니라고 했을경우..
2021. 2. 8.