로지스틱에서 Coefficient에 대해 알아보자
(좌) Linear regression에서 (이론상) 타겟y값은 어떤 값이든 될수있다
(우) Logistic regression의 y값은 0~1 사이의 확률값으로 표현된다
(좌) Linear regression 의 확률값을 log(Odd) 처리한뒤 우측그래프 (new y 축)
(우) 최종적으로 좌측의 linear regression을 linear regression의 그래프처럼 변환됨
y = -3.48 + 1.83*weight 해당 그래프가 최적이라고 가정하였을때
Coefficient . 첫번째 계수 intercept : y절편/ 두번째 계수 : slope : 기울기
(최적의 그래프를 찾는 방법은 다음 장 "Maximum likelyhood"에서 확인)
https://khalidpark2029.tistory.com/91
이번에는 Logistic 에서 x축과 y축이 모두 카테고리형일때를 살펴보자
위와 동일하게 log(odd)를 통해 우측그래프와 같이 새로운 축에 표기
(T-test 원리 이해 했던것처럼)
(좌)normal gene에 대한 log(odd) 값 구하기
(우)mutated gene에 대한 log(odd) 값 구하기
결론은
Logistic regression 모델그래프를 Linear regression 모델그래프처럼 바꿔준다음에 Coefficients 값을 구해준다
Logistic -> Linear 로 가는 방법이 log(Odd)
출처 : youtu.be/vN5cNN2-HWE
728x90
'AI월드 > ⚙️AI BOOTCAMP_Section 2' 카테고리의 다른 글
결정트리,Decision Trees_Day26 (0) | 2021.02.04 |
---|---|
Logistic Regression,Maximum Likelihood_Day24(4) (0) | 2021.02.04 |
Logistic Regression,로지스틱_Day24(2) (0) | 2021.02.04 |
Overfitting, train, validation and test_Day24 (0) | 2021.02.03 |
Cross Validation(CV)와 lambda , Regression_Day23(5) (0) | 2021.02.03 |
댓글