Ridge , Lasso , Elastic-Net regression을 공부하면서
lambda와 cross validation에 대한 이야기가 계속 나오고 있다
정확하게 cross validation은 어떤 의미인지 알아보기 위해 조금더 플러스로 공부해보기로 하자
BAM!!!
아래와 같이 심장질환 관련 데이터가 주어져있고(좌측)
새로운 환자 정보가 있을때 심장질환 유무를 예측한다고 하자
이제 중요한 부분은 어떤 모델을 사용할 것인가?
CV는 어떤 머신이 좋을지 비교할수있도록 도와준다
주어진 데이터를 전부 train으로 쓰고 다시 test로 쓰는 방법 => 테러블 아이디어
주어진 데이터의 75%는 train으로 쓰고 , 남은 25%는 test로 모델을 검증하는 방법 => 굿 아이디어
그럼 75%는 어떻게 정하는가?
만약 25%의 test데이터를 마지막이 아닌 중간으로 하면 안되는가?
Cross Validation은 이러한 문제를 해결해준다
Cross Validation은 75%와 25%의 지정순서를 지속적으로 바꿔가면서 최적의 값을 찾는다
그리고 마지막으로 각 모델들별로 최적의 값을 비교하게끔 해주며,
그 결과값을 토대로 최적의 모델을 고를수있는 지표가 된다
Cross Validation은 이해하였으나
이 개념이 Ridge , Lasso , Elastic Net Regression 의 lambda와 어떤 연관이 있는걸까?
출처 : youtu.be/fSytzGwwBVw
728x90
'AI월드 > ⚙️AI BOOTCAMP_Section 2' 카테고리의 다른 글
Logistic Regression,로지스틱_Day24(2) (0) | 2021.02.04 |
---|---|
Overfitting, train, validation and test_Day24 (0) | 2021.02.03 |
Regularization,Elastic Net,엘라스틱넷,regression_Day23(4) (0) | 2021.02.03 |
Regularization,Lasso ,라쏘,regression_Day23(3) (0) | 2021.02.03 |
회귀의 종류 총정리 (0) | 2021.02.02 |
댓글