본문 바로가기
728x90

분산5

회귀의 종류 총정리 회귀 (regression) - 회귀계수 - 회귀계수의 선형인지 아닌지 여부 - 선형회귀 , 비선형회귀 - 독립변수의 개수가 한개인지 여러개인지 - 단일회귀 , 다중회귀 - 양적변수(quantitative) : 숫자형 - 질적변수(qualitative) : 카테고리형 - 회귀의 유형 - 일변량(Univarate) : 오직 하나의 양적 독립변수 - 다변량(Multivariate) : 두개 이상의 양적 독립변수 - 단순(Simple) : 오직 하나의 종속변수 - 다중(Multiple) : 두개 이상의 종속변수 - 선형(Linear) - 비선형(Nonlinear) - 분산분석 (ANOVA) : 모든 독립변수들이 질적 변수(카테고리형) - 공분산분석 (ANCOVA) : 독립변수들이 양적변수와 질적변수가 섞여있는.. 2021. 2. 2.
Bias/Variance/편향과분산, 한번더_Day22(5) 2개의 특성까지는 그래프화를 통해 bias 와 variance 를 시각화 , 판단 가능하지만 이보다 특성이 많아질 경우 다른 기법이 필요함 인간의 분류 에러를 0% 라고 한다면 Train set error 1% 15% 15% 0.5% Dev set error 11% 16% 30% 1% high variance high bias high bias high variance good 인간의 에러 0% 와 train set error 와의 차이를 통해 high or low bias 판단하고 train set error 와 dev set error 와의 차이를 통해 high or low variance 판단한다 (만약 인간의 분류 에러가 15%라면 , 2번째 모델 (15%,16%) 은 잘 만들어진 모델이라 볼 수.. 2021. 1. 30.
Training & Test , Bias & Variance,편향,분산_Day22(3) Training & Test Data 주어진 데이터를 train 과 test 데이터 나눈 뒤 train 데이터를 기반으로 머신러닝 모델 학습 그 후 test 데이터를 활용하여 만든 머신러닝 모델이 맞는지 확인 가급적이면 오래된 데이터를 train으로 쓰고 최신 데이터를 test로 쓴다고 한다 (시계열이 중요한 데이터라면) 출처 : youtu.be/P2NqrFp8usY Machine Learning Fundamentals Bias & Variance 머신러닝을 통해 low bias and low variance 분산 / 편향 트레이드오프 복잡한 모델을 써야하는데 , 간단한 모델을 쓰는 경우 '편향에러가 증가' 필요보다 더 과도하게 복잡한 모델을 사용한 경우 '분산에러가 증가' 즉, 모델의 복잡도가 단순할수.. 2021. 1. 29.
공분산,상관계수,span,basis,rank_Day12(3) [지난주 복습] Variance (분산) 분산은 데이터가 얼마나 퍼져있는지 측정하는 방법 모집단의 분산 σ2 는 모집단의 PARAMETER (aspect, property, attribute, etc)이며, 샘플의 분산 s2 는 샘플의 STATISTIC (estimated attribute)입니다. 샘플 분산 s2 는 모집단 분산 σ2의 추정치 Standard Deviation (표준편차) 표준편차는 분산의 값에 (√)를 씌운 것 Covariance (공분산) 1개의 변수 값이 변화할 때 다른 변수가 어떠한 연관성을 나타내며 변하는지를 측정하는 것 Correlation coefficent (상관계수) 분산에서 스케일을 조정하기 위해 표준편차를 사용했던 것처럼, 공분산의 스케일을 조정하는 방법. 공분산을 .. 2021. 1. 13.
표준오차,표준편차,표본평균,모평균 통계용어 정리 '모집단'이 있다 모집단의 평균을 M(뮤) , 표준편차를 S(시그마)라고 하자 모집단의 평균을 '추정'하기 위해 모집단에서 크기가 n인 표본을 추출, 이를 표본1이라고 하자 표본1의 평균은 m1 m1, m2, m3, m4, .... 이 표본평균은 다음과 같은 성질이 성립한다. 1) 표본평균의 평균이 모평균과 같다 (표본들 각각의 평균값들을 전부더해서 n만큼 나누면 모집단의 평균,모평균과 같아진다) 2) 표본 평균의 분산이 모분산을 n으로 나눈것과 같다 (천천히 한단어씩 이해하면서 넘어가야한다 . 뒤에서 혼돈이 올수있음) 분산 V(X) = E((X-M)**2) 분산 V(X) = S(X)**2 이 때 표본평균의 표준편차를 '표준오차'라고 한다 출처 : hsm-edu.tistory.com/794 표준오차가 뭔.. 2021. 1. 7.
728x90