통계적인 생각,사고 : 어떤 사건이 우연히 발생할 확률은 얼마일까?
모집단의 표준편차가 알려지지 않았을 때,
정규분포의 모집단에서 모은 샘플(표본)의 평균값에 대한 가설검정 방법
t-test 목적 : 두개의 집단의 평균값이 통계적으로 같은지 다른지 비교하기 위해 사용한다!!
1.58 퍼져있는 표준편차는 의미없는 우연히 퍼져있는 정도
의미없는 퍼져있는 정도(표준편차)인 XXXcm 대비 우리가 비교하고 싶은 평균적인 거리 1.4cm 차이가
얼마나 큰지 작은지를 비교해 봄으로써, 1.4cm 차이가 의미있는 차이인지 의미없는 차이인지 결정할 수 있다.
정규분포는 평균과 표준편차만으로 규정됨
양측검정 vs 단측검정
양측검정의 대안가설 : Xa > Xb 또는 Xa < Xb 둘중 하나만 성립해도 되는 합집합
연구자가 양측으로 할지 단측으로 할지 정하는 것일뿐, 정해진 답은 없다
진짜 T-Test
두 대학의 평균키가 같은지 다른지 알고싶다
즉, 두 대학의 키차이가 0인지 또는 0이 아닌지 알고싶다
t-test의 목적 : 두 비교군의 차이가 의미있는 차이인지 아닌지를 파악하기 위함이다
Xa 와 Xb 차이가 어느정도 커야 큰것인가? 어느정도 작으면 작은것인가?
여기서 필요한것이 "통계적인 생각, 접근법" ==> 비교대상이 필요하다
그래서 가져온 비교대상이 바로 "표준편차"
표준편차는 의미 없는 퍼져있는 정도
n의 역할은 무엇인가?
파란색 : 표준정규분포 곡선
t(숫자) , 숫자 = 자유도 ,Degree of Freedom / df = n-1
데이터의 개수가 증가할수록 , df가 증가할수록 , t분포곡선은 표준정규분포에 가까워 진다
즉, 데이터를 많이 모으면 모을수록 t분포는 정규분포화가 되어간다
최종정리하자면
양측검정 신뢰도 95% 기준
t테이블을 기준(양측검정, df100)으로 우측 2.5% 시작점이 1.984
t value 값은 1.996
즉 t value가 95% 신뢰도 수준안에 있지 않다 => 가정을 기각한다
T-test의 종류
1) 2 sample T - test
2) 1 sample T - test
3) Paired T - test
출처 : youtu.be/mEWQ_vl3IPw
'AI월드 > ⚙️AI BOOTCAMP_Section 1' 카테고리의 다른 글
Linear Algebra2_Day12 (0) | 2021.01.12 |
---|---|
선형대수 Linear Algebra_Day11 (0) | 2021.01.12 |
Convert two-tailed to a one-tailed test (0) | 2021.01.10 |
베이지안적 통계 이론_Day9(2) (0) | 2021.01.08 |
Bayesian_Day9 (0) | 2021.01.08 |
댓글