본문 바로가기
AI월드/⚙️AI BOOTCAMP_Section 1

Hypothesis Test, T-test, type of error, parametric_2_Day7(2)

by khalidpark 2021. 1. 6.

T-Test

 

T-test는 그룹의 평균값에 대해서 비교하는 가설검정방법

몇가지 조건이 가정되어야 함

1. 독립성 , 2. 정규성 , 3. 등분산성

(scipy를 통해 가설검정 가능)


Type of Error

 

 

 

출처 : www.abtasty.com/blog/type-1-and-type-2-errors/

 

What are Type 1 and Type 2 Errors?

Learn what the differences are between type one and type two errors in statistical hypothesis testing and how you can avoid them.

www.abtasty.com


Parametric and Non Parametric methods

 

- 카테고리칼 데이터를 위한 모델링

- 혹은 극단적 outlier가 있는 경우 유효한 방식

- distribution free method 라 부리기도 함

 

 

 

 

출처 : mkhernandez.wordpress.com/2017/04/29/quant-parametric-and-non-parametric-stats/

 

Quant: Parametric and Non-Parametric Stats

Parametric statistics is inferential and based on random sampling from a well-defined population, and that the sample data is making strict inferences about the population’s parameters. Thus …

mkhernandez.wordpress.com


Kruskal-wallis Test 

독립된 세 군 이상의 크기를 비교하는 비모수적인 방법

 

https://dermabae.tistory.com/168

 


X2 Tests

One sample X2 test (Goodness of Fit test)

주어진 데이터가 특정 예상되는 분포와 동일한 분포를 나타내는지에 대한 가설검정

 

obs 10 11 10 12 10 11
exp
sum(obs)/count
10.6 10.6 10.6 10.6 10.6 10.6

 

 

만약 obs 값이 100배씩 커지면

x2 값은 31.25로 커지므로 types of error 발생한다

 

따라서 "표준화 된 값이 필요" 즉 P value

 

통계치를 p value로 바꾸는 라이브러리는 stats.chi2.cdf

 

 

two sample X2 test

Null Hypothesis : Variable is independent

Alter.Hypothesis : Variable is not independent

 

 

 

 

728x90

댓글