큰수의법칙
사건을 무한히 반복할 때 일정한 사건이 일어나는 비율은
횟수를 거듭하면 할수록 일정한 값에 가까워지는 법칙
여기서 샘플링하는 것은 복원 추출을 기반으로 하며 각 사건은 동일
sample 데이터의 수가 커질 수록, sample의 통계치는 점점 모집단의 모수의 통계치와 같아진다.
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
population = np.random.normal(50, 10, 1000) # mu = 50, sd = 10
#mu : mean of distribution #분포의 평균 #50
#sd : standard deviation of the distribution #분포의 표준편차 #10
#1000개의 랜덤수 생성 , 분포의 평균 50 , 분포의 표준편차 10
population.var() #105.940243~~~
#var = 분산 = 표준편차의 제곱
출처 : m.blog.naver.com/qbxlvnf11/221944120494
큰 수의 법칙(Law of Large Numbers)과 중심 극한 정리(Central Limit Theorem)
큰 수의 법칙(Low of Large Number)과 중심 극한 정리(Central Limit Theorem)는 통계에서 가장 중...
blog.naver.com
중심극한정리(CLT)
Sample 데이터의 수가 많아질 수록, sample의 평균은 정규분포에 근사한 형태로 나타난다.

3학년 1반 전체 학생 : 30명
샘플의 크기 : 3명
출처 : angeloyeo.github.io/2020/09/15/CLT_meaning.html
중심극한정리의 의미 - 공돌이의 수학정리노트
angeloyeo.github.io
+ day8(1)참조
Confidence interval & CLT_Day8
warm up The Central Limit Theorem (CLT) (중심극한정리) when we do an experiemnt, we don't always know what distribution our data comes from. 실험할때 데이터가 어떤 분포로 형성될지 모른다 To this, "..
khalidpark2029.tistory.com
신뢰구간과 T-test의 관계
from scipy.stats import t, ttest_1samp
import numpy as np
np.random.seed(123)
coinflip_means = []
for x in range(0, 1000):
coinflips = np.random.binomial(n = 1, p = .5, size = 100)
coinflip_means.append(coinflips.mean())
coinflips.mean() = 동전던지기 50%확률로 100번 실행하여 나온값들의 평균
coinflip_means = 평균값들의 배열 (총 1000개)
# 표본의 크기
n = len(coinflip_means)
# 자유도
dof = n-1
# 표본 평균의 평균
mean = np.mean(coinflip_means)
# 표본의 표준편차
sample_std = np.std(coinflip_means, ddof = 1)
# 표준 오차
std_err = sample_std / n ** 0.5 # sample_std / sqrt(n)
CI = t.interval(.95, dof, loc = mean, scale = std_err)
print("95% 신뢰구간: ", CI)
95% 신뢰구간: (0.4808121037102203, 0.5158545629564464)
즉, 표본평균의 신뢰구간은 0.48~0.51 사이이다 (95%신뢰도기준)
따라서 모집단의 평균은 0.4일것이다 라는 귀무가설은 기간된다
또한 모집단의 평균은 0.495일것이다 라는 귀무가설은 기각되지 않는다 (귀무가설은 틀리다 라고 하기어렵다)
'AI월드 > ⚙️AI BOOTCAMP_Section 1' 카테고리의 다른 글
표준오차,표준편차,표본평균,모평균 통계용어 정리 (0) | 2021.01.07 |
---|---|
np.random.poisson & np.random.binomial (0) | 2021.01.07 |
Confidence interval & CLT_Day8 (0) | 2021.01.07 |
P-value & Q-value (0) | 2021.01.06 |
표본 크기가 커지면 발생할 수 있는 p-value 오류 (0) | 2021.01.06 |
댓글