본문 바로가기
AI월드/⚙️AI BOOTCAMP_Section 1

큰수의법칙,CLT,신뢰구간_Day8(2)

by khalidpark 2021. 1. 7.

큰수의법칙

 

사건을 무한히 반복할 때 일정한 사건이 일어나는 비율은

횟수를 거듭하면 할수록 일정한 값에 가까워지는 법칙

여기서 샘플링하는 것은 복원 추출을 기반으로 하며 각 사건은 동일

 

 

sample 데이터의 수가 커질 수록, sample의 통계치는 점점 모집단의 모수의 통계치와 같아진다.

 

 

import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

 

population = np.random.normal(50101000# mu = 50, sd = 10

#mu : mean of distribution #분포의 평균 #50

#sd : standard deviation of the distribution #분포의 표준편차 #10

#1000개의 랜덤수 생성 , 분포의 평균 50 , 분포의 표준편차 10

 

population.var() #105.940243~~~

#var = 분산 = 표준편차의 제곱

 

출처 : m.blog.naver.com/qbxlvnf11/221944120494

 

큰 수의 법칙(Law of Large Numbers)과 중심 극한 정리(Central Limit Theorem)

​큰 수의 법칙(Low of Large Number)과 중심 극한 정리(Central Limit Theorem)는 통계에서 가장 중...

blog.naver.com


중심극한정리(CLT)

Sample 데이터의 수가 많아질 수록, sample의 평균은 정규분포에 근사한 형태로 나타난다.

 

 

 

 

3학년 1반 전체 학생 : 30명

샘플의 크기 : 3명

 

출처 : angeloyeo.github.io/2020/09/15/CLT_meaning.html

 

중심극한정리의 의미 - 공돌이의 수학정리노트

 

angeloyeo.github.io

+ day8(1)참조

khalidpark2029.tistory.com/25

 

Confidence interval & CLT_Day8

warm up The Central Limit Theorem (CLT) (중심극한정리) when we do an experiemnt, we don't always know what distribution our data comes from. 실험할때 데이터가 어떤 분포로 형성될지 모른다 To this, "..

khalidpark2029.tistory.com


신뢰구간과 T-test의 관계

 

from scipy.stats import t, ttest_1samp
import numpy as np
np.random.seed(123)
coinflip_means = []
for x in range(0, 1000):
  coinflips = np.random.binomial(n = 1, p = .5, size = 100)
  coinflip_means.append(coinflips.mean())

coinflips.mean() = 동전던지기 50%확률로 100번 실행하여 나온값들의 평균

coinflip_means = 평균값들의 배열 (총 1000개)

# 표본의 크기
n = len(coinflip_means)
# 자유도
dof = n-1
# 표본 평균의 평균
mean = np.mean(coinflip_means)
# 표본의 표준편차
sample_std = np.std(coinflip_means, ddof = 1)
# 표준 오차
std_err = sample_std / n ** 0.5 # sample_std / sqrt(n)

CI = t.interval(.95, dof, loc = mean, scale = std_err)
print("95% 신뢰구간: ", CI)

95% 신뢰구간: (0.4808121037102203, 0.5158545629564464)

즉, 표본평균의 신뢰구간은 0.48~0.51 사이이다 (95%신뢰도기준)

 

따라서 모집단의 평균은 0.4일것이다 라는 귀무가설은 기간된다
또한 모집단의 평균은 0.495일것이다 라는 귀무가설은 기각되지 않는다 (귀무가설은 틀리다 라고 하기어렵다)

728x90

댓글