본문 바로가기
728x90

표준편차4

공분산,상관계수,span,basis,rank_Day12(3) [지난주 복습] Variance (분산) 분산은 데이터가 얼마나 퍼져있는지 측정하는 방법 모집단의 분산 σ2 는 모집단의 PARAMETER (aspect, property, attribute, etc)이며, 샘플의 분산 s2 는 샘플의 STATISTIC (estimated attribute)입니다. 샘플 분산 s2 는 모집단 분산 σ2의 추정치 Standard Deviation (표준편차) 표준편차는 분산의 값에 (√)를 씌운 것 Covariance (공분산) 1개의 변수 값이 변화할 때 다른 변수가 어떠한 연관성을 나타내며 변하는지를 측정하는 것 Correlation coefficent (상관계수) 분산에서 스케일을 조정하기 위해 표준편차를 사용했던 것처럼, 공분산의 스케일을 조정하는 방법. 공분산을 .. 2021. 1. 13.
t-test란 무엇인가? (완전정복) 통계적인 생각,사고 : 어떤 사건이 우연히 발생할 확률은 얼마일까? 모집단의 표준편차가 알려지지 않았을 때, 정규분포의 모집단에서 모은 샘플(표본)의 평균값에 대한 가설검정 방법 t-test 목적 : 두개의 집단의 평균값이 통계적으로 같은지 다른지 비교하기 위해 사용한다!! 1.58 퍼져있는 표준편차는 의미없는 우연히 퍼져있는 정도 의미없는 퍼져있는 정도(표준편차)인 XXXcm 대비 우리가 비교하고 싶은 평균적인 거리 1.4cm 차이가 얼마나 큰지 작은지를 비교해 봄으로써, 1.4cm 차이가 의미있는 차이인지 의미없는 차이인지 결정할 수 있다. 정규분포는 평균과 표준편차만으로 규정됨 양측검정 vs 단측검정 양측검정의 대안가설 : Xa > Xb 또는 Xa < Xb 둘중 하나만 성립해도 되는 합집합 연구자가.. 2021. 1. 12.
표준오차,표준편차,표본평균,모평균 통계용어 정리 '모집단'이 있다 모집단의 평균을 M(뮤) , 표준편차를 S(시그마)라고 하자 모집단의 평균을 '추정'하기 위해 모집단에서 크기가 n인 표본을 추출, 이를 표본1이라고 하자 표본1의 평균은 m1 m1, m2, m3, m4, .... 이 표본평균은 다음과 같은 성질이 성립한다. 1) 표본평균의 평균이 모평균과 같다 (표본들 각각의 평균값들을 전부더해서 n만큼 나누면 모집단의 평균,모평균과 같아진다) 2) 표본 평균의 분산이 모분산을 n으로 나눈것과 같다 (천천히 한단어씩 이해하면서 넘어가야한다 . 뒤에서 혼돈이 올수있음) 분산 V(X) = E((X-M)**2) 분산 V(X) = S(X)**2 이 때 표본평균의 표준편차를 '표준오차'라고 한다 출처 : hsm-edu.tistory.com/794 표준오차가 뭔.. 2021. 1. 7.
큰수의법칙,CLT,신뢰구간_Day8(2) 큰수의법칙 사건을 무한히 반복할 때 일정한 사건이 일어나는 비율은 횟수를 거듭하면 할수록 일정한 값에 가까워지는 법칙 여기서 샘플링하는 것은 복원 추출을 기반으로 하며 각 사건은 동일 sample 데이터의 수가 커질 수록, sample의 통계치는 점점 모집단의 모수의 통계치와 같아진다. import numpy as np import matplotlib.pyplot as plt import pandas as pd population = np.random.normal(50, 10, 1000) # mu = 50, sd = 10 #mu : mean of distribution #분포의 평균 #50 #sd : standard deviation of the distribution #분포의 표준편차 #10 #1000.. 2021. 1. 7.
728x90