본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계 ver1.0] 93. 표본분산의 분포에서 모집단 정규분포 조건제거 증명 (2) 정규분포를 카이제곱분포로 근사

by bigpicture 2022. 7. 17.
반응형

 

 

모집단에서 표본을 뽑을 때 표본의 크기 n이 충분히 크다면, 모집단의 분포와 상관 없이 표본분산의 분포는 카이제곱분포를 따른다는 것을 증명하고 있습니다. 

 

아래와 같이 두 단계로 나눠서 증명하고 있습니다. 

 

Step 1. $\frac{s^{2}}{\sigma^2}$ 의 분포 유도

Step 2. 정규분포를 카이제곱분포로 근사

 

지난시간에 Step1 내용을 유도했고 결과는 아래와 같습니다.

 

$\frac{s^{2}}{\sigma^2} \sim N\left ( 1,\frac{\kappa-1}{n} \right )$

 

오늘은 정규분포를 카이제곱분포로 근사시킨 뒤, 위 식을 변형할 것입니다. 자유도가 k인 카이제곱분포를 따르는 확률변수는 아래와 같이 놓을 수 있습니다. 

 

$\chi ^{2}_{k}=\sum_{i=1}^{k}Z^{2}_{i}$

 

양 변을 k로 나눠줍시다. 

 

$\frac{\chi ^{2}_{k}}{k}=\frac{\sum_{i=1}^{k}Z^{2}_{i}}{k}$

 

k로 나눠준 확률변수를 Y라고 놓겠습니다. 

 

$\frac{\chi ^{2}_{k}}{k}=\frac{\sum_{i=1}^{k}Z^{2}_{i}}{k}=Y$

 

$Y$는 확률변수가 $Z^{2}$인 모집단에서 크기가 k인 표본을 뽑아 평균을 낸 값이므로, 표본평균입니다. k가 무한대로 갈 경우 중심극한정리에 의해 아래 성질이 성립합니다. 

 

$Y\sim N\left (E\left [ Y \right ],V\left [ Y \right ]  \right )$

 

$E\left [ Y \right ]$는 아래와 같이 계산됩니다. 

 

$E\left [ Y \right ]=E\left [ \frac{\chi^{2}_{k}}{k} \right ]=\frac{E\left [ \chi^{2}_{k} \right ]}{k}=\frac{k}{k}=1$

 

$V\left [ Y \right ]$는 아래와 같이 계산됩니다. 

 

$V\left [ Y \right ]=V\left [ \frac{\chi^{2}_{k}}{k} \right ]=\frac{V\left [ \chi^{2}_{k} \right ]}{k^2}=\frac{2k}{k^2}=\frac{2}{k}$

 

따라서 $Y$는 아래 분포를 따릅니다. 

 

$Y \sim N\left ( 1,\frac{2}{k} \right )$

 

$Y$를 치환하기 전으로 돌려놓읍시다 .

 

$\frac{\chi ^2_{k}}{k} \sim N\left ( 1,\frac{2}{k} \right )$

 

지난시간에 유도한 식을 아래 써봅시다. 

 

$\frac{s^{2}}{\sigma^2} \sim N\left ( 1,\frac{\kappa-1}{n} \right )$

 

아래와 같이 변형합시다. 

 

$\frac{s^{2}}{\sigma^2} \sim N\left ( 1,\frac{1}{\frac{n}{\kappa-1}} \right )$

 

$\frac{1}{\frac{2n}{\kappa-1}}$ 를 DF로 치환합시다.

 

$\frac{s^{2}}{\sigma^2} \sim N\left ( 1,\frac{2}{DF} \right )$

 

오늘 유도한 식도 아래와 같이 변형합시다. 

 

$\frac{\chi ^2_{DF}}{DF} \sim N\left ( 1,\frac{2}{DF} \right )$

 

따라서 아래 등식이 성립합니다. 

 

$\frac{s^2}{\sigma^2}=\frac{\chi ^2_{DF}}{DF}$

 

아래와 같이 변형합시다. 

 

$DF\frac{s^2}{\sigma^2}=\chi ^2_{DF} \ \left ( DF=\frac{2n}{\kappa-1} \right )$

 

DF 자유도의 카이제곱분포를 $\chi ^2_{DF}$ 라고 한다면 아래와 같이 표현할 수도 있습니다.

 

$DF\frac{s^2}{\sigma^2} \sim \chi ^2_{DF} \ \left ( DF=\frac{2n}{\kappa-1} \right )$

 

유도는 끝났습니다. 모집단의 정규분포 가정을 하지 않고도, 표본평균의 분포가 카이제곱분포를 따른다는 것이 유도 됩니다. 하지만 자유도가 우리가 생각했던 것과 다릅니다. 다음 시간에 위 수식의 의미에 대해서 더 이야기해봅시다. 

 

반응형

댓글