본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계 ver1.0] 92. 표본분산의 분포에서 모집단 정규분포 조건제거 증명 (1) $\frac{s^{2}}{\sigma^2}$ 의 분포 유도

by bigpicture 2022. 7. 16.
반응형

 

 

표본분산의 분포가 카이제곱분포를 따르려면 모집단이 정규분포를 따른다는 조건이 필요했습니다. 87강에서 논문을 소개하며 n이 충분히 크면 모집단이 정규분포를 따르지 않아도 표본분산이 카이제곱분포를 따른다는 것을 보여드렸는데요. 증명은 하지 않고 넘어갔습니다. 증명이 너무 길어서 넘어갔다고 말씀드렸었는데, 논문을 다시 보니 생각보다 길지는 않았습니다. 또한 시뮬레이션을 통해 위 성질이 성립하는지 시험에보았지만 성립하지 않았습니다. 위 조건을 직접 증명하며 이유를 알아봅시다.

 

논문의 증명을 더 쉽게 이해할 수 있도록 약간 수정하였습니다. 증명은 두 단계로 나뉩니다. 

 

Step 1. $\frac{s^{2}}{\sigma^2}$ 의 분포 유도

Step 2. 정규분포를 카이제곱분포로 근사

 

이번 글에서는 Step1 을 유도하겠습니다. 

 

Step 1. $\frac{s^{2}}{\sigma^2}$ 의 분포 유도

표본분산을 계산하는 수식은 아래와 같습니다. 

 

$s^{2}=\frac{\sum_{i=1}^{n}\left ( X_{i}-\overline{X} \right )^{2}}{n-1}$

 

양변에 n-1을 곱합니다. 

 

$\left ( n-1 \right )s^{2}=\sum_{i=1}^{n}\left ( X_{i}-\overline{X} \right )^{2}$

 

우변 괄호 안에 $\mu$를 빼고 더해줍니다. 

 

$\left ( n-1 \right )s^{2}=\sum_{i=1}^{n}\left ( X_{i}-\mu+\mu-\overline{X} \right )^{2}$

 

괄호 안을 아래와 같이 변형합니다. 

 

$\left ( n-1 \right )s^{2}=\sum_{i=1}^{n}\left ( X_{i}-\mu-\left ( \overline{X}-\mu \right ) \right )^{2}$

 

아래와 같이 전개합니다. 

 

$\left ( n-1 \right )s^{2}=\sum_{i=1}^{n}\left [ 
\left ( X_{i}-\mu \right )^{2} 
-2\left ( X_{i}-\mu \right )\left ( \overline{X}-\mu \right )
+\left ( \overline{X}-\mu \right )^{2}
\right ]$

 

우변을 아래와 같이 셋으로 나눠 씁니다. 

 

$\left ( n-1 \right )s^{2}=
\sum_{i=1}^{n}
\left ( X_{i}-\mu \right )^{2} 
-2\sum_{i=1}^{n}
\left ( X_{i}-\mu \right )\left ( \overline{X}-\mu \right )
+
\sum_{i=1}^{n}
\left ( \overline{X}-\mu \right )^{2}$

 

두번째 항에서 시그마와 무관한 항을 밖으로 꺼냅니다. 

 

$\left ( n-1 \right )s^{2}=
\sum_{i=1}^{n}
\left ( X_{i}-\mu \right )^{2} 
-2\left ( \overline{X}-\mu \right )\sum_{i=1}^{n}
\left ( X_{i}-\mu \right )
+
\sum_{i=1}^{n}
\left ( \overline{X}-\mu \right )^{2}$

 

세번째 항을 계산해줍니다. 

 

$\left ( n-1 \right )s^{2}=
\sum_{i=1}^{n}
\left ( X_{i}-\mu \right )^{2} 
-2\left ( \overline{X}-\mu \right )\sum_{i=1}^{n}
\left ( X_{i}-\mu \right )
+
n\left ( \overline{X}-\mu \right )^{2}$

 

두번째 항의 시그마와 무관한 항을 밖으로 꺼냅니다. 

 

$\left ( n-1 \right )s^{2}=
\sum_{i=1}^{n}
\left ( X_{i}-\mu \right )^{2} 
-2\left ( \overline{X}-\mu \right )
\left [\sum_{i=1}^{n} X_{i}-n\mu  \right ]
+
n\left ( \overline{X}-\mu \right )^{2}$

 

n을 괄호 밖으로 꺼냅니다. 

 

$\left ( n-1 \right )s^{2}=
\sum_{i=1}^{n}
\left ( X_{i}-\mu \right )^{2} 
-2\left ( \overline{X}-\mu \right )n
\left [\frac{\sum_{i=1}^{n} X_{i}}{n}-\mu  \right ]
+
n\left ( \overline{X}-\mu \right )^{2}$

 

두번째 항의 시그마를 계산합니다. 결과는 표본평균입니다. 

 

$\left ( n-1 \right )s^{2}=
\sum_{i=1}^{n}
\left ( X_{i}-\mu \right )^{2} 
-2\left ( \overline{X}-\mu \right )n
\left [\overline{X}-\mu  \right ]
+
n\left ( \overline{X}-\mu \right )^{2}$

 

두번째 항을 아래와 같이 정리해줍니다. 

 

$\left ( n-1 \right )s^{2}=
\sum_{i=1}^{n}
\left ( X_{i}-\mu \right )^{2} 
-2n\left ( \overline{X}-\mu \right )^{2}
+
n\left ( \overline{X}-\mu \right )^{2}$

 

두번째 항과 세번째 항을 계산합니다. 

 

$\left ( n-1 \right )s^{2}=
\sum_{i=1}^{n}
\left ( X_{i}-\mu \right )^{2} 
-n\left ( \overline{X}-\mu \right )^{2}$

 

좌변을 분리해서 써줍니다. 

 

$ns^{2}-s^{2}=
\sum_{i=1}^{n}
\left ( X_{i}-\mu \right )^{2} 
-n\left ( \overline{X}-\mu \right )^{2}$

 

양변을 n으로 나눠줍니다. 

 

$s^{2}-\frac{1}{n}s^{2}=
\frac{\sum_{i=1}^{n}
\left ( X_{i}-\mu \right )^{2} }{n}
-\left ( \overline{X}-\mu \right )^{2}$

 

좌변의 두번째 항을 이항합니다. 

 

$s^{2}=
\frac{\sum_{i=1}^{n}
\left ( X_{i}-\mu \right )^{2} }{n}
-\left ( \overline{X}-\mu \right )^{2}+\frac{1}{n}s^{2}$

 

양변을 모분산인 $\sigma^2$으로 나눠줍니다. 

 

$\frac{s^{2}}{\sigma^2}=
\frac{1}{n}
\sum_{i=1}^{n}
\left ( \frac{X_{i}-\mu}{\sigma} \right )^{2}
-\left ( \frac{ \overline{X}-\mu}{\sigma} \right )^{2}+\frac{1}{n}\frac{s^{2}}{\sigma^2}$

 

여기서 n을 무한대로 보냅니다. n이 무한대가 되면 우변의 두번째 항의 표본평균은 모평균이 되므로 두번째 항은 0입니다. 우변의 세번째 항도 0입니다. 따라서 좌변의 분포는 아래 수식 우변의 분포와 같습니다. 

 

$\frac{s^{2}}{\sigma^2}=\lim_{n \rightarrow \infty}
\frac{1}{n}
\sum_{i=1}^{n}
\left ( \frac{X_{i}-\mu}{\sigma} \right )^{2}$

 

위 수식의 우변의 분포는 무엇일까요? 

 

우변은 확률변수가 $\left ( \frac{X-\mu}{\sigma} \right )^{2}$ 인 모집단에서 뽑은 크기가 n인 표본평균이라고 해석할 수 있습니다. 

 

$\left ( \frac{X_{i}-\mu}{\sigma} \right )^{2}$ 를 어떤 모집단의 표본으로 해석한다면 우변은 표본평균입니다. 간단히 하기 위해 확률변수를 Y로 치환합시다.

 

$\left ( \frac{X_{i}-\mu}{\sigma} \right )^{2}=Y$

 

표본평균에서 n을 무한대로 보낼 경우 중심극한정리가 성립합니다. 따라서 정규분포로 근사할 수 있습니다. 표본평균의 평균은 모평균과 같고 표본평균의 분산은 모분산을 n으로 나눈 것과 같습니다. 

 

$E\left [ \bar{Y} \right ]=E\left [ \left ( \frac{X-\mu}{\sigma} \right )^{2} \right ]$

 

$V\left [ \bar{Y} \right ]=
\frac{ V\left [ \left ( \frac{X-\mu}{\sigma} \right )^{2} \right ]}{n}$

 

평균을 먼저 계산합시다. 아래와 같이 변형하여 계산합니다. 

 

$E\left [ \bar{Y} \right ]=\frac{E\left [ \left ( X-\mu \right )^2 \right ]}{\sigma^2}$

 

우 변의 분자는 '편차의 제곱의 평균'입니다. 모분산입니다. 

 

$E\left [ \bar{Y} \right ]=\frac{\sigma^2}{\sigma^2}=1$

 

따라서 평균은 1입니다.

 

이번에는 분산을 계산해봅시다. 분산에서 우변의 분자만 따로 계산합시다. 아래와 같이 변형공식을 적용합시다. 

 

$V\left [ \left ( \frac{X-\mu}{\sigma} \right )^{2} \right ]=
E\left [ \left ( \frac{X-\mu}{\sigma} \right )^{4} \right ]-\left ( E\left [ \left ( \frac{X-\mu}{\sigma} \right )^{2} \right ] \right )^2$

 

우변의 두번째 항은 1입니다. 

 

$V\left [ \left ( \frac{X-\mu}{\sigma} \right )^{2} \right ]=
E\left [ \left ( \frac{X-\mu}{\sigma} \right )^{4} \right ]-1$

 

우변의 첫번째 항은 첨도입니다. $\kappa$라고 놓겠습니다. 

 

$V\left [ \left ( \frac{X-\mu}{\sigma} \right )^{2} \right ]=
\kappa-1$

 

따라서 표본평균의 분산은 아래와 같습니다. 

 

$V\left [ \bar{Y} \right ]=
\frac{\kappa-1}{n}$

 

$\frac{s^{2}}{\sigma^2}$ 은 아래 분포를 따릅니다. 

 

$\frac{s^{2}}{\sigma^2} \sim N\left ( 1,\frac{\kappa-1}{n} \right )$

 

반응형

댓글