본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계 ver1.0] 75. 표본분산의 분포 유도 (40) 표본분산의 분포 유도 완성 및 오류 수정

by bigpicture 2021. 9. 22.
반응형

 

 

우리는 n자유도 카이제곱분포와 적률생성함수를 유도한 상태입니다. 

$f_{n}(x)=\frac{1}{2^{\frac{n}{2}}
\Gamma \left ( \frac{n}{2} \right )
}
e^{-\frac{x}{2}} x^{\frac{n}{2}-1}$

 

$M_{X}(t)=
\left ( 1-2t \right )^{-\frac{n}{2}} \quad \left ( t<\frac{1}{2} \right )$

표본분산의 분포를 유도하는 과정에서 카이제곱분포가 필요했던 것인데요. 오늘은 표본분산의 분포를 완성해보려고 합니다. 그 전에 37강에서 표본분산의 분포를 유도하던 과정에 오류가 있었어서 이를 정정하려고 합니다.

 

37강에서는 표본분산의 정의를 변형하여 카이제곱분포형태로 바꾸는데요. 간단히 리뷰해봅시다. 표본분산의 정의는 아래와 같습니다.

 

$s^{2}=\frac{\sum_{i=1}^{n}\left ( X_{i}-\bar{X}  \right )^{2}}{n-1}$

 

양변에 n-1을 곱해서 아래와 같이 변형했습니다. 

카이제곱분포

 

$(n-1)s^{2}=X_{1}^{2}+X_{2}^{2}+\cdots +X_{n}^{2}-n\bar{X}^{2}$

 

이런저런 과정을 거쳐서 아래와 같이 변형했습니다. 

 

$\frac{n-1}{\sigma^{2}}s^{2}=
\left (\frac{X_{1}-\mu}{\sigma}  \right )^{2}+
\cdots +
\left (\frac{X_{n}-\mu}{\sigma}  \right )^{2}-
\left (\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}  \right )^{2}$

 

위 식에서 두 항을 소거했는데요. 일반적으로 확률변수끼리는 마음대로 소거할 수 없습니다. 여기서 오류를 범했습니다. 이 부분을 명확히 하려고 합니다.

 

위 식을 아래와 같이 이항합시다. 

 

$\frac{n-1}{\sigma^{2}}s^{2}+\left (\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}  \right )^{2}=
\left (\frac{X_{1}-\mu}{\sigma}  \right )^{2}+
\cdots +
\left (\frac{X_{n}-\mu}{\sigma}  \right )^{2}$

 

좌변의 두번째항은 1자유도 카이제곱분포를 따르는 확률변수입니다. $Y_{1}$이라고 놓겠습니다. 우변은 n자유도 카이제곱분포를 따르는 확률변수이므로 $Y_{n}$ 이라고 놓겠습니다. 양변에 적률생성함수를 취합시다. 

 

$M_{\frac{n-1}{\sigma^{2}}+Y_{1}}(t)=M_{Y_{n}}(t)$

 

기댓값 형태로 바꿔줍시다. 

 

$E\left [ e^{\left ( \frac{n-1}{\sigma^{2}}s^{2}+Y_{1} \right )t} \right ]=E\left [ e^{Y_{n}t} \right ]$

 

좌변을 아래와 같이 변형합시다. 

 

$M_{\frac{n-1}{\sigma^{2}}s^{2}+Y_{1}}(t)=E\left [ e^{\left ( \frac{n-1}{\sigma^{2}}+Y_{1} \right )t} \right ]$

 

서로 독립인 변수인 경우 아래와 같이 둘로 나눠쓸 수 있습니다. 

 

$E\left [ e^{\left ( \frac{n-1}{\sigma^{2}}s^{2} \right )t} \right ]
E\left [ e^{\left ( Y_{1} \right )t} \right ]=E\left [ e^{Y_{n}t} \right ]$

 

1자유도 카이제곱분포와 n자유도 카이제곱분포의 적률생성함수는 알고 있으므로 아래와 같이 변형할 수 있습니다 .

 

$E\left [ e^{\left ( \frac{n-1}{\sigma^{2}}s^{2} \right )t} \right ]
\left ( 1-2t \right )^{\frac{1}{2}}
=\left ( 1-2t \right )^{\frac{n}{2}}$

 

아래와 같이 계산해줍시다. 

 

$E\left [ e^{\left ( \frac{n-1}{\sigma^{2}}s^{2} \right )t} \right ]
=\left ( 1-2t \right )^{\frac{n-1}{2}}$

 

좌변은 $\frac{n-1}{\sigma^{2}}s^{2}$ 의 적률생성함수이고 우변은 n-1 카이제곱분포의 적률생성함수입니다. 따라서 $\frac{n-1}{\sigma^{2}}s^{2} $ 가 n-1 자유도의 카이제곱분포를 따르는 확률변수라는 것을 알 수 있습니다. 기호로는 아래와 같이 나타냅니다. 

 

$\frac{n-1}{\sigma^{2}}s^{2} \sim \chi^{2}_{n-1}$

 

37강에서는 근거없이 빼주긴 했었지만 오류는 아니었습니다. 카이제곱분포의 경우는 확률변수사이의 연산이 결과적으로는 가능합니다. 예를들어 5자유도 카이제곱분포를 따르는 확률변수와 2자유도 카이제곱을 따르는 확률변수를 빼면 3자유도 카이제곱분포를 따르는 확률변수가 되는 것입니다. 모든 확률변수가 그런 것은 아니고 카이제곱분포의 경우만 가능합니다. 

반응형

댓글