본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계 ver1.0] 94. 표본분산의 분포에서 모집단 정규분포 조건제거 증명 (3) 유도한 식 검증

by bigpicture 2022. 7. 18.
반응형

 

 

지난 글에서 아래 식을 유도했습니다. 1번 식이라고 하겠습니다. 

 

$DF\frac{s^2}{\sigma^2} \sim \chi ^2_{DF} \ \left ( DF=\frac{2n}{\kappa-1} \right )$   (1)

 

모집단의 정규성을 가정하고 유도했던 표본분산의 분포 식과 비슷하지만 어딘가 다른 식입니다. 모집단의 정규성을 가정하고 유도한 표본분산의 분포 식은 아래와 같습니다. 2번 식이라고 합시다. 

 

$\frac{n-1}{\sigma^2}s^2 \sim \chi ^2_{n-1}$   (2)

 

2번 식은 두가지 조건을 가정하고 유도했습니다.

 

1. 표본평균의 분포가 정규분포를 따를 만큼 표본의 크기가 크다.
2. 모집단이 정규분포를 따른다.

사실 두번째 조건이 만족되면 첫번째 조건을 필요 없습니다. 모집단이 정규분포를 따르면 표본평균도 정규분포를 따릅니다. 두번째 조건을 제거할 생각으로 첫번째 조건을 남겨둔 것입니다. 

1번 식은 모집단이 정규분포를 따라야 한다는 조건 없이 유도된 식입니다. 표본의 크기 n이 무한대로 갈 때 표본분산은 1번 식의 분포를 따릅니다. 

 

정리하면 아래와 같습니다. 

 

 

DF 는 자유도인데요. 자유도가 n-1이 아닙니다. DF는 표본의 크기 n 뿐만 아니라 $\kappa$와도 관련된 식입니다. $\kappa$ 는 첨도입니다. 균등분포 모집단에서 뽑은 표본의 크기 n을 아무리 키워도 $\frac{n-1}{\sigma^2}s^2 \sim \chi ^2_{n-1}$ 가 왜 성립하지 않았는지 알 수 있습니다. 모집단의 $\kappa$ 에 따라 달라지는 DF를 고려해주지 않았기 때문입니다. 이런 성질을 무시한 채 DF를 n-1로 놓고 비교한 것입니다. 

 

DF가 n-1이 되려면 $\kappa$ 가 얼마여야 하는지 계산해봅시다. 

 

$DF=\frac{2n}{\kappa-1}=n-1$

 

아래와 같이 변형합시다. 

 

$\kappa=1+\frac{2n}{n-1}$

 

n이 무한대로 가면 $\kappa$ 는 3에 가까워집니다. 3은 정규분포의 첨도입니다. $\frac{n-1}{\sigma^2}s^2 \sim \chi ^2_{n-1}$ 이 성립하려면 꼭 정규분포일 필요는 없지만 $\kappa$ 가 3에 가까워야 성립합니다. 

 

우리는 모집단을 균등분포로 가정했었습니다. 균등분포의 첨도는 1.8 입니다. 모집단이 균등분포를 따를 경우 DF는 아래와 같습니다. 

 

$DF=\frac{2n}{0.8}=2.5n$

 

모집단이 균등분포를 따르는 경우 표본분산은 아래 분포를 따릅니다. 

 

$2.5n \frac{s^2}{\sigma^2} \sim \chi ^2_{2.5n}$

 

균등분포 1:10 를 따르는 모집단에서 표본을 뽑고 아래 두 경우를 비교해봤습니다. 표본의 크기는 50개입니다. 

 

왼쪽은 지난 글에서도 보여드렸던 그래프입니다. 모집단이 균등분포를 따를 경우 표본분산의 분포와 n-1 자유도 카이제곱분포가 잘 일치하지 않았었는데요. $2.5n \frac{s^2}{\sigma^2} \sim \chi ^2_{2.5n}$ 를 사용하니 상당히 잘 일치합니다. 

 

모집단 정규분포를 따르지 않는 경우 n이 커진다고 해서 표본분산의 분포가 n-1 카이제곱분포를 따르는 것은 아니었습니다. 아래 분포를 따릅니다. 

 

$DF\frac{s^2}{\sigma^2} \sim \chi ^2_{DF} \ \left ( DF=\frac{2n}{\kappa-1} \right )$

 

그런데 위 식을 사용하려면 모집단의 첨도를 알아야 합니다. 모집단의 첨도를 알아낼 방법이 있는지는 더 찾야봐야 합니다. 

 

표본분산의 분포를 카이제곱분포로 가정하려면, 먼저 모집단이 정규분포를 따르는지 확인해야하고 따르지 않는 경우에는 첨도를 구해서 1번식에 대입해야 합니다. 양쪽 모두 쉽지 않아 보입니다. 이 주제는 실제로 표본분산의 분포를 사용해야할 상황이 생기면 다시 다루겠습니다. 

반응형

댓글