본문 바로가기
@ 통계 교양/통계 Tips

중심극한정리에서 표본의 개수가 중요하지 않은 이유

by bigpicture 2020. 4. 1.
반응형

중심극한정리는 모집단에서 뽑은 표본의 크기 n이 충분히 큰 경우 표본평균들의 분포가 정규분포를 따른다는 정리입니다. 기호로 나타내면 아래와 같습니다.

 

$\bar{X} \sim N\left ( \mu,\frac{\sigma^2}{n} \right )$

 

표본의 크기와 표본의 개수가 구분이 안되시는 분들은 링크의 글을 읽고 오시면 됩니다. 

 

중심극한정리를 접한 분들 중에 이런 의문이 드는 분들이 계실겁니다. 

 

왜 표본의 개수가 아니라 표본의 크기가 커야되나요?? 표본의 개수가 많아야 분포가 되는거 아닌가요?  

 

왜 이런 의문이 들었는지 중심극한정리를 적용하는 상황을 통해 알아봅시다. 평균이 50이고 분산은 9라고 알려져 있는 모집단이 있습니다. 이 모집단에서 크기가 100인 표본을 뽑을 예정입니다. 표본은 아직 안뽑았습니다. 그래도 우리는 아래와 같은 가정을 할 수 있습니다. 

 

표본의 크기 n이 충분히 크기 때문에, 우리는 표본평균의 분포를 아래와 같이 가정할 수 있습니다. 

 

$\bar{X} \sim N\left ( \mu,\frac{\sigma^2}{n} \right )$

 

모집단의 평균과 분산을 대입합니다. 

 

$\bar{X} \sim N\left (50,\frac{9}{100} \right )$

 

우리는 표본평균의 분포함수를 얻었습니다. 아직 표본을 뽑지도 않았고 단지 우리가 표본의 크기가 100이라고 상상한 순간 분포함수를 얻은 것입니다. 

 

이제 실제로 표본을 뽑아봅시다. 크기 100인 표본을 뽑아서 표본평균을 구했습니다. 우리가 구한 단 하나의 표본평균은 표본을 뽑기도 전에 가정했던 분포함수를 위의 한 점입니다. 

 

이 지점에서 의문을 가지셨을 것입니다. 

 

"아니, 말이돼? 표본을 뽑지도 않고 '분포'를 가정한다고?? 일단 분포가 되려면 표본을 엄청 많이 뽑아야 하는거 아니야?? 표본 왕창 뽑아서 좌표평면에 점을 잔뜩 찍고 연결해야 분포가 되는거 아니야??"

 

맞는 말입니다. 표본을 아주 많이 뽑아서 직접 분포를 그리는 것도 하나의 방법입니다. 수천~수만개의 표본을 뽑으시면 어느정도 정확한 분포를 그리실 수 있을 겁니다. 실제로 수천~수만개의 표본을 뽑는게 가능할까요? 불가능합니다. 

 

중심극한 정리가 통계학에서 아주 많이 사용되고 있는 이유입니다. 수천~수만개의 표본을 뽑지 않고도 분포를 가정할 수 있으니까요. 표본의 크기 n이 충분히 크면 표본평균의 분포는 정규분포를 따른다는 것는 수학적으로 유도된 것입니다. 다른 조건은 없습니다. n만 충분히 크면 됩니다. 표본을 한개도 뽑아보지 않아도 됩니다. 

 

물론 실제로 표본을 무수히 많이 뽑아서 그린 분포와 완전히 일치하지는 않습니다. 이론적으로 n이 무한대일 경우에 일치합니. 하지만 n이 충분히 클 경우 오차를 무시할 수 있을 만큼 상당히 일치합니다. 

 

다시 처음으로 돌아가 봅시다. 평균이 50이고 분산은 9라고 알려져 있는 모집단이 있습니다. 크기가 100인 표본을 하나 뽑았습니다. 우리는 표본평균의 분포가 궁금했습니다. 두 가지 방법이 있습니다. 하나는 표본을 99999...개 더 뽑아서 분포함수를 찾으려고 애쓰는 것이고, 다른 하나는 수학적으로 유도된 이미 알고 있는 결과를 사용하는 것입니다. 수학적으로 유도된 결과는 아래와 같습니다. 

 

1) 표본평균의 평균은 모집단의 평균이고, 표본평균의 분산은 모분산/n이다. 

2) 표본의 크기가 충분히 크면 표본평균의 분포는 정규분포를 따른다. 

 

 

<참고>

표본평균의 평균이 모평균임을 유도 : https://hsm-edu.tistory.com/14

중심극한정리 유도 강의 링크 :  https://hsm-edu.tistory.com/21

반응형

댓글