본문 바로가기
@ 통계 교양/통계 Tips (영상)

중심극한정리가 헷갈리시는 분들을 위한 극단적인 예시

by bigpicture 2022. 7. 28.
반응형

 

 

중심극한정리는 아래와 같은 정리입니다. 

"모집단의 분포와 상관 없이 표본의 크기가 커지면 표본평균의 분포가 정규분포에 가까워져 간다."

표본의 크기가 충분히 크면 표본평균의 분포를 정규분포로 근사시킬 수 있다는 것입니다. 충분히 큰 표본의 크기를 보통 30으로 놓습니다. 

중심극한정리를 헷갈려하시는 분들이 많아서 아주 극단적인 상황을 통해 설명을 하려고 합니다. 일부러 극단적인 상황을 선택했습니다. 극단적인 상황의 예시가 제대로 이해하지 못한 분들에게 리트머스 종이가 될 수 있기 때문입니다. 이게 된다고? 라는 생각이 드시는 분들은 중심극한정리를 제대로 이해하지 못하고 계셨던 것입니다. 이번 기회에 제대로 이해해 봅시다. 

아래와 같은 모집단이 있다고 합시다. 

모집단 = {1}

원소가 1 하나뿐인 모집단입니다. 이 모집단에서 표본을 뽑고 평균을 구하면 1입니다. 복원추출로 크기가 아주 큰 표본을 뽑더라도 표본평균은 항상 1입니다. 그래프로 그리면 아래와 같습니다. n은 표본의 크기입니다. 

 

 

모집단의 원소가 1개 뿐이라면 중심극한정리는 성립하지 않습니다. 혹은 아래와 같이 모든 원소의 값이 같아도 중심극한정리는 성립하지 않습니다. 

모집단= {1, 1, 1 1, 1}

이번에는 모집단의 원소를 하나 더 늘려봅시다. 

모집단 = {1,2}

복원추출로 크기가 10,30,100인 표본평균의 분포를 그려보면 아래와 같습니다. 

n이 커질 수록 정규분포에 가까워집니다. 모집단이 1,2 두개의 원소였습니다. 이런 극단적인 모집단에서도 중심극한정리는 성립합니다. 

 

모집단을 비대칭으로 만들어봅시다. 

 

모집단 = {1,2,3,3,3,3}

 

그래프를 그려보겠습니다. 

 

 n이 작은 경우 분포가 비대칭이 되는 경향이 있지만 n이 커지면서 정규분포에 가까워져갑니다. 

 

모집단이 뭐든 상관없습니다. 상자에 1이 적힌공 하나, 2가 적힌공 하나만 들어있는 모집단에서도 중심극한정리는 성립합니다. 


아래는 그래프를 그린데 사용한 R 코드입니다. 

 

library(dplyr)

ppltn=c(1,2)

dt=list()

par(mfrow=c(1,3))

for (j in c(10,30,100)){
  for (i in 1:10000){
    dt[[i]]=sample(ppltn,j,replace=TRUE) %>% mean
  }
  unlist(dt) %>% hist(main=paste0("n=",j),prob=T)
  lines(density(unlist(dt)))
}

 

반응형

댓글