본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계 ver1.0] 90. 표본분산의 분포 시뮬레이션 (3) 누적분포함수 비교

by bigpicture 2022. 6. 8.
반응형

 

 

지난 글에서 표본분산의 분포를 히스토그램으로 그려보았습니다. 모집단을 설정하고 실제 표본을 뽑아서 그린 히스토그램과 표본크기에서 1을 뺀 자유도를 갖는 카이제곱분포 함수를 그렸다. 

 

모집단이 균등분포를 따르는 경우 표본분산의 분포와 카이제곱분포는 잘 일치하지 않았습니다. 

 

 

위에 그린 함수는 확률밀도함수인데요. 표본분산의 분포를 그릴 때 히스토그램 형태로 그려야 하기 때문에 구간 간격에 따라 모양이 조금씩 달라집니다. 누적분포함수로 그릴 경우 이러한 문제가 없어지기 때문에 누적분포함수로도 그려보려고 합니다. 

 

실험 방법은 앞의 글과 동일합니다. 모집단은 네 가지 종류로 설정했습니다.

 

모집단1 : 1~10 의 자연수. 1:10으로 표기

모집단2 : 1~1000 의 자연수. 1:1000으로 표기

모집단3 : 표준정규분포에서 추출한 10개의 값

모집단4 : 표준정규분포에서 추출한 1000개의 값

 

표본의 크기는 3,30,50,100,1000,3000 으로 설정하였습니다. 결과는 아래와 같습니다. 

 

 

 

균등모집단의 경우 표본분산의 분포와 카이제곱분포가 일치하지 않습니다. n이 커지면 일치하는 것처럼 보일 수 있는데 x축 범위가 넓어진데 반해 그래프 영역은 좁아서 그렇습니다. 다음 글에서 p값을 비교해보면 n이 커져도 일치하지 않는 다는 것을 알 수 있을겁니다. 

 

 

 

모집단이 정규분포를 따르면 표본분산의 분포와 카이제곱분포가 잘 일치합니다. 다음시간에는 p값을 이용하여 정량적으로 비교해봅시다. 

반응형

댓글