본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계 ver1.0] 36. 표본분산의 분포 유도 (1) 표본분산 수식 변형하기

by bigpicture 2020. 4. 1.
반응형
 

 


표본분산의 분포를 유도해봅시다. 일단 시도해보면서 어떤 내용들이 더 필요할지 알아볼 것입니다. 만만치 않은 과정이 될 것 같네요. 

평균이 μ 이고 분산이 σ² 인 모집단이 있습니다. 이 모집단에서 뽑을 수 있는 크기가 n인 표본의 표본분산은 아래와 같이 정의됩니다. 

 

s² 는 표본분산의 확률변수입니다. 모집단에서 뽑은 수많은 표본분산을 원소로 갖는 집합입니다. 우리가 실제로 표본을뽑는다면, 그 표본을 이 함수에 대입하여 표본분산을 구할 수 있습니다. 

확률변수로 놓는 것은 3강에서도 설명한 개념인데요. 이 부분이 이해 안되시는 분들은 댓글을 달아주세요. 많은 분들이 이해를 어려워하시면 더 와닿는 설명을 생각해 보겠습니다. 

이제 위 식을 전개해봅시다. 


앙변에 n-1을 곱합시다. 

 


시그마와 무관한 식들은 시그마 밖으로 꺼내줍시다. 


빨간 부분에 n을 곱하고 나눠줍니다. 


빨간 부분을 n으로 나눈 값은 표본평균이므로 아래와 같이 쓸 수 있습니다. 


계산하면 아래와 같습니다. 


마지막 두 항은 계산할 수 있습니다. 


시그마를 전개합시다. 


파란 부분의 X1부터 Xn은 각각 모집단의 확률변수와 같습니다. 따라서 우변을 해석해보면, 모집단의 확률분포를 따르는 확률변수의 제곱식이 n개 있고, 표본평균의 확률분포를 따르는 확률변수의 제곱식이 n개 있습니다. 

그런데 우리는 모집단의 확률분포도 모르고, 표본평균의 확률분포도 모릅니다. 따라서 두가지 가정을 추가하겠습니다. 

1) 표본평균의 분포가 정규분포를 따를 만큼 표본의 크기 n이 크다. 
2) 모집단의 분포는 정규분포를 따른다. 

1번 가정은 중심극한정리의 조건이고, 1번조건은 실제 상황에서도 쉽게 만족시킬 수 있습니다. 문제는 2번조건인데요. 나중에 처리하도록 합시다. 

이제 우변을 다시 해석해봅시다. 정규분포를 따르는 모집단의 확률변수의 제곱이 n개 있고, 정규분포를 따르는 표본평균의 제곱이 n개 있습니다. 

정규분포보다 표준정규분포가 다루기 쉬우므로, 변형해주겠습니다. 표준화를 할 것입니다. 다음 글에서 이어가겠습니다.

반응형

댓글