본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계 ver1.0] 35. z검정의 한계 (우리는 이유도 모른채 모분산 대신 표본분산을 사용했었다)

by bigpicture 2020. 3. 30.
반응형

 


오늘은 z검정의 한계에 대한 이야기를 해볼것입니다. 

우리는 지금까지 z검정을 열심히 배웠지만, 실제로 z검정을 사용할 수 있는 상황은 거의 없습니다. 왜그럴까요?

z검정을 하기 위해서 우리는 모집단의 분산을 알아야 합니다. z검정에서 표본평균의 분포를 정의하는데, 이때 표본평균의 분산이 모분산/n이기 때문입니다. 

모평균도 몰라서 추정하고 있는데 모분산을 아는 경우가 얼마나 될까요? 

없을겁니다. z검정이라는 아주 유용한 검정을 발견했지만, 모분산을 알 수 없는 상황에서는 z검정을 사용할 수가 없습니다. 이 문제를 어떻게 해결할 수 있을까요. 가장 쉽게 떠오르는 방법은 아래와 같을 것입니다. 

"표본의 분산을 모분산 대신 사용하자"

아래와 같이 대체하는 것입니다. (σ는 모표준편차, s는 표본표분편차입니다.)

 

이래도 괜찮을까요? 

표본분산은 모분산의 추정량입니다. 4강에서 배운 것처럼 아래 등식이 성립합니다. 

 

표본분산의 평균이 모분산인 것이지, 우리가 뽑은 표본의 분산이 모분산과 같은 것은 아닙니다. 우리가 뽑은 표본의 분산이 모분산과 얼마나 같은지 혹은 다른지 알아볼 방법이 있을까요? 

표본분산의 분포를 구해보면 알 수 있습니다. 표본분산의 분포는 '카이제곱 분포'입니다. 다음시간부터는 표본분산의 분포를 유도해보고 모분산을 표본분산으로 단순히 대체할 때 어떤 문제가 있으며, 그 문제는 어떻게 해결할 수 있는지 알아봅시다. 

반응형

댓글