본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계] 22. 통계적 가설 검정 감잡기 2 (1표본 Z검정)

by bigpicture 2018. 5. 12.
반응형

지난글에서 통계적 가설검정이 무엇인지 간단히 살펴봤습니다. 오늘은 통계적 가설검정의 절차를 자세히 공부할 것입니다. 통계적 가설검정은 귀무가설과 대립가설을 세우고 해당 가설이 참인지를 확률적으로 판단하는 방법입니다.

 

모집단의 평균이 $\mu$라고 알려진 상황이고 우리는 이러한 사실을 반박하고 싶습니다. 이때 귀무가설과 대립가설은 아래와 같이 세웁니다. 

 

귀무가설 : $E[\bar{X}]=\mu$ (기존의 주장)

대립가설 : $E[\bar{X}] \neq \mu$ (기존의 주장에 반대하는 우리의 주장)

 

표본평균의 평균은 모평균과 같으므로 위 가설의 $E[\bar{X}]$ 는 '모집단의 평균' 을 다른 기호로 나타낸 것 뿐입니다. 

 

우리는 귀무가설이 참인지 여부를 통계적으로 판단해야 합니다. 판단 방법의 핵심은 표본평균의 분포입니다. 표본평균의 분포를 이용하여 가설이 참인지를 통계적으로 판단할 것입니다. 표본의 크기가 충분히 크다면 중심극한정리에 의해 표본평균은 아래 분포를 따릅니다. 

 

$\bar{X} \sim N \left ( \mu , \frac{\sigma^2}{n} \right )$

 

정규분포입니다. 이 정규분포의 평균은 모집단의 평균이고 분산은 모분산을 표본의 크기로 나눈 값입니다. 그래프로 그려보면 아래와 같습니다. 

 

 

여기서 이런 의문이 드는 분들이 계실겁니다. 아니, 표본을 뽑지도 않았는데 어떻게 분포를 가정해? 라는 의문입니다. 맞습니다. 우리는 표본을 뽑지 않았습니다. 표본을 뽑지 않아도 위 분포를 가정할 수 있습니다. 수학적으로 유도했기 때문입니다. 어떤 모집단에서 표본을 뽑을 때, 표본의 크기 n이 충분히 큰 표본평균은 위 분포를 따른다는 것이 수학적으로 유도되었습니다. 따라서 표본을 '굳이' 뽑아보지 않아도 아래와 같은 분포를 가정할 수 있는 것입니다.

 

$\bar{X} \sim N \left ( \mu , \frac{\sigma^2}{n} \right )$

 

여기서 한가지 중요한 내용을 짚고 넘어갑시다. 위 분포는 모평균이 $\mu$라고 가정한 분포입니다. 따라서 위 분포는 귀무가설이 참일 경우에 발생하는 분포입니다. 

 

이제 표본을 뽑아봅시다. 크기가 n인 표본을 뽑았고 표본 평균이 $\bar{X}_{1}$ 이라고 합시다. 이 표본평균은 위 분포를 따릅니다. 그림에 표시하면 아래와 같습니다. 

 

$\bar{X}_{1}$ 보다 극단적인 표본이 뽑힐 확률은 아래와 같습니다. 

 

 

 

 

이 넓이를 구했더니 0.001이 나왔다고 해봅시다. $\bar{X}_{1}$ 이상의 값을 갖는 표본이 뽑힐 확률이 0.1%라는 것입니다.

 

이때 두 가지 가능성이 있습니다. 

1. 0.1%라는 낮은 확률을 뚫고 표본이 뽑혔다.
2. 애초에 가설이 틀렸다. 

 

0.1%는 아주 희박한 확률이기 때문에 2번이 더 설득력이 있습니다. 따라서 귀무가설이 틀렸다고 주장할 수 있습니다. 이를 '기각' 이라고 합니다. 한자어는 버릴(기) 물리칠(각) 이고 영어로는 reject 입니다.

 

귀무가설을 기각하고 대립가설을 채택합니다. 모집단의 평균은 $\mu$ 가 아니야! 라는 우리의 주장이 통계적 설득력을 얻은 것입니다. 

위와 같은 검정방법을 1표본 Z검정이라고 합니다. 검정하는데 표준정규분포(z분포)를 이용했고, 하나의 모집단에서 하나의 표본을 뽑았기 때문에 붙여진 이름입니다.

 

혹시 '왜 $\bar{X}_{1}$ 자체의 확률분포값이 아니라 $\bar{X}_{1}$ 보다 극단적인 영역을 사용하느냐는 의문이 드시는 분들이 계실 수도 있습니다. 아래 글을 참고하시면 됩니다. 

 

https://hsm-edu.tistory.com/989

 

#영상 강의

 

반응형

댓글