본문 바로가기
@선택과목1/손으로 푸는 t검정

[손으로 푸는 t검정] 2. Z검정과 그 한계

by bigpicture 2022. 12. 24.
반응형

t검정을 이해하려면 Z검정과 그 한계를 먼저 알아야 합니다. t검정이 고안되기 이전에는 Z검정을 사용하고 있었고, Z검정의 한계를 극복하는 과정에서 t검정이 등장했기 때문입니다.

 

1. Z검정

Z검정이 무엇인지는 「손으로 푸는 통계」에서 아주 자세히 설명했습니다. 여기서는 Z검정이 무엇인지 간단히 요약해보려고 합니다. 자세한 설명은 「손으로 푸는 통계」를 참고하시면 됩니다.

 

Z검정은 두가지가 있습니다. 하나는 평균이 알려진 모집단에서 표본 하나를 뽑아서 모평균을 검정하는 일표본 Z검정입니다. 다른 하나는 두 모집단에서 각각 표본을 뽑고, 두 모집단의 평균을 비교하는 이표본 Z검정입니다. 일표본 Z검정을 기준으로 설명하겠습니다. 

 

모집단 A의 평균이 $\mu$ 라고 알려져 있습니다. 

 

 

모평균과 모분산이 얼마인지는 모르는 상태입니다. 중심극한 정리를 이용하면 모집단 표본평균의 분포를 정규분포로 가정할 수 있습니다. 아래와 같습니다. 

 

$\bar{X} \sim N\left ( E\left [ X \right ] ,\frac{\sigma^{2}_{A}}{50} \right )$

 

$\bar{X}$ 은 표본평균의 확률변수입니다. $\bar{X}_{1}$ 은 실제로 뽑은 표본의 평균입니다. 둘을 구분할 수 있어야 합니다. 

 

이제 귀무가설과 대립가설을 세웁시다. 아래와 같습니다. 

 

귀무가설 : 모평균이 $ \mu$이다.

대립가설 : 모평균이$ \mu$가 아니다. 

 

귀무가설이 참이라고 가정하겠습니다. 귀무가설이 참이라면 확률변수 $\bar{X}$ 의 확률분포는 아래와 같습니다.

 

$\bar{X} \sim N\left ( \mu ,\frac{\sigma^{2}}{50} \right )$

 

위 정규분포를 표준화하면 아래와 같습니다. 

 

$Z=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}$

 

Z는 표준정규분포를 따르는 통계량입니다. 이제 우리가 뽑은 표본을 가지고 Z값을 구해야 합니다. $\bar{X}$ 에는 우리가 뽑은 표본의 평균인 $\bar{X}_{1}$ 을 대입하면 됩니다. 이때 한가지 문제가 있습니다. 모분산인 $\sigma$를 모른다는 것입니다. 어쩔 수 없이 모분산 대신 표본 분산을 사용합니다. 

 

$Z=\frac{\bar{X}_{1}-\mu}{\frac{s_{1}}{\sqrt{n}}}$

 

표준정규분포에서 이 Z값 보다 극단적인 영역의 넓이를 구하면 p값이 됩니다. p값을 0.05와 비교하여 Z검정을 마무리합니다. 

 

2. Z검정의 한계

Z검정의 한계는 모분산을 사용하도록 유도된 분포에서, 표본분산을 사용해버린다는데 있습니다. 물론 표본의 크기가 아주 커지면 표본분산과 모분산이 비슷해집니다. 「손으로 푸는 통계」에서 시뮬레이션해본 결과 표본의 크기가 수천은 되어야 납득할 만한 오차가 됩니다. 

 

이런 문제를 해결하기 위해 t분포가 유도됩니다. t검정은 Z검정이 가진 한계를 해결하기 위해 등장한 것입니다. 

반응형

댓글