본문 바로가기
@ 통계 교양/통계 Tips

z분포 vs t분포

by bigpicture 2022. 5. 9.
반응형

표본의 크기에 따른 z분포와 t분포의 차이입니다. 



 

n이 3일 때는 t분포가 z분포보다 두터운 꼬리를 갖고 있습니다. n이 커질 수록 t 분포가 z분포에 가까워져 갑니다. 꼬리가 두텁다는 말은 같은 통계량에서 p값이 더 크다는 말입니다.  p값이 커서 기각을 덜하게 되므로 보수적이라 할 수 있습니다. 

 

n이 커지면서 t분포는 z분포에 가까워져 갑니다. 

 

얼마나 더 보수적인지 수치로 알아봅시다.

 

표본크기 z값 (p값) t값 (p값)
3 1.644854 (0.05) 1.644854 (0.099)
10 1.644854 (0.05) 1.644854 (0.065)
30 1.644854 (0.05) 1.644854 (0.055)
50 1.644854 (0.05) 1.644854 (0.053)

 

표본 크기가 30 정도여도 차이가 크지 않습니다. 

 

z값와 t값을 어떻게 같다고 놓을 수 있느냐고 물으실 것입니다. 

 

t검정에서 t통계량은 아래와 같습니다. 

 

$t=\frac{\overline{X}-\mu}{\frac{s}{\sqrt{n}}}$

 

$\overline{X}$는 표본평균, $\mu$는 모평균, s는 표본표준편차, n은 표본의 크기입니다.

 

z검정에서 z통계량은 아래와 같습니다. 

 

$z=\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}$

 

$\sigma$ 는 모표준편차인데요. 현실에서 모표준편차를 알 수 있는 경우는 없습니다. n이 충분히 큰 경우에 표본표준편차를 대신 사용합니다. 통계량은 아래와 같이 바뀝니다. 

 

$z=\frac{\overline{X}-\mu}{\frac{s}{\sqrt{n}}}$

 

t 통계량과 같아졌습니다. 값이 같다는 것이지 같은 분포를 따른다는 의미는 아닙니다. 

반응형

댓글