"표본을 하나밖에 안 뽑았는데 어떻게 분포를 가정하나요??"
라는 질문을 정말 많이 받습니다. 오늘은 이 질문에 대해 최대한 쉽게 이해되도록 설명드려보겠습니다. 먼저 이 질문이 나온 맥락을 알아봅시다.
여기 모집단이 하나 있습니다. 모집단의 평균은 $\mu$, 표준편차는 $\sigma$ 라고 놓겠습니다. 모집단에서 크기가 n인 표본을 추출했습니다. 이 표본의 평균을 $\bar{X}_{1}$, 표준편차를 $\sigma_{1}$이라고 놓겠습니다. n이 충분히 크다고 가정하면, 중심극한정리에 의해 방금 우리가 뽑은 이 표본의 평균은 아래 분포를 따릅니다.
$\bar{X} \sim N \left (\mu,\frac{\sigma^2}{n} \right)$
이 상황에서 나온 질문입니다. 아래와 같은 의문이 드는 분들이 계실겁니다.
"아니 표본을 겨우 하나 뽑았는데 어떻게 분포를 구해요?? 표본을 엄청 많이 뽑아서 그려야 분포가 되는거 아니에요??"
이 의문을 해결하기 위해 다시 모집단에서 표본을 뽑는 상황으로 돌아가봅시다.
여기 모집단이 하나 있습니다. 모집단의 평균은 $\mu$, 표준편차는 $\sigma$ 라고 놓겠습니다. 모집단에서 크기가 n인 표본을 추출하려는 마음을 먹었습니다. 중심극한정리를 사용할 수 있을 만큼 표본의 크기는 충분히 크게 뽑을 예정입니다. 아직 표본을 추출하지는 않았습니다. 표본을 추출하지 않았는데도, 아래 분포를 가정할 수 있습니다.
$\bar{X} \sim N \left ( \mu, \frac{ \sigma^2}{n} \right)$
우리가 앞으로 뽑을 크기가 n인 표본평균은 위 분포를 따릅니다. 실제로 표본을 뽑아보지 않아도 분포를 가정할 수 있습니다. 크기가 n인 표본평균들이 따르는 분포가 위와 같다는 것이 수학적으로 이미 유도되었기 때문입니다. 그것이 중심극한정리입니다. 우리가 모집단에서 크기가 n 인 표본을 무수히 많이 뽑아서 평균을 구하고, 평균들로 분포함수를 그린다면 위와 같을 것입니다.
이제 표본을 하나 뽑아봅시다. 이 표본의 평균을 구했더니 $\bar{X}_{1}$이었습니다. 이때 $\bar{X}_{1}$ 은 위 분포상의 하나의 X값입니다.
중심극한정리가 무엇인지 몰라 이해가 안되시는 분들은 아래 영상을 먼저 봐주시면 됩니다 .
'@ 통계 교양 > 통계 Tips' 카테고리의 다른 글
인사채용의 1종오류와 2종오류 (4) | 2021.06.23 |
---|---|
통계적 유의차가 있으면 의미 있는 차이인 걸까 (0) | 2021.06.22 |
기하분포의 두가지 정의와 각각의 분포함수, 평균, 분산 (2) | 2021.06.06 |
분산분석에서 요인(factor)과 수준(level)의 의미 (0) | 2021.06.01 |
비율검정 요약 (0) | 2021.05.14 |
산점도 그래프 회전의 수학적 원리 (0) | 2021.04.28 |
공분산이란 무엇인가 (정의와 의미) (2) | 2021.04.27 |
통계분석 공부순서(t검정,F검정,분산분석,상관분석,회귀분석) (0) | 2021.04.26 |
댓글