모집단이 정규분포를 따른다면 표본평균은 항상 정규분포를 따르는지 알아봅시다. 결과부터 말씀드리면 'yes' 입니다.
1. 모집단의 확률변수
정규분포를 따르는 모집단의 원소를 확률변수 X라고 놓겠습니다. 이해되시는 분들은 2번으로 넘어가시면 됩니다. 모집단의 원소를 확률변수로 놓는 것에 익숙하지 않은 분들을 위해 간단한 예시로 설명하겠습니다.
아래와 같은 숫자 카드 5장으로 모집단을 만들어봅시다.
1,2,3,3,3
모집단의 원소를 변수 X로 놓을 수 있습니다. X는 1,2,3 이 될 수 있습니다. 이때 각 값에는 확률이 부여되어 있습니다. 각 확률은 아래와 같습니다.
P[X=1]=1/5
P[X=2]=2/5
P[X=3]=3/5
따라서 모집단의 원소를 확률변수 X로 놓을 수 있습니다.
2. 정규분포를 따르는 모집단의 표본평균의 분포
어떤 모집단이 있다고 합시다. 이 모집단은 평균이 $\mu$이고 분산이 $\sigma^2$ 인 정규분포를 따른다고 합시다. 이 모집단의 원소를 확률변수 X라고 놓겠습니다. 확률변수 X는 평균이 $\mu$이고 분산이 $\sigma^2$ 인 정규분포를 따릅니다. 모집단이 정규분포를 따르는 것과, 모집단의 확률변수 X가 정규분포를 따르는 것은 같은 의미입니다. 기호로 나타내면 아래와 같습니다.
$X \sim N\left ( \mu,\sigma^2 \right )$
이 모집단에서 뽑힐 크기가 n인 표본의 원소를 아래와 같이 놓을 수 있습니다.
${X_{1},X_{2},...,X_{n}}$
표본을 뽑아서 이미 결정된 값이 아니라 '뽑힐'이라는 것을 기억하세요. 이 원소들이 변수임을 설명하기 위해 강조하는 것입니다. 모집단에서 뽑힐 표본의 각 원소들은 확률변수입니다. 복원추출을 가정한다면, 각 원소들의 확률변수는 모집단의 확률변수 X와 같은 분포를 따릅니다. 따라서 각 원소들도 평균이 $\mu$이고 분산이 $\sigma^2$ 인 정규분포를 따릅니다.
표본의 원소들은 모두 정규분포를 따른다는 것을 알았습니다. 그렇다면 표본평균도 정규분포를 따를까요?
먼저 표본의 각 원소들의 합의 분포를 구해봅시다. 아래 공식을 이용할 것입니다. 정규분포를 따르는 확률변수들의 합의 분포입니다. (증명은 글 하단의 링크를 참고하세요.)
$\sum_{i=1}^{n}X_{i} \sim N\left ( \sum_{i=1}^{n}\mu_{X_{i}},\sum_{i=1}^{n}\sigma_{X_{i}}^2 \right )$
따라서 표본의 원소들의 합의 분포는 아래와 같습니다.
$X_{1}+X_{2}+\cdots+X_{n} \sim N\left ( n\mu, n\sigma^2 \right ) $
이제 $X_{1}+X_{2}+\cdots+X_{n}$ 를 n으로 나눈 분포를 구하면 됩니다. 아래 공식을 이용할 것입니다. (증명은 글 하단의 링크를 참고하세요.)
$aX \sim \left ( a\mu,\left| a \right| \sigma^{2}\right ) $
정규분포를 따르는 확률변수에 실수배 a를 한 분포입니다. 표본평균은 표본의 합 $X_{1}+X_{2}+\cdots+X_{n}$에 실수배 1/n 을 한 것입니다. 따라서 위 공식을 이용하면 표본평균의 분포를 구할 수 있습니다.
$\frac{X_{1}+X_{2}+\cdots+X_{n}}{n} \sim N\left ( \mu, \frac{\sigma^2}{n} \right ) $
모집단이 정규분포를 따른다면 표본평균도 정규분포를 따릅니다!
참고링크
1. 정규분포를 따르는 확률변수의 합의 분포
https://hsm-edu.tistory.com/1626
2. 정규분포를 따르는 확률변수의 실수배의 분포
https://hsm-edu.tistory.com/1428
'@ 통계 교양 > 통계 Tips' 카테고리의 다른 글
다중회귀분석에서 왜 수정된 결정계수를 사용하는가? (0) | 2023.10.24 |
---|---|
표본 크기가 커지면 정규성을 따르지 않는 문제 (0) | 2023.09.19 |
머신러닝과 데이터마이닝의 차이 (0) | 2023.08.01 |
최빈값은 언제 쓸까? (mode) (0) | 2023.06.28 |
정규분포를 따르는 확률변수의 합의 분포 (0) | 2023.01.14 |
평균이 좋은 대푯값이 아닌 경우 (0) | 2023.01.12 |
표본의 크기 결정 방법 수식 설명 및 유도 (0) | 2023.01.11 |
민감도, 특이도, 양성예측도, 음성예측도 외우는 법 (0) | 2022.12.27 |
댓글