모집단에서 표본을 뽑을 때 표본의 크기 n이 충분히 크다면, 모집단의 분포와 상관 없이 표본분산의 분포는 카이제곱분포를 따른다는 것을 증명하고 있습니다.
아래와 같이 두 단계로 나눠서 증명하고 있습니다.
Step 1. $\frac{s^{2}}{\sigma^2}$ 의 분포 유도
Step 2. 정규분포를 카이제곱분포로 근사
지난시간에 Step1 내용을 유도했고 결과는 아래와 같습니다.
$\frac{s^{2}}{\sigma^2} \sim N\left ( 1,\frac{\kappa-1}{n} \right )$
오늘은 정규분포를 카이제곱분포로 근사시킨 뒤, 위 식을 변형할 것입니다. 자유도가 k인 카이제곱분포를 따르는 확률변수는 아래와 같이 놓을 수 있습니다.
$\chi ^{2}_{k}=\sum_{i=1}^{k}Z^{2}_{i}$
양 변을 k로 나눠줍시다.
$\frac{\chi ^{2}_{k}}{k}=\frac{\sum_{i=1}^{k}Z^{2}_{i}}{k}$
k로 나눠준 확률변수를 Y라고 놓겠습니다.
$\frac{\chi ^{2}_{k}}{k}=\frac{\sum_{i=1}^{k}Z^{2}_{i}}{k}=Y$
$Y$는 확률변수가 $Z^{2}$인 모집단에서 크기가 k인 표본을 뽑아 평균을 낸 값이므로, 표본평균입니다. k가 무한대로 갈 경우 중심극한정리에 의해 아래 성질이 성립합니다.
$Y\sim N\left (E\left [ Y \right ],V\left [ Y \right ] \right )$
$E\left [ Y \right ]$는 아래와 같이 계산됩니다.
$E\left [ Y \right ]=E\left [ \frac{\chi^{2}_{k}}{k} \right ]=\frac{E\left [ \chi^{2}_{k} \right ]}{k}=\frac{k}{k}=1$
$V\left [ Y \right ]$는 아래와 같이 계산됩니다.
$V\left [ Y \right ]=V\left [ \frac{\chi^{2}_{k}}{k} \right ]=\frac{V\left [ \chi^{2}_{k} \right ]}{k^2}=\frac{2k}{k^2}=\frac{2}{k}$
따라서 $Y$는 아래 분포를 따릅니다.
$Y \sim N\left ( 1,\frac{2}{k} \right )$
$Y$를 치환하기 전으로 돌려놓읍시다 .
$\frac{\chi ^2_{k}}{k} \sim N\left ( 1,\frac{2}{k} \right )$
지난시간에 유도한 식을 아래 써봅시다.
$\frac{s^{2}}{\sigma^2} \sim N\left ( 1,\frac{\kappa-1}{n} \right )$
아래와 같이 변형합시다.
$\frac{s^{2}}{\sigma^2} \sim N\left ( 1,\frac{1}{\frac{n}{\kappa-1}} \right )$
$\frac{1}{\frac{2n}{\kappa-1}}$ 를 DF로 치환합시다.
$\frac{s^{2}}{\sigma^2} \sim N\left ( 1,\frac{2}{DF} \right )$
오늘 유도한 식도 아래와 같이 변형합시다.
$\frac{\chi ^2_{DF}}{DF} \sim N\left ( 1,\frac{2}{DF} \right )$
따라서 아래 등식이 성립합니다.
$\frac{s^2}{\sigma^2}=\frac{\chi ^2_{DF}}{DF}$
아래와 같이 변형합시다.
$DF\frac{s^2}{\sigma^2}=\chi ^2_{DF} \ \left ( DF=\frac{2n}{\kappa-1} \right )$
DF 자유도의 카이제곱분포를 $\chi ^2_{DF}$ 라고 한다면 아래와 같이 표현할 수도 있습니다.
$DF\frac{s^2}{\sigma^2} \sim \chi ^2_{DF} \ \left ( DF=\frac{2n}{\kappa-1} \right )$
유도는 끝났습니다. 모집단의 정규분포 가정을 하지 않고도, 표본평균의 분포가 카이제곱분포를 따른다는 것이 유도 됩니다. 하지만 자유도가 우리가 생각했던 것과 다릅니다. 다음 시간에 위 수식의 의미에 대해서 더 이야기해봅시다.
'@ 필수과목 > 손으로 푸는 통계' 카테고리의 다른 글
[손으로 푸는 통계 ver1.0] 97. 표본분산을 모분산 대신 사용할 수 있는가 (2) 정규분포를 따르는 모집단에서 p값 비교 (0) | 2022.07.21 |
---|---|
[손으로 푸는 통계 ver1.0] 96. 표본분산을 모분산 대신 사용할 수 있는가 (1) 정규분포를 따르는 모집단에서 모분산과 표본분산 비교 (0) | 2022.07.21 |
[손으로 푸는 통계 ver1.0] 95. 표본분산의 분포 요약 (0) | 2022.07.20 |
[손으로 푸는 통계 ver1.0] 94. 표본분산의 분포에서 모집단 정규분포 조건제거 증명 (3) 유도한 식 검증 (0) | 2022.07.18 |
[손으로 푸는 통계 ver1.0] 92. 표본분산의 분포에서 모집단 정규분포 조건제거 증명 (1) $\frac{s^{2}}{\sigma^2}$ 의 분포 유도 (0) | 2022.07.16 |
[손으로 푸는 통계 ver1.0] 91. 표본분산의 분포 시뮬레이션 (4) p값 비교 (0) | 2022.06.13 |
[손으로 푸는 통계 ver1.0] 90. 표본분산의 분포 시뮬레이션 (3) 누적분포함수 비교 (0) | 2022.06.08 |
[손으로 푸는 통계 ver1.0] 89. 표본분산의 분포 시뮬레이션 (2) 뭔가 이상하다 (2) | 2022.06.06 |
댓글