본문 바로가기
@통계분석 특강/분포

카이제곱분포 글 하나로 끝내버리기

by bigpicture 2023. 1. 14.
반응형

1. 어디에 사용되나?

1) 카이제곱분포는 t분포 유도에 사용됩니다. t분포 유도에는 확률변수 $\frac{ns^2}{\sigma^2}$ 가 사용되는데, 이 확률변수가 n자유도 카이제곱분포를 따르기 때문입니다. $s^2$은 표본분산, $\sigma^2$은 모분산입니다. 

 

2) 카이제곱검정에 사용됩니다. 

 

2. 어떻게 생겼나요? 

카이제곱분포도 t분포처럼 '자유도'에 따라 모양이 결정됩니다.  t분포에서 자유도는 표본크기에서 1을 뺀 값이었는데요. 카이제곱분포 자유도의 의미는 뒤에서 설명하겠습니다. k자유도 카이제곱분포 함수는 아래와 같습니다. 

 

$f(x)=\frac{1}{2^{\frac{k}{2}}\Gamma\left ( \frac{k}{2} \right ) }x^{\frac{k}{2}-1}e^{-\frac{x}{2}}$

 

자유도에 따라 아래와 같은 형태를 갖습니다. 

 

3. 어떤 의미를 갖나요? 

카이제곱분포를 이해하려면 카이제곱분포에서 자유도가 갖는 의미를 알아야 합니다. 카이제곱분포에서 자유도가 갖는 의미를 이해하기 위해 카이제곱분포가 어떻게 유도된 것인지 알아봅시다. 1자유도 카이제곱분포부터 시작해봅시다. 1자유도 카이제곱분포는 표준정규분포를 따르는 확률변수의 제곱의 분포입니다. 표준정규분포를 따르는 확률변수 Z가 있다고 합시다. Z의 분포는 아래와 같습니다. 

 

$Z \sim N\left ( 0,1 \right )$

 

1자유도 카이제곱분포는 Z를 제곱한 확률변수의 분포입니다. 아래와 같이 나타냅니다.

 

$Z^2 \sim \chi _{1}^2$

 

$Z^2$을 확률변수 X로 두고 분포함수를 유도하면 아래와 같습니다. 1자유도 카이제곱분포의 분포함수입니다. 

 

$f(x)=\frac{1}{2^{\frac{1}{2}}\Gamma\left ( \frac{1}{2} \right ) }x^{-\frac{1}{2}}e^{-\frac{x}{2}}$

 

그래프 형태는 아래와 같습니다. 

 

 

카이제곱분포가 위와 같은 모양을 갖는 이유를 직관적으로도 이해해볼 수 있습니다. 표준정규분포의 그래프는 0을 중심으로 좌우 대칭인 그래프입니다. Z가 0일 때의 확률 밀도값이 가장 크고, 0에서 멀어질 수록 작아집니다. Z를 제곱하게 되면 x가 음수인 경우도 양수가 됩니다. 0에 가까운 값은 제곱해서 0에 더 가까워집니다. 따라서 Z의 제곱인 X의 분포는 양수인 값만 갖고, 0에서 값이 가장 크며(무한으로 발산), 0에서 멀어질 수록 작아지는 분포가 되는 것입니다. 

 

 자유도를 높여봅시다. 2자유도 카이제곱분포는 표준정규분포를 따르는 확률변수의 제곱의 분포 두개를 더한 것입니다. 표준정규분포를 따르는 확률변수 두개를 $Z_{1}$과 $Z_{2}$ 라고 한다면, 2자유도 카이제곱분포를 따르는 확률변수 X는 아래와 같습니다. 

 

$X=Z_{1}^2+Z_{2}^2$ 

 

함수 수식은 처음에 보여드린 카이제곱분포 함수의 k자리에 2를 넣으면 됩니다. 그래프의 모양을 상상해봅시다. 0에 가까울 수록 확률 밀도가 높기 때문에 0에 가까운 값이 더 많이 발생하긴 하겠지만, 0에 가까운 값 두개가 더해지므로 하나인 경우보다 0에서 약간 멀어지게 됩니다. 1자유도 보다는 0에서의 확률밀도 값이 낮아질 것입니다. 1,2 자유도의 그래프를 비교해보면 아래와 같습니다. 

 

 

확률밀도값이 낮아집니다. 카이제곱분포의 자유도가 높아지면 더 많은 $Z^2$이 더해진다는 말입니다. 최고점이 점점 오른쪽으로 이동할 것이고, 예상대로 아래와 같이 그려집니다. 

 

 

n자유도 카이제곱분포는 표준정규분포의 제곱을 n개 더한 분포입니다. 각 표준정규분포들은 독립입니다. 

 

4. 어떤 성질이 있나요? 

1) k 자유도 카이제곱분포의 평균은 k이고 분산은 2k 입니다. 

 

2) 표본분산의 분포가 카이제곱분포를 따릅니다. 더 정확히 말하면  $\frac{ns^2}{\sigma^2}$  가 n자유도 카이제곱분포를 따릅니다. 

반응형

'@통계분석 특강 > 분포' 카테고리의 다른 글

t분포 글 하나로 끝내버리기  (0) 2023.01.14

댓글