본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계 ver1.0] 41. 표본분산의 분포 유도 (6) 2자유도 카이제곱분포를 특성함수나 적률생섬함수로 유도할 수 없는 이유

by bigpicture 2020. 5. 6.
반응형

우리는 자유도가 n인 카이제곱분포를 유도하고 있는데요. 제가 생각한 과정은 자유도가 1인 카이제곱분포를 유도하고, 자유도가 1인 카이제곱분포의 적률생성함수 또는 특성함수를 이용하여 자유도가 2인 카이제곱분포를 유도하는 것이었습니다. 그리고 이 과정에서 찾은 관계를 이용하여 자유도 n으로 확장하려고 했는데요.

이 방법으로는 안되더라구요. 지금은 다른 방법을 찾았고 시도하는 중입니다. 이 경우에 왜 적률생성함수나 특성함수로는 불가능한지 공유하는 것 자체가 의미가 있을 것 같아서 공유드리려고 합니다. 

먼저 자유도가 1인 카이제곱분포의 적률생성함수를 유도해보겠습니다. 특성함수 유도가 훨씬 복잡해서 적률생성함수로 설명하겠습니다. 

자유도가 1인 카이제곱분포를 따르는 확률변수를 Y라고 놓겠습니다.

Y의 적률생성함수는 아래와 같이 정의됩니다. 


자유도가 1인 카이제곱분포의 분포함수는 아래와 같습니다. 


적률생성함수 식에 대입합시다. 확률변수 Y는 표준정규분포를 따르는 확률변수의 제곱이므로, 항상 양수입니다. 적분 범위를 0부터로 바꿔줍니다. 


아래와 같이 계산합시다. 


y로 묶어줍시다. 


아래와 같이 치환합시다. 


양변에 2를 곱합시다.


아래와 같이 변형합시다. 


적분구간을 생각해봅시다. y가 0부터 무한대까진데요. (1-2t)가 양수일 때는 k도 0~무한대 구간을 갖고, 반대로 (1-2t)가 음수일 때는 k가 0~마이너스무한대 구간을 갖습니다. t=1/2일 때는 정의되지 않습니다. 뒤에서 처리하도록 하겠습니다. 

양변을 y로 미분합시다. 


아래와 같이 변형합시다. 


치환한 식을 대입합시다. 

 

아래와 같이 계산해줍시다. 


아래와 같이 변형합시다. 


1) $1-2t>0$ 인경우, 즉 $t<\frac{1}{2}$ 인 경우

 

적분 범위가 아래와 같이 설정됩니다. 


적분항은 자유도가 1인 카이제곱분포함수를 전체 구간에 대해 적분한 것입니다. 따라서 1입니다. 


2) $1-2t<0$ 인경우, 즉 $t>\frac{1}{2}$ 인 경우


아래 수식에서 출발합시다. 


빨간 부분이 음수이므로, y앞의 계수는 양수가 됩니다. 따라서  e가 포함된 항은 항상 1보다 큰 양수입니다. 아래와 같은 부등식이 성립합니다. 


파란 항을 적분해봅시다. 


파란항은 무한대가 됩니다. 


따라서 1-2t<0일때는 적률생성함수가 무한대로 발산하게 되므로 정의되지 않기 때문에 t<1/2 여야 합니다. 

1자유도 카이제곱분포의 적률생성함수에는 아래와 같은 t의 범위 조건이 붙습니다.


전에 적률생성함수가 어떤 경우 모든 실수 범위에서 정의되지 않기 때문에, 적률생성함수가 아닌 특성함수를 주로 이용한다고 어디선가 본 적이 있습니다. 어떤 경우일까 궁금했는데, 이 경우도 그 중 하나라는 생각이 듭니다. 

이제 우리가 유도한 적률생성함수로 자유도가 2인 카이제곱분포를 유도해봅시다. Y와 W를 정규분포를 따르는 변수의 제곱이라고 합시다. Y와 Z는 서로 독립이라고 가정합시다. Y+Z 는 자유도가 2인 카이제곱분포를 따릅니다. 적률생성함수를 적용해봅시다. 


아래와 같이 변형하겠습니다.


서로 독립이므로 아래와 같이 변형이 가능합니다.


따라서 각각의 적률생성함수의 곱이 됩니다.


우리가 유도한 적률생성함수를 정의하겠습니다.


자유도가 2인 카이제곱분포의 적률생성함수는 아래와 같습니다.


이제 우변을 이용하여 자유도가 2인 카이제곱분포의 분포함수를 알아내야 하는데요. 먼저 자유도가 1인 경우의 적률생성함수와 분포함수를 비교해봅시다.

 

 

$-\frac{1}{2}$ 이라는 공통된 값이 들어있습니다. 이 규칙을 자유도가 2인 카이제곱분포에 적용해봅시다.

 

-1/2 자리를 -1로 바꾸면 될것 같은 느낌이 들지만, 확신이 없습니다. 하나는 상수이고 하나만 변하는 값인지 알 길이 없습니다. 실제로 하나는 상수이고, 하나만 바뀌는 값입니다. 둘 중 하나만 -1/2을 -1로 바꾸어야 합니다. 특성함수로 바꿔도 달라지지 않습니다. t를 it로 바꾸는 것 뿐입니다. 

우리는 정규분포를 따르는 두 확률변수의 차도 유도했었는데요. 정규분포의 특성함수는 아래와 같습니다. 


평균은 t의 계수이고, 분산은 t^2의 계수에 -1/2을 곱한 값이라는 규칙을 알 수 있습니다. 따라서 적률생성함수를 계산하면, 반대로 분포함수를 알 수 있었습니다. 

자유도가 1인 카이제곱분포에는 적용되지 않았습니다. 다른 방법을 찾아야 했고, 현재 시도중에 있습니다.

반응형

댓글