우리는 지난시간에 확률변수 T를 유도했습니다. T는 아래와 같습니다.
$T=Z\frac{1}{\sqrt{V}}\sqrt{n}$
위 식에서 Z는 표준정규분포를 따르는 확률변수이고 V는 n자유도 카이제곱분포를 따르는 확률변수입니다. 이어서 우리는 Z와 V의 결합확률분포를 유도했습니다. 아래와 같습니다.
$f_{Z,V}(z,v)=\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}z^2}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }v^{\frac{n}{2}-1}e^{-\frac{v}{2}}$
오늘은 위 분포를 이용해서 t분포를 유도할겁니다. 확률변수의 변수변환이라는 테크닉을 사용할 건데요. 먼저 유도 아이디어를 간단히 설명하겠습니다. 크게 두 단계로 구분됩니다.
1) $f_{Z,V}(z,v)$를 변수변환하여 $f_{T,U}(t,u)$ 를 유도
2) $f_{T,U}(t,u)$ 를 u에 대해 적분하여 $f_{T}(t)$를 유도함
이 과정에서 아래와 같은 통계지식들이 사용됩니다. 수리통계학 책에 나오는 지식들입니다.
- 확률변수의 변수변환
- 전미분공식
- 자코비안
- 주변확률분포
각각을 자세히 설명하면 강의가 너무 길어지기 때문에 수학적 사전지식을 자세히 다루지는 않겠습니다. 1단계부터 공부해봅시다.
1) $f_{Z,V}(z,v)$를 변수변환하여 $f_{T,U}(t,u)$ 를 유도
우리는 (z,v) 를 (t,u)로 변환할 것입니다. 이변량분포의 변수변환을 적용하면 아래와 같습니다.
$f_{T,U}(t,u)=f_{Z,V}(z,v)\left | J \right |$
(이변량분포의 변수변환 원리가 궁금한 분들은 링크를 참고하세요. )
위 식에서 J는 자코비안인데요. 자코비안은 자코비안 행렬의 행렬식을 말합니다. 자코비안 유도과정만 간단히 다루겠습니다.
위 식의 변수들 사이의 관계식은 아래와 같습니다.
$t=z\frac{1}{\sqrt{v}}\sqrt{n}$
$u=v$
u라는 변수는 의도적으로 설정한 변수입니다. 위 식을 아래와 같이 함수 기호를 사용하여 나타낼 수 있습니다.
$t=g_{1}(z,v)$
$u=g_{2}(z,v)$
$g_{1}$과 $g_{2}$함수 둘 다 일대일함수입니다. 증명은 생략하겠습니다. 일대일함수이므로 아래와 같은 역관계도 존재합니다.
$z=h_{1}(t,u)$
$v=h_{2}(t,u)$
위 함수를 수식으로 나타내면 아래와 같습니다.
$z=\frac{\sqrt{u}}{\sqrt{n}}t$
$v=u$
다시 아래 두 식으로 돌아갑시다.
$z=h_{1}(t,u)$
$v=h_{2}(t,u)$
위 식에 전미분공식을 적용합시다. (전미분공식 유도가 궁금한 분들은 링크를 참고하세요. )
$dz=\frac{\partial h_{1}}{\partial t}dt+\frac{\partial h_{1}}{\partial u}du$
$dv=\frac{\partial h_{2}}{\partial t}dt+\frac{\partial h_{2}}{\partial u}du$
위 두식을 행렬형태로 바꾸면 아래와 같습니다.
$\begin{bmatrix}
dz\\
dv
\end{bmatrix}
\begin{bmatrix}
\frac{\partial h_{1}}{dt} & \frac{\partial h_{1}}{du} \\
\frac{\partial h_{2}}{dt} & \frac{\partial h_{2}}{du}
\end{bmatrix}
\begin{bmatrix}
dt\\
du
\end{bmatrix}$
우변에 있는 행렬이 자코비안 행렬입니다. 자코비안은 자코비안의 행렬식이고 아래와 같습니다.
$J=\frac{\partial h_{1}}{\partial t} \frac{\partial h_{2}}{\partial u}-\frac{\partial h_{1}}{\partial u} \frac{\partial h_{2}}{\partial t}$
우리는 함수 $h_{1}$과 $h_{2}$를 알고 있습니다. 아래와 같습니다.
$h_{1}(t,u)=\frac{\sqrt{u}}{\sqrt{n}}t$
$h_{2}(t,u)=u$
편미분을 계산해서 J를 구하면 아래와 같습니다 .
$J=\frac{\sqrt{u}}{\sqrt{n}}\cdot 1-\left ( \frac{1}{2}\frac{1}{\sqrt{n}}\frac{1}{\sqrt{n}} \right )\cdot 0$
$J=\frac{\sqrt{u}}{\sqrt{n}}\cdot 1-\left ( \frac{1}{2}\frac{1}{\sqrt{n}}\frac{1}{\sqrt{n}} \right )\cdot 0=\frac{\sqrt{u}}{\sqrt{n}}$
위에서 변수변환했던 식을 다시 써봅시다.
$f_{T,U}(t,u)=f_{Z,V}(z,v)\left | J \right |$
J는 $\frac{\sqrt{u}}{\sqrt{n}}$ 이고, z는$ \frac{\sqrt{u}}{\sqrt{n}}t$ 이고, v는 u 이므로 위 식은 아래와 같이 변형됩니다.
$f_{T,U}(t,u)=f_{Z,V}(\frac{\sqrt{u}}{\sqrt{n}}t,u)\ \frac{\sqrt{u}}{\sqrt{n}}$
$f_{Z,V}(z,v)$는 아래와 같습니다.
$f_{Z,V}(z,v)=\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}z^2}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }v^{\frac{n}{2}-1}e^{-\frac{v}{2}}$
유도하던 식에 대입합니다.
$f_{T,U}(t,u)=\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{\sqrt{u}}{\sqrt{n}}t \right )^2}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }u^{\frac{n}{2}-1}e^{-\frac{u}{2}} \frac{\sqrt{u}}{\sqrt{n}}$
아래와 같이 정리합니다.
$f_{T,U}(t,u)=\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }u^{\frac{n}{2}+1}e^{-\frac{u}{2}\left ( \frac{t^2}{n}+1 \right )}$
2) $f_{T,U}(t,u)$ 를 u에 대해 적분하여 $f_{T}(t)$를 유도함
u를 전체 구간에 대해 적분하면 t의 분포가 계산됩니다. 수리통계학 내용 중 주변확률분포에 해당됩니다. u는 v와 같은데, v는 카이제곱분포를 따르므로 적분 구간은 0부터 무한대입니다. 위 식을 u로 적분합시다.
$f_{t}(t)=\int_{0}^{\infty}\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }u^{\frac{n}{2}+1}e^{-\frac{u}{2}\left ( \frac{t^2}{n}+1 \right )}du$
적분과 무관한 항을 밖으로 꺼내줍니다.
$f_{t}(t)=\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }\int_{0}^{\infty}u^{\frac{n}{2}+1}e^{-\frac{u}{2}\left ( \frac{t^2}{n}+1 \right )}du$
위 적분을 계산할 때 감마분포라는 것을 사용할 것입니다. 감마분포가 무엇인지 잘 몰라도 충분히 이해할 수 있습니다. 어떤 확률분포함수를 전체 구간에 대해 적분하면 1이 나온다는 사실만 알면 됩니다.
위 식의 적분 안을 아래와 같이 변형합니다. u의 지수부분을 변형했습니다.
$f_{t}(t)=\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }\int_{0}^{\infty}u^{\frac{n+1}{2}-1}e^{-\frac{u}{2}\left ( \frac{t^2}{n}+1 \right )}du$
적분 안의 수식에 아래 치환을 적용합니다.
$\alpha=\frac{n+1}{2}$
$\lambda =\frac{1}{2} \left ( \frac{t^2}{n}+1 \right )$
유도하던 식을 치환하면 아래와 같습니다.
$f_{t}(t)=\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }\int_{0}^{\infty}u^{\alpha-1}e^{-u\lambda}du$
감마분포의 확률밀도함수는 아래와 같습니다.
$\frac{\lambda^{\alpha}}{\Gamma(\alpha)}x^{\alpha-1}e^{-x\lambda}$
적분 안의 수식을 감마분포로 만들기 위해 $\frac{\lambda^{\alpha}}{\Gamma(\alpha)}$ 를 곱하고 나눠줍니다.
$f_{t}(t)=\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }\int_{0}^{\infty}\frac{\lambda^{\alpha}}{\Gamma(\alpha)}u^{\alpha-1}e^{-u\lambda}du \frac{\Gamma(\alpha)}{\lambda^{\alpha}}$
감마분포의 적분은 1이므로 아래와 같이 계산됩니다.
$f_{t}(t)=\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} } \frac{\Gamma(\alpha)}{\lambda^{\alpha}}$
치환했던 $\alpha$와 $\lambda$를 원래 값으로 되돌립니다.
$f_{t}(t)=\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} } \frac{\Gamma( \frac{n+1}{2} )}{\left ( \frac{1}{2}\left ( \frac{t^2}{n}+1 \right ) \right )^{\frac{n+1}{2}}}$
아래와 같이 변형합니다.
$f_{t}(t)=\frac{\Gamma( \frac{n+1}{2} )}{\Gamma(\frac{n}{2})}\frac{1}{\sqrt{2\pi n}}\frac{1}{ 2^{\frac{n}{2}} } \frac{ 2^{\frac{n+1}{2}} }{\left ( \frac{t^2}{n}+1 \right ) ^{\frac{n+1}{2}}}$
소거할 수 있는 항을 소거합니다.
$f_{t}(t)=\frac{\Gamma( \frac{n+1}{2} )}{\Gamma(\frac{n}{2})}\frac{1}{\sqrt{\pi n}} \left ( 1+\frac{t^2}{n} \right ) ^{-\frac{n+1}{2}}$
t분포를 유도했습니다.
#참고문헌
1. 수리통계학 (호그)
2. https://math.stackexchange.com/questions/474733/derivation-of-the-density-function-of-student-t-distribution-from-this-big-integ
'@선택과목1 > 손으로 푸는 t검정' 카테고리의 다른 글
[손으로 푸는 t검정] 5. t분포 유도과정 요약 (0) | 2023.04.07 |
---|---|
[손으로 푸는 t검정] 4. t분포 유도 (1) t통계량 변형 (6) | 2023.02.16 |
[손으로 푸는 t검정] 3. t분포의 아이디어 (1) | 2022.12.24 |
[손으로 푸는 t검정] 2. Z검정과 그 한계 (0) | 2022.12.24 |
[손으로 푸는 t검정] 1. 강의 소개 (0) | 2022.07.31 |
댓글