본문 바로가기
@선택과목1/손으로 푸는 t검정

[손으로 푸는 t검정] 4. t분포 유도 (2) 유도

by bigpicture 2023. 3. 29.
반응형

우리는 지난시간에 확률변수 T를 유도했습니다. T는 아래와 같습니다. 

$T=Z\frac{1}{\sqrt{V}}\sqrt{n}$

위 식에서 Z는 표준정규분포를 따르는 확률변수이고 V는 n자유도 카이제곱분포를 따르는 확률변수입니다. 이어서 우리는 Z와 V의 결합확률분포를 유도했습니다. 아래와 같습니다. 

$f_{Z,V}(z,v)=\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}z^2}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }v^{\frac{n}{2}-1}e^{-\frac{v}{2}}$

오늘은 위 분포를 이용해서 t분포를 유도할겁니다. 확률변수의 변수변환이라는 테크닉을 사용할 건데요. 먼저 유도 아이디어를 간단히 설명하겠습니다. 크게 두 단계로 구분됩니다. 

1) $f_{Z,V}(z,v)$를 변수변환하여 $f_{T,U}(t,u)$ 를 유도
2) $f_{T,U}(t,u)$ 를 u에 대해 적분하여 $f_{T}(t)$를 유도함

이 과정에서 아래와 같은 통계지식들이 사용됩니다. 수리통계학 책에 나오는 지식들입니다. 

- 확률변수의 변수변환
- 전미분공식
- 자코비안
- 주변확률분포

각각을 자세히 설명하면 강의가 너무 길어지기 때문에 수학적 사전지식을 자세히 다루지는 않겠습니다. 1단계부터 공부해봅시다. 

 

1) $f_{Z,V}(z,v)$를 변수변환하여 $f_{T,U}(t,u)$ 를 유도

우리는 (z,v) 를 (t,u)로 변환할 것입니다. 이변량분포의 변수변환을 적용하면 아래와 같습니다. 

$f_{T,U}(t,u)=f_{Z,V}(z,v)\left | J \right |$

(이변량분포의 변수변환 원리가 궁금한 분들은 링크를 참고하세요. )

위 식에서 J는 자코비안인데요. 자코비안은 자코비안 행렬의 행렬식을 말합니다. 자코비안 유도과정만 간단히 다루겠습니다. 

위 식의 변수들 사이의 관계식은 아래와 같습니다. 

$t=z\frac{1}{\sqrt{v}}\sqrt{n}$

$u=v$

u라는 변수는 의도적으로 설정한 변수입니다. 위 식을 아래와 같이 함수 기호를 사용하여 나타낼 수 있습니다. 

$t=g_{1}(z,v)$

$u=g_{2}(z,v)$

$g_{1}$과 $g_{2}$함수 둘 다 일대일함수입니다. 증명은 생략하겠습니다. 일대일함수이므로 아래와 같은 역관계도 존재합니다. 

$z=h_{1}(t,u)$

$v=h_{2}(t,u)$

위 함수를 수식으로 나타내면 아래와 같습니다. 

$z=\frac{\sqrt{u}}{\sqrt{n}}t$

$v=u$

다시 아래 두 식으로 돌아갑시다. 

$z=h_{1}(t,u)$

$v=h_{2}(t,u)$

위 식에 전미분공식을 적용합시다. (전미분공식 유도가 궁금한 분들은 링크를 참고하세요. )

$dz=\frac{\partial h_{1}}{\partial t}dt+\frac{\partial h_{1}}{\partial u}du$

$dv=\frac{\partial h_{2}}{\partial t}dt+\frac{\partial h_{2}}{\partial u}du$

위 두식을 행렬형태로 바꾸면 아래와 같습니다. 

$\begin{bmatrix}
dz\\ 
dv
\end{bmatrix}
\begin{bmatrix}
\frac{\partial h_{1}}{dt} & \frac{\partial h_{1}}{du} \\ 
\frac{\partial h_{2}}{dt} & \frac{\partial h_{2}}{du}
\end{bmatrix}
\begin{bmatrix}
dt\\ 
du
\end{bmatrix}$

우변에 있는 행렬이 자코비안 행렬입니다. 자코비안은 자코비안의 행렬식이고 아래와 같습니다. 

$J=\frac{\partial h_{1}}{\partial t} \frac{\partial h_{2}}{\partial u}-\frac{\partial h_{1}}{\partial u} \frac{\partial h_{2}}{\partial t}$

우리는 함수 $h_{1}$과 $h_{2}$를 알고 있습니다. 아래와 같습니다.

$h_{1}(t,u)=\frac{\sqrt{u}}{\sqrt{n}}t$

$h_{2}(t,u)=u$

편미분을 계산해서 J를 구하면 아래와 같습니다 .

$J=\frac{\sqrt{u}}{\sqrt{n}}\cdot 1-\left ( \frac{1}{2}\frac{1}{\sqrt{n}}\frac{1}{\sqrt{n}} \right )\cdot 0$

$J=\frac{\sqrt{u}}{\sqrt{n}}\cdot 1-\left ( \frac{1}{2}\frac{1}{\sqrt{n}}\frac{1}{\sqrt{n}} \right )\cdot 0=\frac{\sqrt{u}}{\sqrt{n}}$

위에서 변수변환했던 식을 다시 써봅시다. 

$f_{T,U}(t,u)=f_{Z,V}(z,v)\left | J \right |$

J는 $\frac{\sqrt{u}}{\sqrt{n}}$ 이고, z는$ \frac{\sqrt{u}}{\sqrt{n}}t$ 이고, v는 u 이므로 위 식은 아래와 같이 변형됩니다. 

$f_{T,U}(t,u)=f_{Z,V}(\frac{\sqrt{u}}{\sqrt{n}}t,u)\ \frac{\sqrt{u}}{\sqrt{n}}$

$f_{Z,V}(z,v)$는 아래와 같습니다. 

$f_{Z,V}(z,v)=\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}z^2}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }v^{\frac{n}{2}-1}e^{-\frac{v}{2}}$

유도하던 식에 대입합니다. 

$f_{T,U}(t,u)=\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{\sqrt{u}}{\sqrt{n}}t \right )^2}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }u^{\frac{n}{2}-1}e^{-\frac{u}{2}} \frac{\sqrt{u}}{\sqrt{n}}$

아래와 같이 정리합니다. 

$f_{T,U}(t,u)=\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }u^{\frac{n}{2}+1}e^{-\frac{u}{2}\left ( \frac{t^2}{n}+1 \right )}$

2) $f_{T,U}(t,u)$ 를 u에 대해 적분하여 $f_{T}(t)$를 유도함

u를 전체 구간에 대해 적분하면 t의 분포가 계산됩니다. 수리통계학 내용 중 주변확률분포에 해당됩니다. u는 v와 같은데, v는 카이제곱분포를 따르므로 적분 구간은 0부터 무한대입니다. 위 식을 u로 적분합시다. 

$f_{t}(t)=\int_{0}^{\infty}\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }u^{\frac{n}{2}+1}e^{-\frac{u}{2}\left ( \frac{t^2}{n}+1 \right )}du$

적분과 무관한 항을 밖으로 꺼내줍니다. 

$f_{t}(t)=\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }\int_{0}^{\infty}u^{\frac{n}{2}+1}e^{-\frac{u}{2}\left ( \frac{t^2}{n}+1 \right )}du$

위 적분을 계산할 때 감마분포라는 것을 사용할 것입니다. 감마분포가 무엇인지 잘 몰라도 충분히 이해할 수 있습니다. 어떤 확률분포함수를 전체 구간에 대해 적분하면 1이 나온다는 사실만 알면 됩니다. 

위 식의 적분 안을 아래와 같이 변형합니다. u의 지수부분을 변형했습니다. 

$f_{t}(t)=\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }\int_{0}^{\infty}u^{\frac{n+1}{2}-1}e^{-\frac{u}{2}\left ( \frac{t^2}{n}+1 \right )}du$

적분 안의 수식에 아래 치환을 적용합니다. 

$\alpha=\frac{n+1}{2}$

$\lambda =\frac{1}{2} \left ( \frac{t^2}{n}+1 \right )$

유도하던 식을 치환하면 아래와 같습니다. 

$f_{t}(t)=\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }\int_{0}^{\infty}u^{\alpha-1}e^{-u\lambda}du$

감마분포의 확률밀도함수는 아래와 같습니다. 

$\frac{\lambda^{\alpha}}{\Gamma(\alpha)}x^{\alpha-1}e^{-x\lambda}$

적분 안의 수식을 감마분포로 만들기 위해 $\frac{\lambda^{\alpha}}{\Gamma(\alpha)}$ 를 곱하고 나눠줍니다. 

$f_{t}(t)=\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }\int_{0}^{\infty}\frac{\lambda^{\alpha}}{\Gamma(\alpha)}u^{\alpha-1}e^{-u\lambda}du \frac{\Gamma(\alpha)}{\lambda^{\alpha}}$

감마분포의 적분은 1이므로 아래와 같이 계산됩니다. 

$f_{t}(t)=\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} } \frac{\Gamma(\alpha)}{\lambda^{\alpha}}$

치환했던 $\alpha$와 $\lambda$를 원래 값으로 되돌립니다. 

$f_{t}(t)=\frac{1}{\sqrt{2\pi n}}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} } \frac{\Gamma( \frac{n+1}{2} )}{\left ( \frac{1}{2}\left ( \frac{t^2}{n}+1 \right ) \right )^{\frac{n+1}{2}}}$

아래와 같이 변형합니다. 

$f_{t}(t)=\frac{\Gamma( \frac{n+1}{2} )}{\Gamma(\frac{n}{2})}\frac{1}{\sqrt{2\pi n}}\frac{1}{ 2^{\frac{n}{2}} } \frac{ 2^{\frac{n+1}{2}} }{\left ( \frac{t^2}{n}+1 \right ) ^{\frac{n+1}{2}}}$

소거할 수 있는 항을 소거합니다. 

$f_{t}(t)=\frac{\Gamma( \frac{n+1}{2} )}{\Gamma(\frac{n}{2})}\frac{1}{\sqrt{\pi n}} \left ( 1+\frac{t^2}{n} \right ) ^{-\frac{n+1}{2}}$

t분포를 유도했습니다. 

 

 

 

#참고문헌

1. 수리통계학 (호그)
2. https://math.stackexchange.com/questions/474733/derivation-of-the-density-function-of-student-t-distribution-from-this-big-integ

반응형

댓글