본문 바로가기
@ 통계학 석박사 진학관련/수리통계학 요약

[수리통계학] #42. 이변량 분포 변환 (transformation)

by bigpicture 2023. 2. 14.
반응형

개념

이변량 확률변수의 변수변환이 무엇인지 먼저 간단히 알아봅시다. 두 확률변수의 $X_{1}$과 $X_{2}$의 결합확률분포 를 알고 있다고 합시다. 이때 다른 다른 확률변수 $Y_{1}$과 $Y_{2}$는 아래과 같이 정의된다고 합시다.

 

$Y_{1}=f_{1}(X_{1},X_{2})$

$Y_{2}=f_{2}(X_{1},X_{2})$

 

이때 $X_{1}$과 $X_{2}$의 결합확률분포를 이용하여 $Y_{1}$와 $Y_{2}$의 결합확률분포를 구하는 것이 확률변수 변환입니다. 

 

어떻게 사용되나?

우리가 확률분포를 구하고 싶은 확률변수인 $Y_{1}$이 아래와 같이 정의된다고 합시다.

$Y_{1}=g(X_{1},X_{2})$

이변량 분포의 변환을 이용하면 Y의 확률분포함수를 구할 수 있습니다. 약간의 편법(?)을 써야 하는데요. $X_{1}$과 $X_{2}$ 의 분포를 $Y_{1}$와 $Y_{2}$ 으로 변환한 뒤에, $Y_{1}$의 주변확률분포를 구하는 방식으로 $Y_{1}$의 분포함수를 알아냅니다. 

 

이산확률분포의 변수변환

두 확률변수 $X_{1}$과 $X_{2}$의 결합확률질량함수는 아래와 같습니다. 우리는 이 분포를 알고 있는 상황입니다.  

$p_{X_{1},X_{2}}(x_{1},x_{2})$

$Y_{1}$과 $Y_{2}$는 아래와 같이 정의된다고 합시다. 

$Y_{1}=f_{1}(X_{1},X_{2})$

$Y_{2}=f_{2}(X_{1},X_{2})$

두 함수가 일대일함수라고 가정하면 아래와 같은 역관계가 존재합니다.

$X_{1}=g_{1}(Y_{1},Y_{2})$

$X_{2}=g_{2}(Y_{1},Y_{2})$

여기까지는 주어진 조건이었습니다. 이제 본격적으로 $Y_{1}$의 분포를 구해봅시다. 

$Y_{1}$과 $Y_{2}$의 결합확률질량함수를 $p_{Y_{1},Y_{2}}(y_{1},y_{2})$ 로 놓으면, 아래와 같이 정의됩니다. 

$p_{Y_{1},Y_{2}}(y_{1},y_{2})=P[Y_{1}=y_{1},Y_{2}=y_{2}]$

아래와 같이 변형할 수 있습니다. 

$p_{Y_{1},Y_{2}}(y_{1},y_{2})=P[f_{1}(X_{1},X_{2})=y_{1},f_{2}(X_{1},X_{2})=y_{2}]$

$f$와 $g$는 일대일함수 이므로 아래와 같이 변형할 수 있습니다.  위 식과 아래식 우변의 확률이 같다는 것을 이해하시면 됩니다. 

$p_{Y_{1},Y_{2}}(y_{1},y_{2})=P[X_{1}=g_{1}(y_{1},y_{2}),X_{2}=g_{2}(y_{1},y_{2})]$

위 식의 우변은 아래와 같이 변형됩니다. 

 

$p_{Y_{1},Y_{2}}(y_{1},y_{2})=p_{X_{1},X_{2}}(g_{1}(y_{1},y_{2}),g_{2}(y_{1},y_{2}))$

 

$Y_{1}$의 주변확률분포는 아래와 같이 구하면 됩니다. $Y_{1}$의 집합을 S라고 놓았습니다. 

 

$p_{Y_{1}}(y_{1})=\sum \limits_{Y_{1}\in S} p_{X_{1},X_{2}}(g_{1}(y_{1},y_{2}),g_{2}(y_{1},y_{2}))$

 

주어진 조건들을 이용해서 우변을 구할 수 있습니다. 

 

연속확률분포의 변수변환

두 확률변수 $X_{1}$과 $X_{2}$의 결합확률밀도함수는 아래와 같습니다. 우리는 이 분포를 알고 있는 상황입니다.  

$f_{X_{1},X_{2}}(x_{1},x_{2})$

$Y_{1}$과 $Y_{2}$는 아래와 같이 정의된다고 합시다. 

$Y_{1}=f_{1}(X_{1},X_{2})$

$Y_{2}=f_{2}(X_{1},X_{2})$

두 함수가 일대일함수라고 가정하면 아래와 같은 역관계가 존재합니다.

$X_{1}=g_{1}(Y_{1},Y_{2})$

$X_{2}=g_{2}(Y_{1},Y_{2})$

여기까지는 주어진 조건이었습니다. 이제 본격적으로 $Y_{1}$의 분포를 구해봅시다. 과정에서 누적분포함수를 사용할 것인데, 적분구간 처리를 간편하게 하기 위해 변환 T를 도입하겠습니다. 변환 T를 아래와같이 정의합시다. 

$T(X_{1},X_{2})=(f_{1}(X_{1},X_{2}),f_{2}(X_{1},X_{2}))$

 

T는 아래 기능을 합니다. 

 

$(Y_{1},Y_{2})=T(X_{1},X_{2})$

$(X_{1},X_{2})$의 지지집합(support)를 S라고 놓고, 이에 대응되는 $(Y_{1},Y_{2})$의 지지집합을 W라고 놓겠습니다. 지지집합은 정의역 중에서 0에 대응되지 않는 부분집합을 말합니다. 어려우면 그냥 정의역이라고 이해해도 지금 단계에서는 문제 되지 않습니다. 따라서 아래 등식이 성립합니다. 

$W=T(S)$

S의 부분집합 A가 W의 부분집합 B에 대응된다고 합시다. 아래 등식이 성립합니다. 

$B=T(A)$

A가 발생할 확률은 아래와같습니다. 

$P[(X_{1},X_{2})\in A]=\iint \limits_{A} f_{X_{1},X_{2}}(x_{1},x_{2})dx_{1}dx_{2}$

적분변수를 $y_{1}$과 $y_{2}$로 변환합시다. 이때 자코비안이 사용됩니다. 유도과정은 생략합니다. 

$P[(X_{1},X_{2})\in A]=\iint \limits_{B} f_{X_{1},X_{2}}(g_{1}(y_{1},y_{2}),g_{2}(y_{1},y_{2}))\left | J \right |dy_{1}dy_{2}$

 

자코비안은 아래와 같습니다. 

 

$\begin{vmatrix}
\frac{\partial g_{1}}{\partial y_{1}} & \frac{\partial g_{1}}{\partial y_{2}} \\ 
\frac{\partial g_{2}}{\partial y_{1}} & \frac{\partial g_{2}}{\partial y_{2}} 
\end{vmatrix}$


그런데 $P[(X_{1},X_{2})\in A]$는 $P[(Y_{1},Y_{2})\in B]$와 같습니다. 일대일함수라서 그렇습니다. $P[(Y_{1},Y_{2})\in B]$는 아래와 같습니다. 

$P[(Y_{1},Y_{2})\in B]=\iint \limits_{B} f_{Y_{1},Y_{2}}(y_{1},y_{2})dy_{1}dy_{2}$

따라서 아래 등식이 성립합니다. 

 

$\iint \limits_{B} f_{X_{1},X_{2}}(g_{1}(y_{1},y_{2}),g_{2}(y_{1},y_{2}))\left | J \right |dy_{1}dy_{2}=\iint \limits_{B} f_{Y_{1},Y_{2}}(y_{1},y_{2})dy_{1}dy_{2}$

 

위 등식이 임의의 B에 대해 성립하므로 아래 등식도 성립합니다. 

 

$f_{X_{1},X_{2}}(g_{1}(y_{1},y_{2}),g_{2}(y_{1},y_{2}))\left | J \right |=f_{Y_{1},Y_{2}}(y_{1},y_{2})$

 

위 식 좌우를 바꿔씁시다. 

 

$f_{Y_{1},Y_{2}}(y_{1},y_{2})=f_{X_{1},X_{2}}(g_{1}(y_{1},y_{2}),g_{2}(y_{1},y_{2}))\left | J \right |$

 

적분을 이용하여 $Y_{1}$의 주변확률분포를 구해줍니다. 

 

$f_{Y_{1}}(y_{1})=\int_{-\infty}^{\infty}f_{X_{1},X_{2}}(g_{1}(y_{1},y_{2}),g_{2}(y_{1},y_{2}))\left | J \right |dy_{2}$

반응형

댓글