개념
이변량 확률변수의 변수변환이 무엇인지 먼저 간단히 알아봅시다. 두 확률변수의 X1과 X2의 결합확률분포 를 알고 있다고 합시다. 이때 다른 다른 확률변수 Y1과 Y2는 아래과 같이 정의된다고 합시다.
Y1=f1(X1,X2)
Y2=f2(X1,X2)
이때 X1과 X2의 결합확률분포를 이용하여 Y1와 Y2의 결합확률분포를 구하는 것이 확률변수 변환입니다.
어떻게 사용되나?
우리가 확률분포를 구하고 싶은 확률변수인 Y1이 아래와 같이 정의된다고 합시다.
Y1=g(X1,X2)
이변량 분포의 변환을 이용하면 Y의 확률분포함수를 구할 수 있습니다. 약간의 편법(?)을 써야 하는데요. X1과 X2 의 분포를 Y1와 Y2 으로 변환한 뒤에, Y1의 주변확률분포를 구하는 방식으로 Y1의 분포함수를 알아냅니다.
이산확률분포의 변수변환
두 확률변수 X1과 X2의 결합확률질량함수는 아래와 같습니다. 우리는 이 분포를 알고 있는 상황입니다.
pX1,X2(x1,x2)
Y1과 Y2는 아래와 같이 정의된다고 합시다.
Y1=f1(X1,X2)
Y2=f2(X1,X2)
두 함수가 일대일함수라고 가정하면 아래와 같은 역관계가 존재합니다.
X1=g1(Y1,Y2)
X2=g2(Y1,Y2)
여기까지는 주어진 조건이었습니다. 이제 본격적으로 Y1의 분포를 구해봅시다.
Y1과 Y2의 결합확률질량함수를 pY1,Y2(y1,y2) 로 놓으면, 아래와 같이 정의됩니다.
pY1,Y2(y1,y2)=P[Y1=y1,Y2=y2]
아래와 같이 변형할 수 있습니다.
pY1,Y2(y1,y2)=P[f1(X1,X2)=y1,f2(X1,X2)=y2]
f와 g는 일대일함수 이므로 아래와 같이 변형할 수 있습니다. 위 식과 아래식 우변의 확률이 같다는 것을 이해하시면 됩니다.
pY1,Y2(y1,y2)=P[X1=g1(y1,y2),X2=g2(y1,y2)]
위 식의 우변은 아래와 같이 변형됩니다.
pY1,Y2(y1,y2)=pX1,X2(g1(y1,y2),g2(y1,y2))
Y1의 주변확률분포는 아래와 같이 구하면 됩니다. Y1의 집합을 S라고 놓았습니다.
pY1(y1)=∑Y1∈SpX1,X2(g1(y1,y2),g2(y1,y2))
주어진 조건들을 이용해서 우변을 구할 수 있습니다.
연속확률분포의 변수변환
두 확률변수 X1과 X2의 결합확률밀도함수는 아래와 같습니다. 우리는 이 분포를 알고 있는 상황입니다.
fX1,X2(x1,x2)
Y1과 Y2는 아래와 같이 정의된다고 합시다.
Y1=f1(X1,X2)
Y2=f2(X1,X2)
두 함수가 일대일함수라고 가정하면 아래와 같은 역관계가 존재합니다.
X1=g1(Y1,Y2)
X2=g2(Y1,Y2)
여기까지는 주어진 조건이었습니다. 이제 본격적으로 Y1의 분포를 구해봅시다. 과정에서 누적분포함수를 사용할 것인데, 적분구간 처리를 간편하게 하기 위해 변환 T를 도입하겠습니다. 변환 T를 아래와같이 정의합시다.
T(X1,X2)=(f1(X1,X2),f2(X1,X2))
T는 아래 기능을 합니다.
(Y1,Y2)=T(X1,X2)
(X1,X2)의 지지집합(support)를 S라고 놓고, 이에 대응되는 (Y1,Y2)의 지지집합을 W라고 놓겠습니다. 지지집합은 정의역 중에서 0에 대응되지 않는 부분집합을 말합니다. 어려우면 그냥 정의역이라고 이해해도 지금 단계에서는 문제 되지 않습니다. 따라서 아래 등식이 성립합니다.
W=T(S)
S의 부분집합 A가 W의 부분집합 B에 대응된다고 합시다. 아래 등식이 성립합니다.
B=T(A)
A가 발생할 확률은 아래와같습니다.
P[(X1,X2)∈A]=∬
적분변수를 y_{1}과 y_{2}로 변환합시다. 이때 자코비안이 사용됩니다. 유도과정은 생략합니다.
P[(X_{1},X_{2})\in A]=\iint \limits_{B} f_{X_{1},X_{2}}(g_{1}(y_{1},y_{2}),g_{2}(y_{1},y_{2}))\left | J \right |dy_{1}dy_{2}
자코비안은 아래와 같습니다.
\begin{vmatrix} \frac{\partial g_{1}}{\partial y_{1}} & \frac{\partial g_{1}}{\partial y_{2}} \\ \frac{\partial g_{2}}{\partial y_{1}} & \frac{\partial g_{2}}{\partial y_{2}} \end{vmatrix}
그런데 P[(X_{1},X_{2})\in A]는 P[(Y_{1},Y_{2})\in B]와 같습니다. 일대일함수라서 그렇습니다. P[(Y_{1},Y_{2})\in B]는 아래와 같습니다.
P[(Y_{1},Y_{2})\in B]=\iint \limits_{B} f_{Y_{1},Y_{2}}(y_{1},y_{2})dy_{1}dy_{2}
따라서 아래 등식이 성립합니다.
\iint \limits_{B} f_{X_{1},X_{2}}(g_{1}(y_{1},y_{2}),g_{2}(y_{1},y_{2}))\left | J \right |dy_{1}dy_{2}=\iint \limits_{B} f_{Y_{1},Y_{2}}(y_{1},y_{2})dy_{1}dy_{2}
위 등식이 임의의 B에 대해 성립하므로 아래 등식도 성립합니다.
f_{X_{1},X_{2}}(g_{1}(y_{1},y_{2}),g_{2}(y_{1},y_{2}))\left | J \right |=f_{Y_{1},Y_{2}}(y_{1},y_{2})
위 식 좌우를 바꿔씁시다.
f_{Y_{1},Y_{2}}(y_{1},y_{2})=f_{X_{1},X_{2}}(g_{1}(y_{1},y_{2}),g_{2}(y_{1},y_{2}))\left | J \right |
적분을 이용하여 Y_{1}의 주변확률분포를 구해줍니다.
f_{Y_{1}}(y_{1})=\int_{-\infty}^{\infty}f_{X_{1},X_{2}}(g_{1}(y_{1},y_{2}),g_{2}(y_{1},y_{2}))\left | J \right |dy_{2}
'@ 통계학 석박사 진학관련 > 수리통계학 요약' 카테고리의 다른 글
[수리통계학] #41. 주변확률분포 (0) | 2023.02.13 |
---|---|
[수리통계학] #40. 이변량 확률분포 (결합확률분포) (0) | 2023.02.13 |
[수리통계학] #39. 특성함수가 항상 존재함을 증명 (0) | 2022.07.06 |
[수리통계학] #38. 특성함수가 같으면 같은 분포일까? (유일성) (0) | 2022.07.06 |
[수리통계학] #37. 특성함수 (0) | 2022.07.06 |
[수리통계학] #36. 적률생성함수가 존재하지 않는 경우 (3) | 2022.07.06 |
[수리통계학] #35. 적률생성함수가 같은면 같은 분포일까 (유일성) (0) | 2022.07.06 |
[수리통계학] #34. 적률생성함수란 무엇인가 (0) | 2022.07.04 |
댓글
bigpicture님의
글이 좋았다면 응원을 보내주세요!
이 글이 도움이 됐다면, 응원 댓글을 써보세요. 블로거에게 지급되는 응원금은 새로운 창작의 큰 힘이 됩니다.
응원 댓글은 만 14세 이상 카카오계정 이용자라면 누구나 편하게 작성, 결제할 수 있습니다.
글 본문, 댓글 목록 등을 통해 응원한 팬과 응원 댓글, 응원금을 강조해 보여줍니다.
응원금은 앱에서는 인앱결제, 웹에서는 카카오페이 및 신용카드로 결제할 수 있습니다.