연속확률변수 $X$와 $Y$가 있습니다. 확률변수 $X$의 분포함수는 알고 있는 상황입니다. 또한 $Y=g(X)$ 라는 함수도 알고 있고 $X$와 $Y$는 일대일 대응이라고 가정합시다. 이때 $Y$의 분포함수를 구하는 방법입니다.
알고 있는 것 : $X$의 분포함수 $f_{X}(x)$, $Y=g(X)$
조건 : $X$와 $Y$는 일대일 대응
구해야 하는 것 : $Y$의 분포함수 $f_{Y}(y)$
$X$와 $Y$가 일대일 대응이므로 $g(X)$ 는 증가함수이거나 감소함수입니다. 두 경우로 나눠서 $f_{Y}(y)$ 구하는 방법을 알아봅시다.
1. $g(X)$ 가 증가함수인 경우
연속확률변수이므로 특정 값에서의 확률을 정의할 수는 없습니다. 따라서 누적분포함수를 이용하여 접근하겠습니다. 아래 등식에서 출발합니다.
$F_{Y}(y)=P[Y \leq y]$
$F_{Y}(y)$ 는 확률변수 Y의 누적분포함수입니다. Y=g(X) 이므로 아래와 같이 변형됩니다.
$F_{Y}(y)=P[g(X) \leq y]$
$g(X) \leq y$ 는 $X \leq g^{-1}(y)$ 로 변형할 수 있습니다. 증가함수에서 그래프의 영역을 표시해보면 두 범위가 같다는 것을 쉽게 알 수 있습니다. 따라서 아래와 같이 변형됩니다.
$F_{Y}(y)=P[X \leq g^{-1}(y)]$
우변의 확률은 X의 누적분포함수에 $g^{-1}(y)$를 넣은 것과 같습니다.
$F_{Y}(y)=F_{X}(g^{-1}(y))$
누적분포함수를 미분하면 확률밀도함수가 됩니다. 양 변을 y로 미분합시다.
$f_{Y}(y)=\frac{dF_{X}(g^{-1}(y))}{dy}$
$g^{-1}(y)=x$ 이므로 x로 잠깐 돌려놓습니다.
$f_{Y}(y)=\frac{dF_{X}(x)}{dy}$
아래와 같이 chain-rule 을 적용합니다.
$f_{Y}(y)=\frac{dF_{X}(x)}{dx}\frac{dx}{dy}$
우변의 첫 인수를 미분하면 $f_{X}(x)$ 입니다.
$f_{Y}(y)=f_{X}(x)\frac{dx}{dy}$
x를 다시 $g^{-1}(y)$ 로 돌려놓습니다.
$f_{Y}(y)=f_{X}(g^{-1}(y))\frac{dx}{dy}$
y의 확률밀도함수가 유도되었습니다.
2. $g(X)$ 가 감소함수인 경우
아래 등식에서 출발합니다.
$F_{Y}(y)=P[Y \leq y]$
$F_{Y}(y)$ 는 확률변수 Y의 누적분포함수입니다. Y=g(X) 이므로 아래와 같이 변형됩니다.
$F_{Y}(y)=P[g(X) \leq y]$
$g(X) \leq y$ 는 $X \geq g^{-1}(y)$ 로 변형할 수 있습니다. 감소함수에서 그래프의 영역을 표시해보면 같다는 두 범위가 같다는 것을 쉽게 알 수 있습니다.
$F_{Y}(y)=P[X \geq g^{-1}(y)]$
확률의 합은 1이므로, 아래와 같이 변형할 수 있습니다.
$F_{Y}(y)=1-P[X \leq g^{-1}(y)]$
우변의 두번째 항은 X의 누적분포함수에 $g^{-1}(y)$를 넣은 것과 같습니다.
$F_{Y}(y)=1-F_{X}(g^{-1}(y))$
양 변을 y로 미분합니다. 과정은 1번과 동일하므로 생략합니다.
$f_{Y}(y)=-f_{X}(g^{-1}(y))\frac{dx}{dy}$
3. 일반화
g(X)가 증가함수인 경우 $f_{Y}(y)$는 아래와 같습니다.
$f_{Y}(y)=f_{X}(g^{-1}(y))\frac{dx}{dy}$
g(X)가 감소함수인 경우 $f_{Y}(y)$는 아래와 같습니다.
$f_{Y}(y)=-f_{X}(g^{-1}(y))\frac{dx}{dy}$
증가함수인 경우 $\frac{dx}{dy}$ 는 양수이고, 감소함수인 경우 $\frac{dx}{dy}$ 는 음수입니다. 따라서 아래와 같이 절댓값 기호를 이용하여 식 하나로 표현할 수 있습니다.
$f_{Y}(y)=f_{X}(g^{-1}(y))\left | \frac{dx}{dy} \right |$
$ \left | \frac{dx}{dy} \right | $는 변환의 자코비안입니다. 미적분학이나 선형대수에도 나옵니다.
'@ 통계학 석박사 진학관련 > 수리통계학 요약' 카테고리의 다른 글
[수리통계학] #37. 특성함수 (0) | 2022.07.06 |
---|---|
[수리통계학] #36. 적률생성함수가 존재하지 않는 경우 (3) | 2022.07.06 |
[수리통계학] #35. 적률생성함수가 같은면 같은 분포일까 (유일성) (0) | 2022.07.06 |
[수리통계학] #34. 적률생성함수란 무엇인가 (0) | 2022.07.04 |
[수리통계학] #32. 이산확률변수의 변수변환 (일대일 대응) (0) | 2022.06.30 |
[수리통계학] #31. 분위수(Quantile)와 사분위수(Quartile) (0) | 2021.06.14 |
[수리통계학] #30. 역누적분포함수 (0) | 2021.06.11 |
[수리통계학] #29. 누적분포함수 예시 (0) | 2021.03.15 |
댓글