Processing math: 100%
본문 바로가기
@ 통계학 석박사 진학관련/수리통계학 요약

[수리통계학] #33. 연속확률변수의 변수변환 (일대일 대응)

by bigpicture 2022. 6. 30.
반응형

연속확률변수 XY가 있습니다. 확률변수 X의 분포함수는 알고 있는 상황입니다. 또한 Y=g(X) 라는 함수도 알고 있고 XY는 일대일 대응이라고 가정합시다. 이때 Y의 분포함수를 구하는 방법입니다. 

알고 있는 것 : X의 분포함수 fX(x), Y=g(X)
조건 : XY는 일대일 대응
구해야 하는 것 : Y의 분포함수 fY(y)

XY가 일대일 대응이므로 g(X) 는 증가함수이거나 감소함수입니다. 두 경우로 나눠서 fY(y) 구하는 방법을 알아봅시다. 

 

1. g(X) 가 증가함수인 경우

연속확률변수이므로 특정 값에서의 확률을 정의할 수는 없습니다. 따라서 누적분포함수를 이용하여 접근하겠습니다. 아래 등식에서 출발합니다. 

FY(y)=P[Yy]

FY(y) 는 확률변수 Y의 누적분포함수입니다. Y=g(X) 이므로 아래와 같이 변형됩니다. 

FY(y)=P[g(X)y]

g(X)yXg1(y) 로 변형할 수 있습니다. 증가함수에서 그래프의 영역을 표시해보면 두 범위가 같다는 것을 쉽게 알 수 있습니다. 따라서 아래와 같이 변형됩니다. 

FY(y)=P[Xg1(y)]

우변의 확률은 X의 누적분포함수에 g1(y)를 넣은 것과 같습니다.

FY(y)=FX(g1(y))

누적분포함수를 미분하면 확률밀도함수가 됩니다. 양 변을 y로 미분합시다. 

 

fY(y)=dFX(g1(y))dy

 

g1(y)=x 이므로 x로 잠깐 돌려놓습니다. 

 

fY(y)=dFX(x)dy

 

아래와 같이 chain-rule 을 적용합니다. 

 

fY(y)=dFX(x)dxdxdy

 

우변의 첫 인수를 미분하면 fX(x) 입니다. 

 

fY(y)=fX(x)dxdy

 

x를 다시 g1(y) 로 돌려놓습니다. 

 

fY(y)=fX(g1(y))dxdy

 

y의 확률밀도함수가 유도되었습니다. 

 

2. g(X) 가 감소함수인 경우

아래 등식에서 출발합니다. 

FY(y)=P[Yy]

 

FY(y) 는 확률변수 Y의 누적분포함수입니다. Y=g(X) 이므로 아래와 같이 변형됩니다. 

FY(y)=P[g(X)y]

g(X)yXg1(y) 로 변형할 수 있습니다. 감소함수에서 그래프의 영역을 표시해보면 같다는 두 범위가 같다는 것을 쉽게 알 수 있습니다. 

 

FY(y)=P[Xg1(y)]

 

확률의 합은 1이므로, 아래와 같이 변형할 수 있습니다. 

 

FY(y)=1P[Xg1(y)]

 

우변의 두번째 항은 X의 누적분포함수에 g1(y)를 넣은 것과 같습니다.

 

FY(y)=1FX(g1(y))

 

양 변을 y로 미분합니다. 과정은 1번과 동일하므로 생략합니다.

 

fY(y)=fX(g1(y))dxdy

 

3. 일반화

g(X)가 증가함수인 경우 fY(y)는 아래와 같습니다. 

 

fY(y)=fX(g1(y))dxdy

 

g(X)가 감소함수인 경우 fY(y)는 아래와 같습니다. 

 

fY(y)=fX(g1(y))dxdy

 

증가함수인 경우 dxdy 는 양수이고, 감소함수인 경우 dxdy  는 음수입니다. 따라서 아래와 같이 절댓값 기호를 이용하여 식 하나로 표현할 수 있습니다. 

 

fY(y)=fX(g1(y))|dxdy|

 

|dxdy|는 변환의 자코비안입니다. 미적분학이나 선형대수에도 나옵니다. 

반응형

댓글

bigpicture님의
글이 좋았다면 응원을 보내주세요!