본문 바로가기
@ 통계 교양/통계 Tips

p값의 분포는 왜 균등분포일까 (distribution of p-value)

by bigpicture 2021. 10. 21.
반응형

우측꼬리 t검정을 예로 들어봅시다. 우리가 뽑은 표본의 통계량을 t라고 놓는다면 아래와 같은 그림을 그릴 수 있습니다. F(t)는 누적분포함수입니다. 

아래 등식이 만족합니다. 

 

$p=1-F(T=t)$

 

시행에 따라 T값이 바뀌고, T값이 바뀌면 p값도 바뀝니다. 따라서 p도 확률변수라고 할 수 있습니다. F(T)의 분포를 구하면 p의 분포를 구할 수 있습니다. F(T)가 이미 누적분포함수인데, 분포함수의 분포함수를 구한다고? 네 맞습니다. 

 

이 분포함수 F(T)를 새로운 확률변수 Y 라고 놓겠습니다. Y의 누적분포함수를 G라고 놓겠습니다. G는 아래와 같이 정의됩니다. Pr은 확률을 의미합니다. 

 

$G(y)=Pr(Y\leq y)$

 

Y=F(T) 이므로 아래와 같이 변형합시다. 

 

$G(y)=Pr(F(T)\leq y)$

 

F(T) 는 연속함수이고 우상향하는 일대일대응 함수입니다. 따라서 아래와 같이 변형됩니다. 

 

$G(y)=Pr\left [ F^{-1}(F(T))\leq F^{-1}(y) \right ]$

 

F의 역함수를 씌운 것입니다. F(X)의 역함수는 X이므로 아래와 같이 변형됩니다. 

 

$G(y)=Pr\left [ T\leq F^{-1}(y) \right ]$

 

맨 오른쪽 항을 이해하기 위해 그래프를 하나 그려봅시다. 

$T$가 $F^{-1}(y)$보다 작을 확률은 얼마일까요. 네 y입니다. 누적분포함수의 정의가 그렇기 때문입니다. 따라서 아래 등식이 유도됩니다. 

 

$G(y)=y$

 

$G(y)$ 는 F(T)가 따르는 누적분포함수였는데, 항등함수입니다. 누적분포함수가 항등함수인 분포는 '균등분포'입니다. 따라서 F(T)는 균등분포를 따릅니다. F(T)의 범위는 #0 \leq F(T) \leq 1$ 입니다. $p=1-F(T=t)$ 이므로 p도 균등분포를 따릅니다. 두가지 의문이 드는 분들이 계실겁니다. 

 

1. 누적분포가 항등함수인 분포가 왜 균등분포지?

2. F(T)가 균등분포를 따르는데 왜 1-F(T)도 균등분포를 따르지?

 

1번은 G(y)=y를 미분해보면 압니다. 누적분포함수를 미분하면 확률밀도함수입니다. y를 미분하면 1이고, 확률밀도함수가 1인 분포는 균등분포입니다. 

 

2번은 아래 링크를 참고하세요. 

 

https://hsm-edu.tistory.com/1408

 

반응형

댓글