우측꼬리 t검정을 예로 들어봅시다. 우리가 뽑은 표본의 통계량을 t라고 놓는다면 아래와 같은 그림을 그릴 수 있습니다. F(t)는 누적분포함수입니다.
아래 등식이 만족합니다.
$p=1-F(T=t)$
시행에 따라 T값이 바뀌고, T값이 바뀌면 p값도 바뀝니다. 따라서 p도 확률변수라고 할 수 있습니다. F(T)의 분포를 구하면 p의 분포를 구할 수 있습니다. F(T)가 이미 누적분포함수인데, 분포함수의 분포함수를 구한다고? 네 맞습니다.
이 분포함수 F(T)를 새로운 확률변수 Y 라고 놓겠습니다. Y의 누적분포함수를 G라고 놓겠습니다. G는 아래와 같이 정의됩니다. Pr은 확률을 의미합니다.
$G(y)=Pr(Y\leq y)$
Y=F(T) 이므로 아래와 같이 변형합시다.
$G(y)=Pr(F(T)\leq y)$
F(T) 는 연속함수이고 우상향하는 일대일대응 함수입니다. 따라서 아래와 같이 변형됩니다.
$G(y)=Pr\left [ F^{-1}(F(T))\leq F^{-1}(y) \right ]$
F의 역함수를 씌운 것입니다. F(X)의 역함수는 X이므로 아래와 같이 변형됩니다.
$G(y)=Pr\left [ T\leq F^{-1}(y) \right ]$
맨 오른쪽 항을 이해하기 위해 그래프를 하나 그려봅시다.
$T$가 $F^{-1}(y)$보다 작을 확률은 얼마일까요. 네 y입니다. 누적분포함수의 정의가 그렇기 때문입니다. 따라서 아래 등식이 유도됩니다.
$G(y)=y$
$G(y)$ 는 F(T)가 따르는 누적분포함수였는데, 항등함수입니다. 누적분포함수가 항등함수인 분포는 '균등분포'입니다. 따라서 F(T)는 균등분포를 따릅니다. F(T)의 범위는 #0 \leq F(T) \leq 1$ 입니다. $p=1-F(T=t)$ 이므로 p도 균등분포를 따릅니다. 두가지 의문이 드는 분들이 계실겁니다.
1. 누적분포가 항등함수인 분포가 왜 균등분포지?
2. F(T)가 균등분포를 따르는데 왜 1-F(T)도 균등분포를 따르지?
1번은 G(y)=y를 미분해보면 압니다. 누적분포함수를 미분하면 확률밀도함수입니다. y를 미분하면 1이고, 확률밀도함수가 1인 분포는 균등분포입니다.
2번은 아래 링크를 참고하세요.
https://hsm-edu.tistory.com/1408
'@ 통계 교양 > 통계 Tips' 카테고리의 다른 글
통계 영문자료를 이해하기 위한 통계 용어와 해석 모음(지속적 업데이트) (0) | 2021.12.02 |
---|---|
이항분포, 정규분포, 푸아송분포의 관계 (1) | 2021.11.19 |
양측검정과 단측검정의 검정력은 같을까 다를까 (5) | 2021.11.12 |
X가 U(0,1)인 균등분포를 따르면 1-X 도 그럴까 (0) | 2021.10.21 |
p값에 대한 미국통계협회의 입장발표 (이거 계속 써도 되는겨?) (0) | 2021.10.20 |
평균과 중앙값의 비교와 그래프의 치우침 (0) | 2021.10.19 |
표준편차 vs 평균절대편차 vs 중앙값절대편차 (극단값 민감성 비교) (0) | 2021.10.19 |
분산 구하는 변형공식을 표본에도 적용할 수 있을까 (0) | 2021.10.18 |
댓글