어떤 암에 걸릴 확률이 1%라고 합시다. 어떤 사람이 증상이 의심되서 병원에 가서 암 검사를 받았습니다. 이 검사도구는 병에 걸린 사람을 병에 걸렸다고 판단할 확률이 90%이고, 병에 걸리지 않은 사람을 병에 걸리지 않았다고 판단할 확률이 80%입니다. 전문용어로 표현하면 아래와 같습니다.
민감도(sensitivity) : 90%
특이도(specificity) : 80%
검사 결과는 양성이었습니다. 이때 이 사람이 실제로 병에 걸렸을 확률은 얼마일까요?
아래 조건부확률을 구하면 됩니다. PT는 양성인 사건이고 D는 병에걸린 사건입니다.
$P(D|PT)=\frac{P(D\cap PT)}{P(PT)}$
분모는 양성이 나올 확률입니다. 양성이 나올 확률은 병에 걸렸는데 양성이 나올 확률과 병에 걸리지 않았는데 양성이 나올 확률의 합입니다.
$P(PT)=P(PT \cap D)+P(PT \cap D^{c})$
아래와 같이 바꿔 쓸 수 있습니다.
$P(PT)=P(D)P(PT|D)+P(D^{c})P(PT|D^{c})$
계산하던 식에 대입해줍니다.
$P(D|PT)=\frac{P(D\cap PT)}{P(D)P(PT|D)+P(D^{c})P(PT|D^{c})}$
분자는 아래와 같이 변형됩니다.
$P(D|PT)=\frac{P(D)P(PT|D)}{P(D)P(PT|D)+P(D^{c})P(PT|D^{c})}$
아래와 같이 계산됩니다.
$P(D|PT)=\frac{0.01 \times 0.9}{0.01 \times 0.9+0.99 \times 0.2}=0.043$
양성이 나왔는데 실제 병에 걸려있을 확률은 4.3% 입니다.
양성이 나왔을 때 병에 걸려있을 확률을 양성예측도(Positive Predictive Value)라고 합니다. 양성예측도는 질병이 발생할 확률인 '유병률'의 영향을 많이 받습니다. 진단기계가 동일하더라도 유병률이 달라지면 양성예측도가 달라집니다.
위 예시에서 유병률이 1%였는데, 유병률은 3%로 늘려봅시다.
$P(D|PT)=\frac{0.03 \times 0.9}{0.03 \times 0.9+0.97 \times 0.2}=0.122$
양성예측도가 12%로 올라갑니다. 따라서 양성예측도는 진단기계의 고유한 특성이 될 수 없습니다.
반면 민감도와 특이도는 유병률의 영향을 받지 않는 기계 고유의 특성입니다. 영어로는 intrinsic(고유한) 을 사용합니다.
'@ 통계 교양 > 통계로 세상보기' 카테고리의 다른 글
레버리지 ETF가 위험한 이유 정말 알고 계신가요? (TQQQ,3LTS...) (0) | 2021.10.30 |
---|---|
물가가 2%씩 오르면 10년 뒤 돈의 가치는 얼마나 줄어들까 (0) | 2021.10.12 |
코로나에서 양성이 나왔을 때, 실제 코로나에 걸렸을 확률 (0) | 2021.08.25 |
물가상승률은 어떻게 계산되는걸까? (물가상승률과 물가지수) (0) | 2021.03.01 |
나라별 국가채무 확인하는 방법(IMF 홈페이지) (0) | 2021.02.28 |
대학 학과 별 입학자 수 확인하는 방법 (0) | 2020.07.04 |
세계 500대 부자 자산에도 파레토법칙이 적용될까?? (0) | 2020.05.14 |
우리나라는 어느 연령의 인구 수가 가장 많을까? (2) | 2020.05.12 |
댓글