본문 바로가기
@ 통계학 석박사 진학관련/수리통계학 요약

[수리통계학] #19. 베이즈정리 예시2 : 암 진단

by bigpicture 2021. 3. 1.
반응형

베이즈정리 두번째 예시입니다. 지난 예시보다는 베이즈정리에 의미에 다가갈 수 있는 예시입니다. 

 

'다진단'이라는 암 진단키트가 있습니다. 다진단이 털암에 걸린 사람을 암환자로 진단할 확률을 97%입니다. 건강한 사람을 암환자로 오진할 확률은 2%입니다. 만약 다진단으로 K를 검사한 결과 암환자로 나왔을 때, K가 암에 걸려있을 확률은 얼마일까? 

 

조건부확률을 이용하여 확률을 표현하면 아래와 같습니다. K가 암환자로 진단된 사건을 DP, K가 암에 걸린 사람일 확률을 CP라고 하겠습니다. 암에 걸리지 않을 확률은 CN이라고 놓겠습니다. 

 

$P(CP|DP)=\frac{ P(CP \cap DP) }{ P(DP) }$

곱셈공식전확률법칙을 이용하여 베이즈정리 형태로 바꾸면 아래와 같습니다. 

 

$P(CP|DP)=\frac{ P(CP)P(DP|CP) }{ P(CP)P(DP|CP)+P(CN)P(DP|CN) }$

 

분모는 P(DP)에 전확률공식을 적용한 것입니다. P(DP)는 암환자로 진단될 확률인데, 이는 K가 암환자라는 조건 하에 암환자로 진단될 확률과 K가 암환자가 아니라는 조건 하에 암환자로 진단될 확률의 합입니다. 

 

우변을 계산하는데 한 가지 문제가 있습니다. $P(CP)$를 모른다는 것입니다. $P(CP)$는 털암 발병률입니다. 이 확률을 '사전확률'이라고 합니다. 다행이 이 데이터를 구했다고 합시다. 털암의 발병률은 1% 입니다. 이 사전확률을 모르는 경우가 진정한 베이즈정리 예제가 될텐데, 다음 예시에서 다룹시다. 

 

각 확률을 구해봅시다. 

 

$P(CP)=(0.01)$

$P(DP|CP)=(0.97)$
$P(CN)=(0.99)$

$P(DP|CN)=(0.02)$

 

대입해봅시다. 

 

$P(CP|DP)=\frac{ (0.01)(0.97) }{ (0.01)(0.97)+(0.99)(0.02) }$

반응형

댓글