본문 바로가기
@ OO의 이해/진단성능 분할표 용어의 이해

(진단성능 분할표 용어) 3. 유병률, 정확도

by bigpicture 2021. 8. 26.
반응형

진단기기의 성능을 판단하기 위해 만든 분할표와 관련하여 다양한 용어들이 정의되어 있습니다. 이 용어들을 총 다섯개의 강의에 걸쳐서 알아보려고 합니다. 단순히 용어만을 설명하는 강의구요. 더 깊은 의미와 관계에 대해서는 다른 강의에서 다루도록 하겠습니다.

1. 참양성,참음성,위양성,위음성
2. 민감도,특이도,위양성도,위음성도,양성예측도,음성예측도,허위발견률,허위 누락률
3. 유병률, 정확도
4. 양의 우도비, 음의 우도비
5. 상대위험도, 오즈비


지난 글에서 만든 표를 가져옵시다. 

 

  환자 정상    
양성 True Positive (TP) False Positive (FP) Positive Predictive Value
= TP/(TP+FP)
False Discovery Rate
= FP/(TP+FP)
음성 False Negative (FN) True Negative (TN) False Omission Rate
= FN/(FN+TN)
Negative Predictive Value
= TN/(FN+TN)
  Sensitivity
= TP/(TP+FN)
False Positive Rate
= FP/(FP+TN)
   
  False Negative Rate
= FN/(TP+FN)
Specificity
= TN/(FP+TN)
   

 

오늘은 유병률(Prevalence)과 정확도(Accuracy)를 배워봅시다. 

 

유병률

유병률은 질병이 발생할 확률입니다. 유병률은 모집단이 어떤가에 따라 달라집니다. 어떤 질병에 있어서 전 국민을 대상으로 하는 유병률과 서울시민을 대상으로 하는 유병률은 다를 것입니다. 한국,미국,중국,일본의 유병률도 다를 것입니다. 

 

여기서 말하는 유병률은 조사된 대상 내에서의 유병률입니다. 아래 표를 봅시다. 

 

  환자 정상 합계 
양성 70 10 80
음성 20 400 420
 합계 90 410 500

 

위 표에서 유병률을 구해봅시다. 질병이 발생할 확률이므로 전체 사람 중에서 환자의 비율을 구하면 됩니다. 90/500입니다. 18%입니다. 우리가 만들고 있던 표에다가 추가해봅시다. 

 

  환자 정상 Prevalence
(TP+FN)/(TP+FN+FP+TN)
 
양성 True Positive (TP) False Positive (FP) Positive Predictive Value
= TP/(TP+FP)
False Discovery Rate
= FP/(TP+FP)
음성 False Negative (FN) True Negative (TN) False Omission Rate
= FN/(FN+TN)
Negative Predictive Value
= TN/(FN+TN)
  Sensitivity
= TP/(TP+FN)
False Positive Rate
= FP/(FP+TN)
   
  False Negative Rate
= FN/(TP+FN)
Specificity
= TN/(FP+TN)
   

 

참고로 말씀드리면 양성예측도와(PPV)와 음성예측도(NPV)는 유병률의 영향을 받습니다. 유병률이 달라지면 달라집니다. 따라서 같은 진단기계를 사용하더라도 어떤 표본을 대상으로 하는가에 따라 달라질 수 있습니다. 반면 민감도(Sensitivity)와 특이도(Specificity)는 유병률의 영향을 받지 않습니다. 따라서 민감도와 특이도는 진단 기계의 고유한(intrinsic) 특성입니다. 

 

정확도

정확도는 전체 사람 중에서 옳게 진단을 받은 사람의 비율을 말합니다. 옳은 진단이라는 것은 환자를 양성으로, 정상인을 음성으로 진단하는 경우를 말합니다. 아래 표를 봅시다. 

 

  환자 정상 합계 
양성 70 10 80
음성 20 400 420
 합계 90 410 500

 

전체 사람 수는 500명이고 옳게 진단을 받은 사람은 470명입니다. 따라서 정확도는 470/50=94% 입니다. 

 

우리가 만들고 있던 표에다가 추가해봅시다. 

 

  환자 정상 Prevalence
(TP+FN)/(TP+FN+FP+TN)
Accuracy
(TP+TN)/(TP+FN+FP+TN)
양성 True Positive (TP) False Positive (FP) Positive Predictive Value
= TP/(TP+FP)
False Discovery Rate
= FP/(TP+FP)
음성 False Negative (FN) True Negative (TN) False Omission Rate
= FN/(FN+TN)
Negative Predictive Value
= TN/(FN+TN)
  Sensitivity
= TP/(TP+FN)
False Positive Rate
= FP/(FP+TN)
   
  False Negative Rate
= FN/(TP+FN)
Specificity
= TN/(FP+TN)
   

 

아래는 한글버전입니다. 

 

  환자 정상 유병률
(TP+FN)/(TP+FN+FP+TN)
정확도
(TP+TN)/(TP+FN+FP+TN)
양성 True Positive (TP) False Positive (FP) 양성예측도
= TP/(TP+FP)
허위발견률
= FP/(TP+FP)
음성 False Negative (FN) True Negative (TN) 허위누락률
= FN/(FN+TN)
음성예측도
= TN/(FN+TN)
  민감도
= TP/(TP+FN)
위양성률
= FP/(FP+TN)
   
  위음성률
= FN/(TP+FN)
특이도
= TN/(FP+TN)
   

 

정확도도 유병률의 영향을 받습니다. 정확도는 아래와 같이 유병률,민감도,특이도로 표현할 수 있습니다. 

 

Accuracy = (sensitivity) (prevalence) + (specificity) (1 - prevalence)

 

민감도와 특이도는 진단기기 고유 값이라 상수 취급할 수 있습니다. 따라서 유병률이 변하면 정확도도 변합니다. 특이도에 비해 민감도가 높은 진단기기라면 유병률이 클 수록 정확도가 높아집니다. 반면 특이도에 비해 민감도가 높은 진단기기는 유병률이 낮을 수록 정확도가 높아집니다. 

 

유병률 입장에서도 생각해봅시다. 유병률이 높은 병이라면 민감도와 특이도 중 민감도를 높였을 때 정확도가 더 많이 증가합니다. 반면 유병률이 낮은 병이라면 특이도를 높였을 때 정확도가 더 많이 증가합니다. 

반응형

댓글