본문 바로가기
@ OO의 이해/분할표와 ROC curve의 이해

[ 분할표와 ROC curve의 이해] 1. 진단키트와 분할표

by bigpicture 2020. 9. 7.
반응형

한가지 실제 문제 상황을 가정하고, 이 문제를 해결하면서 분할표와 ROC curve를 이해해보겠습니다. 

 

우리는 A라는 병을 진단하는 진단키트를 개발하는 연구원입니다. 혈액에서 채취한 어떤 수치 k가 병과 연관이 있었고, k를 이용해서 병을 진단하려고 시도하는 상황입니다. 정상인과 병에 걸린사람을 각각 5명식 모집하고, 수치 k를 측정하였습니다. 결과는 아래와 같습니다. (사람 수가 작은 이유는 손으로 풀기 위함입니다.)

정상 : 3.3, 3.6, 5.2, 4.6, 4.9
환자 : 5.3, 6.8, 7.7, 8.3, 4.7

 

병을 판정하는 기준을 k값 몇으로 해야할까요? 우리가 풀어야할 문제입니다.

 

먼저 아무 k값이나 하나 정해봅시다. 7로 정해보겠습니다. 7이라는 기준으로 진단을 해봅시다. k값이 7보다 크면 환자라고 판단할 것입니다. 진단 결과는 총 네가지로 나눠집니다.

 

정상을 정상으로 진단

정상을 환자로 진단

환자를 정상으로 진단

환자를 환자로 진단

 

위 상황을 2x2 분할표로 그릴 수 있습니다. 진단 결과가 정상인 경우가 음성, 진단 결과가 환자인 경우가 양성입니다.

 

   환자 정상   합계
 양성  환자를 환자로 진단  정상을 환자로 진단  
 음성 환자를 정상으로 진단  정상을 정상으로 진단   
 합계      

 

위 상황에 실제로 적용해 봅시다. 정상을 정상으로 진단하는 경우는 5건입니다. 정상을 환자로 진단하는 경운는 0건입니다. 환자를 정상으로 진단하는 경우는 2건입니다. 환자를 환자로 진단하는 경우는 3건입니다. 표를 채워봅시다. 

 

   환자 정상   합계
 양성 3 0
 음성 2  5 
 합계  5 5   10

 

다음시간에는 위 표를 일반화 시키고 용어정리를 하겠습니다. 

반응형

댓글