본문 바로가기
반응형

@ OO의 이해/분할표와 ROC curve의 이해6

[분할표와 ROC curve의 이해] 6. ROC curve 그려보기 우리가 풀고 있는 문제는 아래와 같습니다. 우리는 A라는 병을 진단하는 진단키트를 개발하는 연구원입니다. 혈액에서 채취한 어떤 수치 k가 병과 연관이 있었고, k를 이용해서 병을 진단하려고 시도하는 상황입니다. 정상인과 병에 걸린사람을 각각 5명식 모집하고, 수치 k를 측정하였습니다. 결과는 아래와 같습니다. (사람 수가 작은 이유는 손으로 풀기 위함입니다.) 정상 : 3.3, 3.6, 5.2, 4.6, 4.9 환자 : 5.3, 6.8, 7.7, 8.3, 4.7 진단 기준이 되는 k값 몇으로 해야할까요? k를 바꿔가면서 민감도와 특이도를 구했고, 결과는 아래와 같습니다. k 범위 환자 양성/정상 양성 환자 음성/정상 음성 민감도 특이도 k 2020. 9. 15.
[분할표와 ROC curve의 이해] 5. 민감도와 특이도의 trade-off 관계 지난시간에 k값을 바꿔가며 민감도와 특이도를 구했습니다. 민감도도 높고 특이도도 높은 k값을 선정해야하는데요. 민감도와 특이도는 서로 trade-off 관계가 있었습니다. 하나가 높아지면 다른 하나가 낮아집니다. 이런 경우에는 어떤 k값으로 정해야 할까요? 해결 방법은 아래와 같습니다. 민감도와 특이도가 동일하게 중요하다는 가정을 하고 둘의 합을 최대로 만드는 k값을 찾으면 됩니다. 아래 수식에서 response 를 최대로 하는 k값을 구하는 것입니다. sensitivity + specificity = response 또는 어느 한쪽이 더 중요하다고 판단되면, 가중치를 줄 수도 있습니다. 둘의 중요도를 6:4로 설정하였습니다. sensitivity*0.6 + specificity*0.4 = respons.. 2020. 9. 14.
[분할표와 ROC curve의 이해] 4. 최적의 진단기준은 어떻게 정할까? 우리는 지금까지 분할표, 민감도, 특이도에 대해서 배웠습니다. 이제 다시 첫시간의 문제로 돌아가서 k를 구하는 방법을 고민해봅시다. 우리는 A라는 병을 진단하는 진단키트를 개발하는 연구원입니다. 혈액에서 채취한 어떤 수치 k가 병과 연관이 있었고, k를 이용해서 병을 진단하려고 시도하는 상황입니다. 정상인과 병에 걸린사람을 각각 5명식 모집하고, 수치 k를 측정하였습니다. 결과는 아래와 같습니다. (사람 수가 작은 이유는 손으로 풀기 위함입니다.) 정상 : 3.3, 3.6, 5.2, 4.6, 4.9 환자 : 5.3, 6.8, 7.7, 8.3, 4.7 진단 기준이 되는 k값 몇으로 해야할까요? 최적의 k를 구하는 방법은 간단합니다. 먼저 환자와 정상인의 k수치를 크기 순서대로 배열합시다. 3.3(정상) 3.. 2020. 9. 8.
[분할표와 ROC curve의 이해] 3. 민감도와 특이도 지난시간에 만든 분할표는 아래와 같습니다. 환자 정상 합계 양성 TP FP TP+FP 음성 FN TN FN+TN 합계 TP+FN FP+TN TP+FP+FN+TN 이 분할표를 이용하여 아래와 같은 다양한 지표들을 계산할 수 있습니다. - Sensitivity(민감도) - Specificity(특이도) - Positive Predictive Value(양성예측도) - Negative Predictive Value(음성예측도) - Positive Likelihood Ratio(양의 가능도비) - Negative Likelihood Ratio(음의 가능도비) - Odds Ratio(오즈비) - Relative Risk(상대위험도) - Accuraycy(정확도) - Prevalence(유병률) - ROC curv.. 2020. 9. 8.
[ 분할표와 ROC curve의 이해] 2. 분할표 용어정리 지난시간에 만든 분할표는 아래와 같습니다. 환자 정상 합계 양성 환자를 환자로 진단 정상을 환자로 진단 음성 환자를 정상으로 진단 정상을 정상으로 진단 합계 오늘은 분할표의 용어를 정리해봅시다. 분할표 각 셀의 용어를 일반화시키는 것입니다. 환자를 환자로 진단하는 것을 TP 라고 합니다. True Positive 라는 뜻인데요. 양성으로 진단했고 그것이 참이라는 말입니다. 실제 양성인 사람을 양성으로 진단했다는 뜻입니다. 환자를 정상으로 진단하는 것은 무엇일까요? False Negative 입니다. 음성으로 진단했는데 그것이 거짓인 것입니다. FN 이라고 합니다. 정상인을 정상인으로 진단하는 것은 True Negative 입니다. TN 입니다. 정상인을 환자로 진단하는 것은 False Positive 입.. 2020. 9. 8.
[ 분할표와 ROC curve의 이해] 1. 진단키트와 분할표 한가지 실제 문제 상황을 가정하고, 이 문제를 해결하면서 분할표와 ROC curve를 이해해보겠습니다. 우리는 A라는 병을 진단하는 진단키트를 개발하는 연구원입니다. 혈액에서 채취한 어떤 수치 k가 병과 연관이 있었고, k를 이용해서 병을 진단하려고 시도하는 상황입니다. 정상인과 병에 걸린사람을 각각 5명식 모집하고, 수치 k를 측정하였습니다. 결과는 아래와 같습니다. (사람 수가 작은 이유는 손으로 풀기 위함입니다.) 정상 : 3.3, 3.6, 5.2, 4.6, 4.9 환자 : 5.3, 6.8, 7.7, 8.3, 4.7 병을 판정하는 기준을 k값 몇으로 해야할까요? 우리가 풀어야할 문제입니다. 먼저 아무 k값이나 하나 정해봅시다. 7로 정해보겠습니다. 7이라는 기준으로 진단을 해봅시다. k값이 7보다 .. 2020. 9. 7.
반응형