[통계] 줄기-잎 그림 예시
줄기 잎 그림이 무엇인지 이해하고, 장점이 무엇인지를 알 수 있도록 준비한 예제입니다. 어떤 반 20명 학생들의 수학 점수가 아래와 같다고 합시다. 78, 72, 50, 95, 75, 51, 43, 80, 64, 83, 79, 32, 38, 55, 44, 86, 94, 30, 80, 44 이 점수를 줄기-잎 그림으로 나타내면 아래와 같습니다. 줄기 잎 도수 3 02 2 4 344 3 5 015 3 6 4 1 7 2589 4 8 0036 4 9 45 2 줄기-잎 그림을 이용하면 줄기의 변량을 한 눈에 파악할 수 있고, 도수도 한눈에 파악할 수 있습니다.
2021. 3. 16.
[분할표와 ROC curve의 이해] 6. ROC curve 그려보기
우리가 풀고 있는 문제는 아래와 같습니다. 우리는 A라는 병을 진단하는 진단키트를 개발하는 연구원입니다. 혈액에서 채취한 어떤 수치 k가 병과 연관이 있었고, k를 이용해서 병을 진단하려고 시도하는 상황입니다. 정상인과 병에 걸린사람을 각각 5명식 모집하고, 수치 k를 측정하였습니다. 결과는 아래와 같습니다. (사람 수가 작은 이유는 손으로 풀기 위함입니다.) 정상 : 3.3, 3.6, 5.2, 4.6, 4.9 환자 : 5.3, 6.8, 7.7, 8.3, 4.7 진단 기준이 되는 k값 몇으로 해야할까요? k를 바꿔가면서 민감도와 특이도를 구했고, 결과는 아래와 같습니다. k 범위 환자 양성/정상 양성 환자 음성/정상 음성 민감도 특이도 k
2020. 9. 15.
[분할표와 ROC curve의 이해] 4. 최적의 진단기준은 어떻게 정할까?
우리는 지금까지 분할표, 민감도, 특이도에 대해서 배웠습니다. 이제 다시 첫시간의 문제로 돌아가서 k를 구하는 방법을 고민해봅시다. 우리는 A라는 병을 진단하는 진단키트를 개발하는 연구원입니다. 혈액에서 채취한 어떤 수치 k가 병과 연관이 있었고, k를 이용해서 병을 진단하려고 시도하는 상황입니다. 정상인과 병에 걸린사람을 각각 5명식 모집하고, 수치 k를 측정하였습니다. 결과는 아래와 같습니다. (사람 수가 작은 이유는 손으로 풀기 위함입니다.) 정상 : 3.3, 3.6, 5.2, 4.6, 4.9 환자 : 5.3, 6.8, 7.7, 8.3, 4.7 진단 기준이 되는 k값 몇으로 해야할까요? 최적의 k를 구하는 방법은 간단합니다. 먼저 환자와 정상인의 k수치를 크기 순서대로 배열합시다. 3.3(정상) 3..
2020. 9. 8.
[ 분할표와 ROC curve의 이해] 1. 진단키트와 분할표
한가지 실제 문제 상황을 가정하고, 이 문제를 해결하면서 분할표와 ROC curve를 이해해보겠습니다. 우리는 A라는 병을 진단하는 진단키트를 개발하는 연구원입니다. 혈액에서 채취한 어떤 수치 k가 병과 연관이 있었고, k를 이용해서 병을 진단하려고 시도하는 상황입니다. 정상인과 병에 걸린사람을 각각 5명식 모집하고, 수치 k를 측정하였습니다. 결과는 아래와 같습니다. (사람 수가 작은 이유는 손으로 풀기 위함입니다.) 정상 : 3.3, 3.6, 5.2, 4.6, 4.9 환자 : 5.3, 6.8, 7.7, 8.3, 4.7 병을 판정하는 기준을 k값 몇으로 해야할까요? 우리가 풀어야할 문제입니다. 먼저 아무 k값이나 하나 정해봅시다. 7로 정해보겠습니다. 7이라는 기준으로 진단을 해봅시다. k값이 7보다 ..
2020. 9. 7.