반응형
그래프를 그려봐야 하는 이유는 여러가지가 있겠지만, 그래프를 그려봐야하는 중요한 이유중 하나는 '이상치'입니다. 아래 그래프를 봅시다.
이 그래프는 어떤 치수에 대한 측정 결과인데요. 같은 치수라고 보기에는 어려울 만큼 심하게 큰 값들이 존재합니다. 사람의 키로 예를 들면 3m, 5m 와 같은 결과가 포함된 것입니다.
이 값들은 왜 발생한 것일까요?
보통은 사람의 실수로 발생합니다. 이런 실수를 쉽게 걸러낼 수 있는 좋은 도구가 '상자 그림'입니다. 상자 수염그림이라고도 부르고 영어로는 boxplot 이라고 합니다. boxplot 을 그리면 이상치를 한눈에 볼 수 있습니다. 위 그래프에서 동그라미가 이상치입니다.
반응형
'@ 통계 교양 > 통계 Tips' 카테고리의 다른 글
mean vs average vs expected value (구분 가능?) (1) | 2020.09.24 |
---|---|
IBM에서 제공하는 무료 데이터사이언스 강의 사이트 (1) | 2020.09.21 |
표본의 크기를 계산하는 검정력분석 (G power 소프트웨어) (0) | 2020.08.27 |
반복측정 분산분석에서의 표본수 선정 (0) | 2020.08.26 |
모비율의 추정 간단 설명 (0) | 2020.08.04 |
상관분석은 언제쓰는걸까 (0) | 2020.07.23 |
분산분석은 언제쓰는걸까 (0) | 2020.07.17 |
카이제곱검정은 언제 쓰는걸까 (4) | 2020.07.12 |
댓글