반응형
상자수염그림은 사분위수와 최댓값,최솟값으로 만든 그래프입니다. 아래 왼쪽 그림을 봅시다. 맨 위 가로선이 최댓값, 맨 아래 가로선이 최솟값입니다. 가운데 박스에 세개의 세로선이 있습니다. 자료를 크기 순으로 정렬했을 때 25%, 50%, 75% 에 해당되는 값입니다. 각각 Q1,Q2,Q3 라고 부릅니다. 50%에 해당되는 값을 중앙값이라고 합니다. Q는 Qurtile 이고 분위수라는 말입니다. Q1은 일사분위수 입니다.
오른쪽 그림을 보면 점이 하나 찍혀있습니다. 이 점을 이상치(outlier) 라고 합니다. 혼자서 아주 크거나, 아주 작은 값을 이상치로 분류합니다. 이상치는 '실수'로 입력된 값일 수도 있고 실제 값일 수도 있습니다. 예를들어 사람의 키 데이터라면 이상치는 실수일 가능성이 높습니다.
상자수염그림에서 이상치는 Q3+1.5*IQR 보다 큰 값 또는 Q1-1.5*IQR 보다 작은 값을 말합니다. IQR 이란 inter-quartile range 로 Q3-Q1입니다.
반응형
'@ 통계 교양 > 통계 Tips' 카테고리의 다른 글
회귀분석 한번에 감잡기 (F값, t값) (0) | 2022.04.14 |
---|---|
카이제곱검정도 양측검정이 있을까? (0) | 2022.04.01 |
균등분포로 동전 던지기 확률, 주사위 던지기 확률 생성하기 (0) | 2021.12.31 |
로버스트 통계 방법이란 무엇인가 (0) | 2021.12.30 |
통계 영문자료를 이해하기 위한 통계 용어와 해석 모음(지속적 업데이트) (0) | 2021.12.02 |
이항분포, 정규분포, 푸아송분포의 관계 (1) | 2021.11.19 |
양측검정과 단측검정의 검정력은 같을까 다를까 (5) | 2021.11.12 |
X가 U(0,1)인 균등분포를 따르면 1-X 도 그럴까 (0) | 2021.10.21 |
댓글