대칭인 분포의 경우 평균과 중앙값이 같습니다. 반면 분포가 한쪽으로 치우친 경우 평균과 중앙값이 달라집니다.
아래 데이터를 봅시다.
100 100 100 150 150 150 150 150 200 200 200
이 데이터는 평균이 150 이고, 중앙값도 150입니다. 이 데이터를 오른쪽 꼬리를 가진 데이터로 바꿔보겠습니다. 오른쪽 꼬리를 가진 데이터는 right-tailed 또는 skewed to right 또는 poistive skewed 라고 부릅니다.
100 100 100 150 150 150 150 150 200 200 2000
이렇게 바꾸었을 때 왜 오른쪽 꼬리를 갖는 것인지 이해가 되지 않는 분들은 히스토그램을 떠올리시면 됩니다. 오른쪽으로 아주 먼 곳인 2000에 막대가 하나 올라와 있게 된 것입니다.
이 데이터로 평균을 구해봅시다. 313.63입니다. 두배 이상 증가했습니다. 중앙값은 그대로 150입니다. 오른쪽 꼬리가 있는 데이터에서는 평균이 중앙값보다 높다는 것을 알 수 있습니다.
우리가 어떤 데이터의 분포는 모르지만 평균이 중앙값보다 높다는 것을 알았습니다. 위 사실로 부터 이 분포가 right-tailed 라는 것을 알 수 있습니다.
평균 > 중앙값 : right-tailed
이번에는 왼쪽 꼬리를 갖게 바꿔봅시다.
10 100 100 150 150 150 150 150 200 200 200
처음 데이터에서 맨 왼쪽의 100을 10으로 바꿨습니다. 왼쪽 꼬리가 하나 생겼습니다. 평균을 구해보면 141.81 로 약간 줄었습니다. 중앙값은 그대로 150입니다. 왼쪽 꼬리 분포의 경우 평균이 중앙값보다 작습니다.
평균 < 중앙값 : left-tailed
'@ 통계 교양 > 통계 Tips' 카테고리의 다른 글
양측검정과 단측검정의 검정력은 같을까 다를까 (5) | 2021.11.12 |
---|---|
X가 U(0,1)인 균등분포를 따르면 1-X 도 그럴까 (0) | 2021.10.21 |
p값의 분포는 왜 균등분포일까 (distribution of p-value) (0) | 2021.10.21 |
p값에 대한 미국통계협회의 입장발표 (이거 계속 써도 되는겨?) (0) | 2021.10.20 |
표준편차 vs 평균절대편차 vs 중앙값절대편차 (극단값 민감성 비교) (0) | 2021.10.19 |
분산 구하는 변형공식을 표본에도 적용할 수 있을까 (0) | 2021.10.18 |
카이제곱검정의 대응표본버전 (맥니마, 맥니마 보우커,코크란 Q) (0) | 2021.10.12 |
로그스케일 그래프는 언제 쓰는걸까? (로그-로그 그래프) (0) | 2021.09.24 |
댓글