반응형
표준편차, 평균절대편차, 중앙값절대편차는 아래와 같이 정의됩니다.
$SD=\sqrt{\frac{\sum_{i=1}^{n}\left ( X_{i}-mean \right )^{2}}{n}}$
$AAD=\frac{ \sum_{i=1}^{n}\left |X_{i}-mean \right |}{n}$
$MAD=MAD=median(X_{i}-median)$
SD : Standard deviation (표준편차)
AAD : Average Absolute deviation (평균 절대편차)
MAD : Median Absolute deviation (중앙값 절대편차)
극단값에 대한 민감도를 알아보기 위해 두개의 데이터를 정의했습니다. 프로그램은 R을 사용했습니다.
> dt1=c(1,2,3,4,5,6,7,8,9,10)
> dt2=c(1,2,3,4,5,6,7,8,9,100)
dt2 에 극단값이 포함되어 있습니다. 표준편차, 평균절대편차, 중앙값절대편차를 계산하고 막대그래프로 그려보았습니다.
library(lsr) #aad 함수수
dt_dev=c(mad(dt1),mad(dt2),aad(dt1),aad(dt2),sd(dt1),sd(dt2))
names(dt_dev)=rep(c("dt1","dt2"),3)
barplot(dt_dev,beside=TRUE,col=c("red","red","blue","blue","green","green"))
legend("topleft",legend=c("MAD","AAD","SD"),fill=c("red","blue","green"),border="white",cex=1.2)
MAD의 경우 극단값 포함 전후의 차이가 없습니다. 평균절대편차는 극단값 포함 시 차이가 커지고, 표준편차는 그 차이가 더 커집니다. 중앙값절대편차가 극단값에 가장 강건(Robust)하며, 표준편차가 가장 민감하게 반응함을 알 수 있습니다.
반응형
'@ 통계 교양 > 통계 Tips' 카테고리의 다른 글
X가 U(0,1)인 균등분포를 따르면 1-X 도 그럴까 (0) | 2021.10.21 |
---|---|
p값의 분포는 왜 균등분포일까 (distribution of p-value) (0) | 2021.10.21 |
p값에 대한 미국통계협회의 입장발표 (이거 계속 써도 되는겨?) (0) | 2021.10.20 |
평균과 중앙값의 비교와 그래프의 치우침 (0) | 2021.10.19 |
분산 구하는 변형공식을 표본에도 적용할 수 있을까 (0) | 2021.10.18 |
카이제곱검정의 대응표본버전 (맥니마, 맥니마 보우커,코크란 Q) (0) | 2021.10.12 |
로그스케일 그래프는 언제 쓰는걸까? (로그-로그 그래프) (0) | 2021.09.24 |
중심극한정리 유도하기 (요약버전) (0) | 2021.09.15 |
댓글