본문 바로가기
@ 통계 교양/통계 Tips

표준편차 vs 평균절대편차 vs 중앙값절대편차 (극단값 민감성 비교)

by bigpicture 2021. 10. 19.
반응형

표준편차, 평균절대편차, 중앙값절대편차는 아래와 같이 정의됩니다. 

$SD=\sqrt{\frac{\sum_{i=1}^{n}\left ( X_{i}-mean \right )^{2}}{n}}$

$AAD=\frac{ \sum_{i=1}^{n}\left |X_{i}-mean  \right |}{n}$

$MAD=MAD=median(X_{i}-median)$

SD : Standard deviation (표준편차)
AAD : Average Absolute deviation (평균 절대편차)
MAD : Median Absolute deviation (중앙값 절대편차)

 

극단값에 대한 민감도를 알아보기 위해 두개의 데이터를 정의했습니다. 프로그램은 R을 사용했습니다. 

 

> dt1=c(1,2,3,4,5,6,7,8,9,10)
> dt2=c(1,2,3,4,5,6,7,8,9,100)

 

dt2 에 극단값이 포함되어 있습니다. 표준편차, 평균절대편차, 중앙값절대편차를 계산하고 막대그래프로 그려보았습니다. 

 

library(lsr) #aad 함수수

dt_dev=c(mad(dt1),mad(dt2),aad(dt1),aad(dt2),sd(dt1),sd(dt2))
names(dt_dev)=rep(c("dt1","dt2"),3)

barplot(dt_dev,beside=TRUE,col=c("red","red","blue","blue","green","green"))
legend("topleft",legend=c("MAD","AAD","SD"),fill=c("red","blue","green"),border="white",cex=1.2)

 

MAD의 경우 극단값 포함 전후의 차이가 없습니다. 평균절대편차는 극단값 포함 시 차이가 커지고, 표준편차는 그 차이가 더 커집니다. 중앙값절대편차가 극단값에 가장 강건(Robust)하며, 표준편차가 가장 민감하게 반응함을 알 수 있습니다. 

 

반응형

댓글