본문 바로가기
@선택과목2/삭제강의(정규성검정 관련)

5. 분위수(Quantile)를 구하는 9가지 방법(#5. 순서통계 보충설명)

by bigpicture 2018. 10. 18.
반응형
5. 분위수(Quantile)를 구하는 9가지 방법(#5. 순서통계 보충설명)

 

 

 

 

지난시간까지 불연속변수의 분위수 계산 방법인 Type 1~3을 가지고 분위수 계산을 해봤습니다. 순서통계에 대한 설명이 부족한 것 같아서 오늘은 그 원리를 설명드리겠습니다. 분위수 중 하나를 예를들어볼게요. 무수히 많은 분위수를 정의할 수 있지만, 가장 자주 쓰는 사분위수를 예로 들겠습니다. 나머지 분위수들도 동일한 원리로 계산됩니다.

 

10개의 수를 생성했습니다.

 

24,28,37,43,46,47,59,67,75,77

 

사분위수 계산에서 얻어야 하는 결과는 아래와 같습니다. 

 

0% : 0사분위수

25% : 1사분위수

50% : 2사분위수

75% : 3사분위수

100% : 4사분위수

 

일반적 정의에서 사분위수는 1,2,3사분위수 3개입니다. 0사분위수와 4사분위수는 최댓값과 최솟값입니다. 따라서 0사분위수와 4사분위수는 쉽게 결정됩니다. 

 

0% : 24

25% : 1사분위수

50% : 2사분위수

75% : 3사분위수

100% : 77

 

분위수 계산은 '순위'를 기반으로 합니다. 10개의 수를 뽑았으므로 순위를 1위 부터 10위까지 매깁니다. 1,2,3사분위수는 몇 위에 위치할지를 계산할 수 있습니다. 1사분위수는 25% 위치이므로 전체 순위인 10위에 0.25를 곱하여 순위를 구하면 됩니다. 2.5위 입니다. 동일한 방법으로 나머지 분위수의 순위를 구해봅시다. 

 

0% : 24

25% : 10*0.25= 2.5위

50% : 10*0.5 = 5위

75% : 10*0.75 = 7.5위

100% : 77

 

여기서 문제가 하나 생깁니다. 2.5위와 7.5위는 존재하지 않는 순위입니다. 이 순위를 어떻게 처리하느냐에 따라 type 1,2,3이 나뉘었던 겁니다. 올림, 올림+보정, 오사오입을 사용했었습니다. 

 

반응형

댓글