본문 바로가기
@선택과목2/삭제강의(정규성검정 관련)

분위수(Quantile)를 구하는 9가지 방법(#6. Type4 방법)

by bigpicture 2018. 10. 22.
반응형

 

 

통계패키지(R,점유율1위)에서 사용하는 분위수 계산방법에는 9종류가 있습니다. 이전 강의에서 언급했듯이 Type 1~3은 불연속 변수를 대상으로 하고, Type4~9는 연속 변수를 대상으로 합니다. 

 

오늘은 불연속변수의 분위수 계산 방법인 Type 1~3을 가지고 분위수 계산을 해봅시다. 불연속 변수의 경우 '보간'을 사용하지 않고 샘플 중에서 분위수를 선정합니다. 

 

Type4 계산 방법

 

분위수라는 것은 결국 어떤 확률 p 위치에 있는 수가 무엇인지를 구하는 것입니다. 예를들어 4분위수는 확률 0.25,0.5,0.75 위치의 수를 구하는 것입니다. 

 

따라서 아래와 같이 확률을 변수로 하는 분위수 값의 그래프를 그릴 수 있다면 어떤 분위수든 바로 계산이 가능해집니다. Q4(p)를 타입4의 방법으로 구한 분위수라고 정의하겠습니다. 

 

 

5개의 수를 생성했습니다.

 

24,28,37,43,46

 

각각을 순위로 나타내면 아래와 같습니다.

x1, x2, x3, x4, x5

 

정수 순위가 되는 점을 먼저 찍어줍시다. 표본 수가 5개 이므로 0.2,0.4,0.6,0.8에서 정수 순위가 발생합니다. 

 


이제 점들을 선으로 연결하면 됩니다. 

 

 

실제 숫자를 넣어봅시다. (y축 간격은 고려하지 않겠습니다.)

 

 

이제 실제로 분위수를 한번 구해봅시다. 가장 대표적인 사분위수를 구해보겠습니다. 그래프를 이용하면 쉽게 구해집니다. 

 

0.25

0.5

0.75

 

이 중 0.25만 구해봅시다. 나머지는 원리가 동일합니다. 

 

 

위 그림의 빨간 선의 일차방정식을 세워봅시다 .

 

 

이 수식에 0.25를 대입하면 됩니다. 또는 비례식을 이용하면 됩니다. 0.25에서의 y값을 Q라고 한다면 아래 비례식이 성립합니다. 

 

 

Q값을 구해보면 25가 나옵니다. 

 

 

반응형

댓글