본문 바로가기
@선택과목2/삭제강의(정규성검정 관련)

분위수(Quantile)를 구하는 9가지 방법(#9. Type7 방법)

by bigpicture 2018. 10. 29.
반응형

 

 

통계패키지(R,점유율1위)에서 사용하는 분위수 계산방법에는 9종류가 있습니다. 이전 강의에서 언급했듯이 Type 1~3은 불연속 변수를 대상으로 하고, Type4~9는 연속 변수를 대상으로 합니다. 

 

오늘은 불연속변수의 분위수 계산 방법인 Type 1~3을 가지고 분위수 계산을 해봅시다. 불연속 변수의 경우 '보간'을 사용하지 않고 샘플 중에서 분위수를 선정합니다. 

 

Type7 계산 방법

 

분위수라는 것은 결국 어떤 확률 p 위치에 있는 수가 무엇인지를 구하는 것입니다. 예를들어 4분위수는 확률 0.25,0.5,0.75 위치의 수를 구하는 것입니다. 

 

따라서 아래와 같이 확률을 변수로 하는 분위수 값의 그래프를 그릴 수 있다면 어떤 분위수든 바로 계산이 가능해집니다. Q7(p)를 타입7의 방법으로 구한 분위수라고 정의하겠습니다. 

 

5개의 수를 생성했습니다.

 

24,28,37,43,46

 

각각을 순위로 나타내면 아래와 같습니다.

x1, x2, x3, x4, x5

 

정수 순위가 되는 점을 먼저 찍어줍시다. 표본 수가 5개 이므로 0.2,0.4,0.6,0.8에서 정수 순위가 발생합니다. 이번에는 분수로 써주겠습니다. 

 

 

이제 분모에 1을 빼줍니다. 대응되는 순위를 하나씩 내립니다. (순위에 1을 더함)

 

 

이제 각 점을 선으로 연결합니다.

 

 

실제 숫자를 넣어봅시다. (y축 간격은 고려하지 않겠습니다.)

 

 

이제 실제로 분위수를 한번 구해봅시다. 가장 대표적인 사분위수를 구해보겠습니다. 그래프를 이용하면 쉽게 구해집니다. 

 

0.25

0.5

0.75

 

이 중 0.25만 구해봅시다. 나머지는 원리가 동일합니다. 

 

 

0.25에서의 분위수는 28입니다. 

 

반응형

댓글