본문 바로가기
@선택과목2/삭제강의(정규성검정 관련)

Q-Q plot 그리는 법 (2) 원리

by bigpicture 2018. 11. 12.
반응형

 

 

Q-Q plot의 원리

지난시간에 '역누적분포함수'가 확률-분위수함수와 동일하다는 것을 배웠습니다. 오늘은 '역누적분포함수'를 이용해서 Q-Q plot의 원리를 설명하겠습니다.

 

두 집단이 있다고 해봅시다. 집단 A와 집단 B입니다. 집단 A의 역누적분포함수를 A(x), 집단 B의 누적분포함수를 B(x)라고 합시다. 변수 x는 확률입니다. 두 집단의 분포가 같다면 아래 등식이 성립합니다. 

 

 

두 집단이 같은 분포를 따른다는 것은 한 집단의 선형변환을 통해 다른 집단을 만들 수 있다는 것입니다. 여러분이 알고 계신 여러 분포들(정규분포, 지수분포, 카이제곱분포 등)을 선형 변환해보시면 이해가 되실 겁니다. 이 원리를 이용하면 분위수 끼리도 선형관계를 갖는다는 것을 알 수 있습니다. 

 

 

 

 

 

 

그래프로 그리면 아래와 같습니다. 

 

 

동일한 원리로 모든 분위수들은 서로 선형관계를 갖습니다. 따라서 두 집단이 같은 분포를 따를 때, 두 집단의 분위수를 구하고 좌표평면에 점을 찍어서 연결하면 직선이 됩니다. 이런 원리를 이용하여 두 집단의 분포를 비교합니다. 그래프를 보고 판단하는 것이기 때문에 '정성적'비교입니다. p-value처럼 판단의 기준이 되는 어떤 값이 구해지지는 않습니다. 

 

반응형

댓글