본문 바로가기
@선택과목2/삭제강의(정규성검정 관련)

Q-Q plot 그리는 법 (1) 역누적분포함수

by bigpicture 2018. 11. 8.
반응형

 

 

Q-Q plot의 목적

Q-Q plot은 Quantile-Quantile plot의 줄임말입니다. 분위수-분위수 그래프라는 뜻이구요. 두 데이터의 분위수를 그래프로 그리는 것입니다. 두 데이터의 분위수를 그려서 뭘 하고싶은 걸까요? Q-Q plot의 목적은 '분포 비교'입니다. 어떤 원리로 비교하는 것일까요?

 

역누적분포함수

Q-Q plot의 원리를 이해하려면 먼저 '역누적분포함수'를 알아야 합니다. 우리가 이미 알고 있는 정규분포함수로 시작해서 접근해 봅시다. 정규분포함수는 '확률밀도함수'입니다. x축이 변수(키,몸무게 등), y축이 확률밀도값입니다. 정규분포함수를 f(x)라고 했을 때, 누적분포함수 F(x)를 아래와 같이 정의할 수 있습니다. 

 

 

이때 F(x) 값은, x 이하인 데이터의 비율(또는 x보다 같거나 작은 값이 뽑힐 확률)입니다. y축의 값은 '확률'입니다. 누적분포함수 F(x)의 역함수를 I(x)라고 하겠습니다. 변수 x는 확률입니다. I(x)의 값이 A가 나왔다면 A보다 같거나 작은 데이터의 비율이 x가 되는 A값을 구한 것이 됩니다. x자리에 0.25를 넣으면 어떻게 될까요. I(0.25)는 I(0.25)보다 같거나 작은 데이터의 비율이 25%(0.25)가 되는 값입니다. 따라서 I(0.25)는 일사분위수가 됩니다. I(x)가 뭐였죠? 역누적분포함수입니다. 따라서 역누적분포함수는 확률-분위수 그래프와 동일합니다. 

 

 

반응형

댓글