지난 강의에서 Q-Q plot의 원리에 대해서 알아보았습니다. 오늘은 실제 예시를 통해 직접 그려보도록 하겠습니다. 아래와 같이 크기가 같은 두 데이터를 예로 들겠습니다.
Data 1 : 24,28,37,43,46
Data 2 : 14,17,23,44,57
각각을 순위 또는 순서를 이용해서 표현해봅시다.
Data 1 : x1, x2, x3, x4, x5
Data 2 : x1, x2, x3, x4, x5
만약 이 순서로 확률-분위수 그래프를 그린다면, 두 데이터에서 동일한 그래프가 그려질 것입니다. type에 상관없이 같아집니다. 따라서 x1에 해당되는 24와 14에 해당되는 확률이 같습니다. 24와 14가 같은 분위수라는 것입니다. 이와 동일한 이유로 28과 17, 37과 23, 43과 44, 46과 57는 같은 분위수가 됩니다. 따라서 Q-Q plot을 그릴 때, 같은 순서의 수를 서로 연결해주기만 하면 됩니다.
두 데이터의 분위수가 서로 선형관계를 이루는지 확인하기 위해서 직선을 그려줍시다. RMSE(root mean square error)를 선형회귀선을 구하면 됩니다. 원리는 링크로 달아놓겠습니다. (https://www.youtube.com/watch?v=KO2Tbadd0mk)
댓글
bigpicture님의
글이 좋았다면 응원을 보내주세요!
이 글이 도움이 됐다면, 응원 댓글을 써보세요. 블로거에게 지급되는 응원금은 새로운 창작의 큰 힘이 됩니다.
응원 댓글은 만 14세 이상 카카오계정 이용자라면 누구나 편하게 작성, 결제할 수 있습니다.
글 본문, 댓글 목록 등을 통해 응원한 팬과 응원 댓글, 응원금을 강조해 보여줍니다.
응원금은 앱에서는 인앱결제, 웹에서는 카카오페이 및 신용카드로 결제할 수 있습니다.