정규분포 함수 유도 (방법1. 과녁맞추기를 이용한 유도 1/2)
지난 세 강에 걸쳐서 표본의 크기 n이 충분히 클 때 표본평균의 분포가 정규분포를 따른다는 것을 유도했습니다. 정규분포는 당연히 알고 있다는 듯 사용했지만, 우리는 정규분포가 어디에서 왔는지 모릅니다.
정규분포함수는 고등학교 확률과 통계시간에 처음 배웠던걸로 기억합니다. 고등학교 시절 정규분포를 접했을 때, 도데체 이 함수가 어디서 온 것인지 궁금했었습니다. 정규분포가 우리 주변에 여러곳에서 발견된다는 이야기를 듣고, 이와 비슷한 모양의 함수를 찾은 것인가 생각하기도 했습니다. 언젠가 꼭 이유를 밝혀보고 싶다는 생각을 갖고 있었는데요. 우연히 통계 유튜브와 블로그를 시작하게 됐고, 결국 궁금증을 해결할 수 있었습니다.
제가 찾은 정규분포 유도 방법은 두 가지 입니다.
- 과격 맞추기를 이용한 유도
- 이항분포를 이용한 유도
두 유도방법 모두 정규분포가 무엇인가에 대한 통찰을 제공합니다. 먼저 각 방법으로 유도 하고 나서, 정규분포의 의미에 대한 이야기를 해보도록 합시다.
과녁맞추기를 이용한 유도 (1/2)
아래 그림처럼 xy 평면에 과녁이 하나 놓여있다고 합시다.

우리가 화살쏘기에 숙련된 전문가라고 가정합시다. 중앙을 겨냥해서 화살을 쏠 것입니다. 아무리 전문가라고 해도 항상 과녁 중앙에 화살을 맞출 수는 없습니다. 아래 그림 처럼 화살이 빗나가는 경우도 있을 것입니다.

이 상황을 확률분포로 만들어봅시다. 확률분포로 만들기 위해 두가지 가정을 하겠습니다.
1) 과녁의 중심에서 멀어질 수록 맞출 확률이 낮다.
2) 과녁의 중심에서 거리가 같은 두 점이 있다면, 이 두 점의 확률은 동일하다.
과녁 위 어느 한 점에 맞을 확률을 생각해봅시다. 확률변수는 와 입니다. 확률은 로 정의될 텐데요. X와 Y가 연속확률변수이므로, 확률밀도함수를 갖습니다. 라고 놓겠습니다. 와 같은 의미입니다.
확률밀도함수를 전체 구간(도메인)에 대해 적분한 값은 1입니다. 따라서 아래 등식이 성립합니다.
x의 주변확률분포
확률밀도함수 를 y의 전체구간에 대해 적분해봅시다.
y에 대해 정적분을 한 것이므로, 결과는 x만의 함수가 됩니다. 계산 결과를 라고 놓겠습니다.
x의 주변확률분포라고 합니다. 이 함수의 의미를 생각해봅시다. x에 어떤 값 a를 대입해봅시다. 인데요. 는 아래 그림과 같이 인 선 위에 화살이 맞을 확률밀도를 의미합니다.

y의 주변확률분포
확률밀도함수 를 x의 전체구간에 대해 적분해봅시다.
x에 대해 정적분을 한 것이므로, 결과는 y만의 함수가 됩니다. 계산 결과를 라고 놓겠습니다.
y의 주변확률분포라고 합니다. 이 함수의 의미를 생각해봅시다. y에 어떤 값 a를 대입해봅시다. 인데요. 는 인 선 위에 화살이 맞을 확률밀도를 의미합니다.
원점으로 부터의 거리에 따라 확률이 변한다고 가정했기 때문에, x방향으로 멀어지는 것과 y방향으로 멀어지는 것의 영향이 동일합니다. 따라서 와 는 동일한 함수입니다. 앞으로는 아래첨자를 생략하고 라고 놓겠습니다.
독립성 가정
한가지 가정을 추가합시다. 확률변수 x와 y가 서로 독립이라는 가정입니다. 독립성 가정에 의해 아래 등식이 성립합니다. (참고: hsm-edu.tistory.com/1178?category=770915)
화살을 쏘는 상황에서 두 확률변수가 독립이라는 것을 직관적으로 어떻게 이해할 수 있는가 생각해보는 것도 흥미로운 주제입니다. 다루지는 않겠지만 한번 고민해봅시다.
거리가 r인 곳의 확률밀도 함수
함수를 하나 더 정의하겠습니다. 과녁의 중심에서 부터 거리가 인 곳의 확률밀도를 이라고 놓겠습니다. 여기서 주의할 점은 이 거리가 r인 어느 한 지점의 확률밀도라는 것입니다. 거리가 r인 지점들의 자취인 '원'의 확률밀도가 아닙니다. 원점에서 부터의 거리가 인 어떤 좌표를 라고 놓는다면 아래 등식이 성립합니다.

확률변수 x,y가 서로 독립이므로 아래 등식이 성립합니다.
이때 x축과 r방향 사이의 각도를 라고 놓는다면 x와 y를 아래와 같이 나타낼 수 있습니다.
식의 양변을 로 미분하겠습니다. 은 와 무관한 함수이므로 미분하면 0이 됩니다.
체인룰을 적용합시다.
아래와 같이 변형합시다.
아래와 같이 로 미분된 항에 있는 와 를 과 에 대한 식으로 바꿔줍니다.
로 미분합시다.
아래와 같이 양변을 정리합시다.
r을 약분합시다.
는 이므로 아래와 같이 변형합시다.
는 이므로 아래와 같이 변형할 수 있습니다.
로 양변을 나눠줍시다.
x와 y에는 모든 실수가 올 수 있기 때문에, 어떤 값을 넣어도 위 등식이 성립한다는 의미입니다. 만약 좌변이 x에 대한 변수이고, 우변이 y에 대한 변수라면 등식이 성립하지 않는 경우가 존재하게 됩니다. 따라서 좌변과 우변은 상수입니다.
x에 대해서만 생각해봅시다. 아래 등식입니다.
양변에 x를 곱해줍시다.
양변을 x에 대해 적분합시다.
f(x)에 대해 정리하면 아래와 같습니다.
는 상수이므로, 상수 A로 간단히 표현하겠습니다.
다음시간에는 상수 A와 C를 구해봅시다.
#강의 영상
'@ 필수과목 > 손으로 푸는 통계' 카테고리의 다른 글
[손으로 푸는 통계] 19. 정규분포함수 유도하기 (방법2. 이항분포 이용 2/2) (4) | 2018.04.12 |
---|---|
[손으로 푸는 통계] 18. 정규분포함수 유도하기 (방법2. 이항분포 이용 1/2) (5) | 2018.04.12 |
[손으로 푸는 통계] 17. 이항분포의 평균과 분산 (5) | 2018.04.12 |
[손으로 푸는 통계] 16. 정규분포 함수 유도 (방법1. 과녁맞추기를 이용한 유도 2/2) (16) | 2018.03.25 |
[손으로 푸는 통계] 14. 중심극한정리 증명 (#3. 표본평균의 적률생성함수) (22) | 2018.03.24 |
[손으로 푸는 통계] 13. 중심극한정리 증명 (#2. 정규분포의 적률생성함수) (0) | 2018.03.24 |
[손으로 푸는 통계] 12. 중심극한정리 증명 (#1. 확률분포가 같을 조건) (6) | 2018.03.24 |
[손으로 푸는 통계] 11. 적률생성함수 (중심극한정리를 위한 재료 #2) (5) | 2018.03.24 |
댓글
bigpicture님의
글이 좋았다면 응원을 보내주세요!
이 글이 도움이 됐다면, 응원 댓글을 써보세요. 블로거에게 지급되는 응원금은 새로운 창작의 큰 힘이 됩니다.
응원 댓글은 만 14세 이상 카카오계정 이용자라면 누구나 편하게 작성, 결제할 수 있습니다.
글 본문, 댓글 목록 등을 통해 응원한 팬과 응원 댓글, 응원금을 강조해 보여줍니다.
응원금은 앱에서는 인앱결제, 웹에서는 카카오페이 및 신용카드로 결제할 수 있습니다.