본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계] 20. 정규분포를 유도하며 알게 된 것들

by bigpicture 2018. 4. 14.
반응형

고등학교에서 정규분포를 처음 배울 때 함수의 수식부터 배웠떤 기억이 있습니다. 이어서 정규분포의 성질들을 배웠습니다. 정규분포의 모양ㅇ느 종을 엎어놓은 모양이고, 표준편차가 작아질 수록 얇고 높아진다 등을 배웠습니다.

그 당시 정규분포의 유도과정이 궁금했었는데 왜 선생님에게 질문을 하지 않았었는지는 기억이 안납니다. 나름대로 내렸던 결론은 유도과정이 없고 여러 현상에서 발견되는 분포들을 수학적으로 fitting 하여 찾아냈을 것이라 생각했었습니다. 

졸업 후 한참이 지난 20대 후반에 취미로 통계공부를 시작했고, 정규분포의 유도과정이 있다는 것을 알았습니다. 제가 찾은 방법은 두 가지였고 지난시간까지 두 방법 모두 다뤘습니다. 두 방법은 아래와 같습니다. 

방법1. 과녁 맞추기를 이용한 유도
방법2. 이항분포를 이용한 유도

 

방법1의 관점

과녁의 중앙을 맞추려고 하는 시도를 확률분포로 만들었을 때 정규분포가 되었습니다. 과녁의 중앙을 참 값이라고 놓고 중앙을 벗어난 값을 오차라고 해석한다면, 정규분포는 참값과 오차의 분포라고 볼 수 있습니다. 

정규분포가 자연과 사회의 많은 현상을 설명하는 이유가 참값과 오차를 표현했기 때문이라고 생각합니다. 현실에서 우리가 다루는 많은 상황에는 이상적인 목표값이 있습니다. 제품을 생산할 때 길이를 30cm 로 가공해야 하는 상황, 음료수를 병에 담을 때 부피를 1L 로 해야하는 상황 등이 있습니다. 최선을 다해 정확히 제품을 가공하고, 병에 음료를 담는다고 해도 오차가 발생하게 되죠. 그래도 목표값 근처가 많이 발생할 거구요. 목표값에서 멀어질 수록 발생할 확률은 작아집니다. 결과적으로 정규분포의 형태를 띄게 됩니다. 

 

방법2의 관점

이항분포에서 시행횟수를 늘리면 정규분포가 되었습니다. 동전을 던지는 상황을 생각해봅시다. 동전을 n번 던졌을 때, 앞면이 나오는 횟수 x의 분포가 이항분포입니다. 앞면이 나올 확률이 0.5이므로 100번 던지면 절반인 50번 앞면이 나오리라 기대할 수 있습니다. 물론 100번 던졌을 때 앞면이 한번만 나올 수도 있지만 그럴 확률은 낮습니다. 기댓값인 50에서 멀어질 수록 발생확률이 희박해집니다. 평균에서 멀어질 수록 발생확률이 낮다는 것은 방법1에서 유도한 정규분포의 생성원리와 같습니다. 

 

더 생각해볼 내용

몸무게와 키 등이 정규분포를 따르는 것은 어떻게 설명해야 할까요. 신이 인간의 DNA를 만들 때, 평균 근처가 많이 발생하도록 의도해 놓은 것이라 이해해야 할까요? 저도 아직 답을 모릅니다. 언젠가 알게 될 날을 기대해봅니다. 

 

 

#강의 영상

 

반응형

댓글