본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계] 18. 정규분포함수 유도하기 (방법2. 이항분포 이용 1/2)

by bigpicture 2018. 4. 12.
반응형

정규분포 함수를 유도하는 방법은 두가지가 있고 아래와 같습니다. 

1) 과녁 맞추기를 이용한 유도 
2) 이항분포를 이용한 유도

15,16강에서 1번 방법으로 정규분포를 유도하였습니다. 이번 강의부터 2번 방법으로 정규분포를 유도하겠습니다. 내용이 많아서 이번강의와 다음강의 둘로 나눠서 설명하겠습니다. 

이항분포를 정규분포로 근사시키는 방법을 통해 정규분포를 유도하겠습니다. 이항분포 $B(n,p)$의 확률질량함수는 아래와 같습니다. 

$f(r)=_{n}C_{r}p^rq^{n-r}$

확률변수를 r로 놓았습니다. 위 식에서 조합으로 표현된 부분을 팩토리얼 형태로 바꿔줍시다. 

$f(r)=\frac{n!}{r!(n-r)!}p^rq^{n-r}$

양변에 자연로그를 취해줍니다. 

$\ln f(r)=\ln n!-\ln r! -\ln(n-r)!+\ln p^r +\ln q^{n-r}$

'스털링 근사(stirling's approximation)'라는 기법을 적용합시다. 스탈링근사는 아래와 같습니다. 

$\ln n!=n\ln n -n+\frac{1}{2}$

스탈링 근사를 이용하여 유도하던 식을 아래와 같이 변형합시다.

 

$\begin{align}
\ln f(r)=&n\ln n-n+\frac{1}{2}\ln(2\pi n)\\
&-\left\{ r\ln r-r+\frac{1}{2}\ln(2\pi r) \right\} \\
&-\left\{ (n-r)\ln (n-r)-(n-r)+\frac{1}{2}\ln(2\pi (n-r)) \right\}\\
&+r\ln p \\
& +(n-r)\ln q
\end{align}$

$\ln f(r)$을 $g(r)$로 치환합니다. 

$\begin{align}
g(r)&=n\ln n-n+\frac{1}{2}\ln(2\pi n) \\
&-\left\{ r\ln r-r+\frac{1}{2}\ln(2\pi r) \right\}\\
&-\left\{ (n-r)\ln (n-r)-(n-r)+\frac{1}{2}\ln(2\pi (n-r)) \right\} \\
&+r\ln p \\ 
&+(n-r)\ln q \\
\end{align}$

괄호를 풀어줍니다. 

$\begin{align}
g(r)&=n\ln n-n+\frac{1}{2}\ln(2\pi n) \\
&-r\ln r+r-\frac{1}{2}\ln(2\pi r) \\
&- (n-r)\ln (n-r)+(n-r)-\frac{1}{2}\ln(2\pi (n-r)) \\
&+r\ln p \\
&+(n-r)\ln q 
\end{align}$

소거 가능한 항은 소거해줍니다. n 과 r을 소거할 수 있습니다. 

$\begin{align}
g(r)&=n\ln n+\frac{1}{2}\ln(2\pi n)\\
&-r\ln r-\frac{1}{2}\ln(2\pi r) \\
&- (n-r)\ln (n-r)-\frac{1}{2}\ln(2\pi (n-r)) \\
&+r\ln p \\
&+(n-r)\ln q
\end{align}$

아래와 같이 순서를 바꿔서 정리해줍니다. 

$\begin{align}
g(r)&=n\ln n-r\ln r- (n-r)\ln (n-r)\\
&+\frac{1}{2}\ln(2\pi n)-\frac{1}{2}\ln(2\pi r)-\frac{1}{2}\ln(2\pi (n-r)) \\
&+r\ln p +(n-r)\ln q
\end{align}$

우변의 4,5,6항을 로그 합공식을 사용하여 각각 둘로 분리해줍니다. 

$\begin{align}
g(r)&=n\ln n-r\ln r- (n-r)\ln (n-r) \\
&+\frac{1}{2}\ln(2\pi)+\frac{1}{2}\ln( n)-\frac{1}{2}\ln(2\pi)-\frac{1}{2}\ln(r)-\frac{1}{2}\ln(2\pi ) -\frac{1}{2}\ln((n-r)) \\
&+r\ln p +(n-r)\ln q
\end{align}$

소거 가능한 항을 소거합니다. $\frac{1}{2}\ln(2\pi)$를 소거하였습니다. 

$\begin{align}
g(r)&=n\ln n-r\ln r- (n-r)\ln (n-r) \\
&+\frac{1}{2}\ln( n)-\frac{1}{2}\ln(r)-\frac{1}{2}\ln(2\pi ) -\frac{1}{2}\ln((n-r)) \\
&+r\ln p +(n-r)\ln q
\end{align}$    (1번식)

위 식을 1번식이라고 놓겠습니다. 이제 테일러 근사를 적용할 것입니다. 테일러 근사를 위해 $g'(r)$과 $g''(r)$을 구해야합니다. 먼저 $g'(r)$을 구해봅시다. 

$\begin{align}
g'(r)&=-\ln r-1+\ln (n-r)+1 \\
&-\frac{1}{2r} +\frac{1}{2(n-r)} \\
&+\ln p -\ln q
\end{align}$

1과 -1을 소거합니다. 

$\begin{align}
g'(r)&=-\ln r+\ln (n-r) \\
&-\frac{1}{2r} +\frac{1}{2(n-r)} \\
&+\ln p -\ln q
\end{align}$

마지막 두 항을 로그 하나로 합쳐줍니다. 

$\begin{align}
g'(r)&=-\ln r+\ln (n-r) \\
&-\frac{1}{2r} +\frac{1}{2(n-r)} \\
&+\ln \frac{p}{q}
\end{align}$    (2번식)

위 식을 2번식이라고 놓겠습니다. 한번 더 미분하여 g''(r)을 구합시다. 

$\begin{align}
g''(r)&=-\frac{1}{r}-\frac{1}{(n-r)} \\
&+\frac{1}{2r^2} +\frac{1}{2(n-r)^2}
\end{align}$   (3번식)

위 식을 3번식이라고 놓겠습니다. 오늘은 여기까지 하고, 다음 글에서 이어서 유도하겠습니다. 

 

#영상 강의

반응형

댓글