본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계] 19. 정규분포함수 유도하기 (방법2. 이항분포 이용 2/2)

by bigpicture 2018. 4. 12.
반응형

이항분포를 이용하여 정규분포를 유도하고 있습니다. 지난시간에 유도한 내용을 간단히 요약합시다. 이항분포를 $f(r)$에서 $g(r)=\ln f(r)$ 로 놓고 $g(r)$을 구하였습니다. 이를 1번 식이라고 하였습니다. 

$\begin{align}
g(r)&=n\ln n-r\ln r- (n-r)\ln (n-r) \\
&+\frac{1}{2}\ln( n)-\frac{1}{2}\ln(r)-\frac{1}{2}\ln(2\pi ) -\frac{1}{2}\ln((n-r)) \\
&+r\ln p +(n-r)\ln q
\end{align}$    (1번식)

$g(r)$의 미분을 구했습니다. 2번 식이라고 하였습니다. 

$\begin{align}
g'(r)&=-\ln r+\ln (n-r) \\
&-\frac{1}{2r} -\frac{1}{2(n-r)} \\
&+\ln \frac{p}{q}
\end{align}$    (2번식)

$g(r)$의 두번 미분도 구했습니다. 3번 식이라고 하였습니다. 

$\begin{align}
g''(r)&=-\frac{1}{r}-\frac{1}{(n-r)} \\
&+\frac{1}{2r^2} +\frac{1}{2(n-r)^2}
\end{align}$   (3번식)

함수 $g(r)$ 에서 $r=np$ 인 테일러근사를 취하면 아래와 같습니다. 2차항까지만 근사하였습니다. 4번 식이라고 놓겠습니다.

$g(r)=g(np)+g'(np)(r-np)+\frac{g''(np)}{2!}(r-np)^2$    (4번식)

위 식에 포함되어 있는 $g(np)$, $g'(np)$, $g''(np)$ 는 1,2,3번 식의 r 자리에 np를 대입하여 구할 수 있습니다. 먼저 $g(np)$를 구해봅시다.

 

$g(np)$ 구하기

$\begin{align}
g(np)&=n\ln n-np\ln np-(n-np)\ln(n-np)\\
&+\frac{1}{2}\ln(n)-\frac{1}{2}\ln(np)-\frac{1}{2}\ln(n-np)-\frac{1}{2}\ln(2\pi)\\
&+np\ln p+(n-np)\ln q
\end{align}$

$n-np$를 $n(1-p)$로 묶고, $1-p$를 q로 바꿔서 정리합니다. 따라서 $n-np$ 는 $nq$가 됩니다.

$\begin{align}
g(np)&=n\ln n-np\ln np-nq\ln nq\\
&+\frac{1}{2}\ln(n)-\frac{1}{2}\ln(np)-\frac{1}{2}\ln(nq)-\frac{1}{2}\ln(2\pi)\\
&+np\ln p+nq\ln q
\end{align}$

위 식 첫째줄의 로그 np와 로그 nq 를 아래와 같이 분리해서 써줍니다. 

$\begin{align}
g(np)&=n\ln n-np\ln n-np\ln p-nq\ln n-nq\ln q\\
&+\frac{1}{2}\ln(n)-\frac{1}{2}\ln(np)-\frac{1}{2}\ln(nq)-\frac{1}{2}\ln(2\pi)\\
&+np\ln p+nq\ln q
\end{align}$

위 식 첫째줄과 셋째줄에 있는 $np\ln p$ 와 $np\ln q$를 소거해줍니다. 

$\begin{align}
g(np)&=n\ln n-np\ln n-nq\ln n\\
&+\frac{1}{2}\ln(n)-\frac{1}{2}\ln(np)-\frac{1}{2}\ln(nq)-\frac{1}{2}\ln(2\pi)\\
\end{align}$

위 식 우변의 첫 두 항을 아래와 같이 묶어줍니다. 

$\begin{align}
g(np)&=(n-np)\ln n-nq\ln n\\
&+\frac{1}{2}\ln(n)-\frac{1}{2}\ln(np)-\frac{1}{2}\ln(nq)-\frac{1}{2}\ln(2\pi)\\
\end{align}$

$n-np$를 $nq$로 바꿔줍니다. 

$\begin{align}
g(np)&=nq\ln n-nq\ln n\\
&+\frac{1}{2}\ln(n)-\frac{1}{2}\ln(np)-\frac{1}{2}\ln(nq)-\frac{1}{2}\ln(2\pi)\\
\end{align}$

우변의 첫 두 항을 소거합니다. 

$\begin{align}
g(np)&=\frac{1}{2}\ln(n)-\frac{1}{2}\ln(np)-\frac{1}{2}\ln(nq)-\frac{1}{2}\ln(2\pi)\\
\end{align}$

우변을 하나의 로그로 합쳐줍니다. 

$g(np)=\frac{1}{2}\ln\left( \frac{n}{2\pi npnq} \right)$

우변 괄호 안에서 n을 약분해줍니다. 

$g(np)=\frac{1}{2}\ln\left( \frac{1}{2\pi npq} \right)$

$\frac{1}{2}$을 로그 진수의 지수부분으로 올려서 아래와 같이 변형합니다. 

$g(np)=\ln\left( \frac{1}{\sqrt{2\pi npq}} \right)$     (5번 식)

$g(np)$를 구했습니다. 위 식을 5번식이라고 하겠습니다. 

이번에는 $g'(np)$를 구해봅시다. 

 

$g'(np)$ 구하기

2번 식의 r 자리에 np 를 넣으면 아래와 같습니다. 

$\begin{align}
g'(np)&=-\ln np+\ln (n-np) \\
&-\frac{1}{2np} -\frac{1}{2(n-np)} \\
&+\ln \frac{p}{q}
\end{align}$

$n-np$를 $nq$로 바꿔줍니다. 

$\begin{align}
g'(np)&=-\ln np+\ln (nq) \\
&-\frac{1}{2np} -\frac{1}{2(nq)} \\
&+\ln \frac{p}{q}
\end{align}$

아래와 같이 변형합니다. 

$g'(np)=\ln \frac{q}{p}+\frac{1}{2n}\left( \frac{1}{q}-\frac{1}{p} \right)+\ln \frac{p}{q}$

위 우변의 첫항과 세번째 항을 계산하면 $\ln 1$ 이되고, 이 값은 0입니다. 따라서 아래와 같이 계산됩니다. 

$g'(np)=\frac{1}{2n}\left( \frac{1}{q}-\frac{1}{p} \right)$ 

위 식의 우변을 통분합시다.

$g'(np)=\frac{p-q}{2npq}$   (6번 식)

$g'(np)$를 구했습니다. 위 식을 6번 식이라고 하겠습니다. 

 

$g''(np)$ 구하기

3번 식의 r 자리에 np 를 넣으면 아래와 같습니다. 

$g''(np)=-\frac{1}{np}-\frac{1}{(n-np)}+\frac{1}{2(np)^2} +\frac{1}{2(n-np)^2}$

$n-np$를 $nq$로 바꿔줍니다. 

$g''(np)=-\frac{1}{np}-\frac{1}{nq}+\frac{1}{2(np)^2} +\frac{1}{2(nq)^2}$

차수가 같은 항 끼리 통분합시다. 

$g''(np)=-\frac{1}{npq}+\frac{p^2+q^2}{2(npq)^2}$   (7번 식)

$g'(np)$를 구했습니다. 위 식을 7번 식이라고 하겠습니다. 

$g(r)$ 구하기

5,6,7번 식을 4번 식에 대입합시다. 

$g(r)=\ln\frac{1}{\sqrt{2\pi npq}}+\frac{p-q}{2npq}(r-np)+\frac{1}{2!}\left( -\frac{1}{npq}+\frac{p^2+q^2}{2(npq)^2} \right)(r-np)^2$

우변을 아래와 같이 전개합니다. 

$\begin{align}
g(r)&=\ln\frac{1}{\sqrt{2\pi npq}}+\frac{p-q}{2npq}(r)-\frac{p-q}{2npq}(np)\\
&+\frac{1}{2!}\left( -\frac{1}{npq}\right)(r-np)^2+\frac{1}{2!}\left(\frac{p^2+q^2}{2(npq)^2} \right)(r-np)^2
\end{align}$

위 다섯개의 항 중에서 n이 무한대로 갈 때 무한대로 발산하는 항만 남기면 아래와 같습니다. 나머지 항은 상대적으로 크기가 작으므로 무시할 수 있습니다. 

$g(r)=\ln\frac{1}{\sqrt{2\pi npq}}+\frac{1}{2!}\left( -\frac{1}{npq}\right)(r-np)^2$

우변의 두번째 항을 아래와 같이 변형합니다. 

$g(r)=\ln\frac{1}{\sqrt{2\pi npq}} -\frac{1}{2npq}(r-np)^2$

$g(r)$을 다시 $ln f(r)$ 로 돌려놓습니다. 

$\ln f(r)=\ln\frac{1}{\sqrt{2\pi npq}} -\frac{1}{2npq}(r-np)^2$

아래와 같이 변형합니다. 

$f(r)=e^{\ln\frac{1}{\sqrt{2\pi npq}} -\frac{1}{2npq}(r-np)^2}$

아래와 같이 분리합시다. 

로그의 성질을 이용하여 우변의 첫 항을 아래와 같이 변형합니다. 

$f(r)=\frac{1}{\sqrt{2\pi npq}}
e^{ -\frac{1}{2npq}(r-np)^2}$

이항분포 $B(n,p)$ 의 평균과 분산은 아래와 같습니다. 

$\mu=np$
$\sigma^2=npq$

유도하던 식에 대입합시다. 

$f(r)=\frac{1}{\sqrt{2\pi}\sigma}
e^{ -\frac{1}{2\sigma^2}(r-\mu)^2}$

정규분포 함수가 유도되었습니다. 

 

#강의 영상

 

반응형

댓글