이항분포를 이용하여 정규분포를 유도하고 있습니다. 지난시간에 유도한 내용을 간단히 요약합시다. 이항분포를 $f(r)$에서 $g(r)=\ln f(r)$ 로 놓고 $g(r)$을 구하였습니다. 이를 1번 식이라고 하였습니다.
$\begin{align}
g(r)&=n\ln n-r\ln r- (n-r)\ln (n-r) \\
&+\frac{1}{2}\ln( n)-\frac{1}{2}\ln(r)-\frac{1}{2}\ln(2\pi ) -\frac{1}{2}\ln((n-r)) \\
&+r\ln p +(n-r)\ln q
\end{align}$ (1번식)
$g(r)$의 미분을 구했습니다. 2번 식이라고 하였습니다.
$\begin{align}
g'(r)&=-\ln r+\ln (n-r) \\
&-\frac{1}{2r} -\frac{1}{2(n-r)} \\
&+\ln \frac{p}{q}
\end{align}$ (2번식)
$g(r)$의 두번 미분도 구했습니다. 3번 식이라고 하였습니다.
$\begin{align}
g''(r)&=-\frac{1}{r}-\frac{1}{(n-r)} \\
&+\frac{1}{2r^2} +\frac{1}{2(n-r)^2}
\end{align}$ (3번식)
함수 $g(r)$ 에서 $r=np$ 인 테일러근사를 취하면 아래와 같습니다. 2차항까지만 근사하였습니다. 4번 식이라고 놓겠습니다.
$g(r)=g(np)+g'(np)(r-np)+\frac{g''(np)}{2!}(r-np)^2$ (4번식)
위 식에 포함되어 있는 $g(np)$, $g'(np)$, $g''(np)$ 는 1,2,3번 식의 r 자리에 np를 대입하여 구할 수 있습니다. 먼저 $g(np)$를 구해봅시다.
$g(np)$ 구하기
$\begin{align}
g(np)&=n\ln n-np\ln np-(n-np)\ln(n-np)\\
&+\frac{1}{2}\ln(n)-\frac{1}{2}\ln(np)-\frac{1}{2}\ln(n-np)-\frac{1}{2}\ln(2\pi)\\
&+np\ln p+(n-np)\ln q
\end{align}$
$n-np$를 $n(1-p)$로 묶고, $1-p$를 q로 바꿔서 정리합니다. 따라서 $n-np$ 는 $nq$가 됩니다.
$\begin{align}
g(np)&=n\ln n-np\ln np-nq\ln nq\\
&+\frac{1}{2}\ln(n)-\frac{1}{2}\ln(np)-\frac{1}{2}\ln(nq)-\frac{1}{2}\ln(2\pi)\\
&+np\ln p+nq\ln q
\end{align}$
위 식 첫째줄의 로그 np와 로그 nq 를 아래와 같이 분리해서 써줍니다.
$\begin{align}
g(np)&=n\ln n-np\ln n-np\ln p-nq\ln n-nq\ln q\\
&+\frac{1}{2}\ln(n)-\frac{1}{2}\ln(np)-\frac{1}{2}\ln(nq)-\frac{1}{2}\ln(2\pi)\\
&+np\ln p+nq\ln q
\end{align}$
위 식 첫째줄과 셋째줄에 있는 $np\ln p$ 와 $np\ln q$를 소거해줍니다.
$\begin{align}
g(np)&=n\ln n-np\ln n-nq\ln n\\
&+\frac{1}{2}\ln(n)-\frac{1}{2}\ln(np)-\frac{1}{2}\ln(nq)-\frac{1}{2}\ln(2\pi)\\
\end{align}$
위 식 우변의 첫 두 항을 아래와 같이 묶어줍니다.
$\begin{align}
g(np)&=(n-np)\ln n-nq\ln n\\
&+\frac{1}{2}\ln(n)-\frac{1}{2}\ln(np)-\frac{1}{2}\ln(nq)-\frac{1}{2}\ln(2\pi)\\
\end{align}$
$n-np$를 $nq$로 바꿔줍니다.
$\begin{align}
g(np)&=nq\ln n-nq\ln n\\
&+\frac{1}{2}\ln(n)-\frac{1}{2}\ln(np)-\frac{1}{2}\ln(nq)-\frac{1}{2}\ln(2\pi)\\
\end{align}$
우변의 첫 두 항을 소거합니다.
$\begin{align}
g(np)&=\frac{1}{2}\ln(n)-\frac{1}{2}\ln(np)-\frac{1}{2}\ln(nq)-\frac{1}{2}\ln(2\pi)\\
\end{align}$
우변을 하나의 로그로 합쳐줍니다.
$g(np)=\frac{1}{2}\ln\left( \frac{n}{2\pi npnq} \right)$
우변 괄호 안에서 n을 약분해줍니다.
$g(np)=\frac{1}{2}\ln\left( \frac{1}{2\pi npq} \right)$
$\frac{1}{2}$을 로그 진수의 지수부분으로 올려서 아래와 같이 변형합니다.
$g(np)=\ln\left( \frac{1}{\sqrt{2\pi npq}} \right)$ (5번 식)
$g(np)$를 구했습니다. 위 식을 5번식이라고 하겠습니다.
이번에는 $g'(np)$를 구해봅시다.
$g'(np)$ 구하기
2번 식의 r 자리에 np 를 넣으면 아래와 같습니다.
$\begin{align}
g'(np)&=-\ln np+\ln (n-np) \\
&-\frac{1}{2np} -\frac{1}{2(n-np)} \\
&+\ln \frac{p}{q}
\end{align}$
$n-np$를 $nq$로 바꿔줍니다.
$\begin{align}
g'(np)&=-\ln np+\ln (nq) \\
&-\frac{1}{2np} -\frac{1}{2(nq)} \\
&+\ln \frac{p}{q}
\end{align}$
아래와 같이 변형합니다.
$g'(np)=\ln \frac{q}{p}+\frac{1}{2n}\left( \frac{1}{q}-\frac{1}{p} \right)+\ln \frac{p}{q}$
위 우변의 첫항과 세번째 항을 계산하면 $\ln 1$ 이되고, 이 값은 0입니다. 따라서 아래와 같이 계산됩니다.
$g'(np)=\frac{1}{2n}\left( \frac{1}{q}-\frac{1}{p} \right)$
위 식의 우변을 통분합시다.
$g'(np)=\frac{p-q}{2npq}$ (6번 식)
$g'(np)$를 구했습니다. 위 식을 6번 식이라고 하겠습니다.
$g''(np)$ 구하기
3번 식의 r 자리에 np 를 넣으면 아래와 같습니다.
$g''(np)=-\frac{1}{np}-\frac{1}{(n-np)}+\frac{1}{2(np)^2} +\frac{1}{2(n-np)^2}$
$n-np$를 $nq$로 바꿔줍니다.
$g''(np)=-\frac{1}{np}-\frac{1}{nq}+\frac{1}{2(np)^2} +\frac{1}{2(nq)^2}$
차수가 같은 항 끼리 통분합시다.
$g''(np)=-\frac{1}{npq}+\frac{p^2+q^2}{2(npq)^2}$ (7번 식)
$g'(np)$를 구했습니다. 위 식을 7번 식이라고 하겠습니다.
$g(r)$ 구하기
5,6,7번 식을 4번 식에 대입합시다.
$g(r)=\ln\frac{1}{\sqrt{2\pi npq}}+\frac{p-q}{2npq}(r-np)+\frac{1}{2!}\left( -\frac{1}{npq}+\frac{p^2+q^2}{2(npq)^2} \right)(r-np)^2$
우변을 아래와 같이 전개합니다.
$\begin{align}
g(r)&=\ln\frac{1}{\sqrt{2\pi npq}}+\frac{p-q}{2npq}(r)-\frac{p-q}{2npq}(np)\\
&+\frac{1}{2!}\left( -\frac{1}{npq}\right)(r-np)^2+\frac{1}{2!}\left(\frac{p^2+q^2}{2(npq)^2} \right)(r-np)^2
\end{align}$
위 다섯개의 항 중에서 n이 무한대로 갈 때 무한대로 발산하는 항만 남기면 아래와 같습니다. 나머지 항은 상대적으로 크기가 작으므로 무시할 수 있습니다.
$g(r)=\ln\frac{1}{\sqrt{2\pi npq}}+\frac{1}{2!}\left( -\frac{1}{npq}\right)(r-np)^2$
우변의 두번째 항을 아래와 같이 변형합니다.
$g(r)=\ln\frac{1}{\sqrt{2\pi npq}} -\frac{1}{2npq}(r-np)^2$
$g(r)$을 다시 $ln f(r)$ 로 돌려놓습니다.
$\ln f(r)=\ln\frac{1}{\sqrt{2\pi npq}} -\frac{1}{2npq}(r-np)^2$
아래와 같이 변형합니다.
$f(r)=e^{\ln\frac{1}{\sqrt{2\pi npq}} -\frac{1}{2npq}(r-np)^2}$
아래와 같이 분리합시다.
로그의 성질을 이용하여 우변의 첫 항을 아래와 같이 변형합니다.
$f(r)=\frac{1}{\sqrt{2\pi npq}}
e^{ -\frac{1}{2npq}(r-np)^2}$
이항분포 $B(n,p)$ 의 평균과 분산은 아래와 같습니다.
$\mu=np$
$\sigma^2=npq$
유도하던 식에 대입합시다.
$f(r)=\frac{1}{\sqrt{2\pi}\sigma}
e^{ -\frac{1}{2\sigma^2}(r-\mu)^2}$
정규분포 함수가 유도되었습니다.
#강의 영상
'@ 필수과목 > 손으로 푸는 통계' 카테고리의 다른 글
[손으로 푸는 통계] 23. 통계적 가설 검정 감잡기 3 (유의수준 α, 유의확률 p-value) (0) | 2018.05.16 |
---|---|
[손으로 푸는 통계] 22. 통계적 가설 검정 감잡기 2 (1표본 Z검정) (1) | 2018.05.12 |
[손으로 푸는 통계] 21. 통계적 가설 검정 감잡기 1 (귀무가설, 대립가설) (0) | 2018.05.10 |
[손으로 푸는 통계] 20. 정규분포를 유도하며 알게 된 것들 (3) | 2018.04.14 |
[손으로 푸는 통계] 18. 정규분포함수 유도하기 (방법2. 이항분포 이용 1/2) (5) | 2018.04.12 |
[손으로 푸는 통계] 17. 이항분포의 평균과 분산 (5) | 2018.04.12 |
[손으로 푸는 통계] 16. 정규분포 함수 유도 (방법1. 과녁맞추기를 이용한 유도 2/2) (16) | 2018.03.25 |
[손으로 푸는 통계] 15. 정규분포 함수 유도 (방법1. 과녁맞추기를 이용한 유도 1/2) (13) | 2018.03.25 |
댓글