본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계] 17. 이항분포의 평균과 분산

by bigpicture 2018. 4. 12.
반응형

정규분포의 두가지 유도방법을 공부하고 있습니다. 두가지 유도방법은 아래와 같습니다. 

1) 과녁 맞추기를 이용한 유도
2) 이항분포를 이용한 유도

지난시간까지 1번인 과녁 맞추기를 이용한 유도를 공부해보았습니다. 이제 2번인 이항분포를 이용하여 정규분포를 유도할 차례입니다. 이항분포를 이용하여 정규분포를 유도할 때 이항분포의 평균과 분산이 사용됩니다. 이번시간에는 이항분포의 평균과 분산을 구해봅시다. 

이항분포는 $B(n,p)$ 라고 나타냅니다. B는 binomial distribution 의 첫글자를 딴 것입니다. n은 시행횟수이고 p는 특정 사건이 발생할 확률입니다. 동전던지기를 동전을 100번 던질 때 앞면이 나오는 횟수의 확률분포는 $B(100,0.5)$ 입니다. 이항분포  $B(n,p)$ 를 식으로 써보면 아래와 같습니다. 

$P(X=x)=_{n}C_{x}p^x(1-p)^{n-x}$

이항분포 $B(n,p)$의 평균이 $np$ 이고 분산이 $np(1-p)$라는 것을 고등학교 확률과분포 시간에 배워서 알고 있습니다. 하지만 수학적으로 유도하지는 않았었는데요, 오늘은 이항분포의 평균과 분산을 유도해보겠습니다. 

 

이항분포의 평균

이산확률변수의 평균은 아래와 같이 계산됩니다. 

$E[X]=\sum_{x=0}^{n}x p(x)$

$p(x)$에 이항분포의 확률질량함수를 대입하면 아래와 같습니다. 

$E[X]=\sum_{x=0}^{n}x _{n}C_{x}p^x (1-p)^{n-x}$

x가 0인 경우 전체 항이 0이 되므로 x를 1부터 시작해도 됩니다. 시그마의 $x=0$을 $x=1$로 바꿔줍니다. 

$E[X]=\sum_{x=1}^{n}x _{n}C_{x}p^x (1-p)^{n-x}$

조합을 팩토리얼 식으로 바꿔줍니다. 

$E[X]=\sum_{x=1}^{n}x \frac{n!}{x!(n-x)!} p^x (1-p)^{n-x}$

$x!$ 를 $x(x-1)!$로 바꿔줍니다. 

$E[X]=\sum_{x=1}^{n}x \frac{n!}{x(x-1)!(n-x)!} p^x (1-p)^{n-x}$

$n!$를 $n(n-1)!$로 바꿔줍니다. 

$E[X]=\sum_{x=1}^{n}x \frac{n(n-1)!}{x(x-1)!(n-x)!} p^x (1-p)^{n-x}$

$p^x$를 $pp^{x-1}$로 바꿔줍니다. 

$E[X]=\sum_{x=1}^{n}x \frac{n(n-1)!}{x(x-1)!(n-x)!} pp^{x-1} (1-p)^{n-x}$

x를 약분해줍니다. 

$E[X]=\sum_{x=1}^{n} \frac{n(n-1)!}{(x-1)!(n-x)!} pp^{x-1} (1-p)^{n-x}$

시그마와 무관한 n과 p를 시그마 밖으로 꺼내줍니다. 

$E[X]=np \sum_{x=1}^{n} \frac{(n-1)!}{(x-1)!(n-x)!} p^{x-1} (1-p)^{n-x}$

아래와 같은 치환을 적용하겠습니다. 

$n-1=m$
$x-1=k$
$n-x=m-k$

적용하면 아래와 같습니다. 시그마의 구간도 바꿔주었습니다. 

$E[X]=np \sum_{k=0}^{m} \frac{m!}{k!(m-k)!} p^{k} (1-p)^{m-k}$

위 식의 시그마 항은 $B(m,p)$ 의 전체 확률을 합한 것이므로 1입니다. 따라서 이항분포를 따르는 확률변수의 평균은 아래와 같이 계산됩니다. 

$E[X]=np$

 

이항분포의 분산

분산은 제곱의 평균에서 평균의 제곱을 뺀 값과 같습니다. 

$V[X]=E\left[ X^2 \right]-\left\{ E[X] \right\}^2$

평균은 위에서 구한 np 입니다. 제곱의 평균만 구하면 됩니다. 이산확률변수의 제곱의 평균은 아래와 같이 계산됩니다. 

$E[X^2]=\sum_{x=0}^{n}x^2p(x)$

이항분포의 확률질량함수를 대입합시다. 

$E[X^2]=\sum_{x=0}^{n}x^2 _{n}C_{x}p^x(1-p)^{n-x}$

x에 0을 넣으면 전체항이 0이므로 1부터 시작해도 됩니다. 

$E[X^2]=\sum_{x=1}^{n}x^2 _{n}C_{x}p^x(1-p)^{n-x}$

$x^2$을 아래와 같이 $xx$로 바꿔줍니다. 

$E[X^2]=\sum_{x=0}^{n}xx _{n}C_{x}p^x(1-p)^{n-x}$

$x_{n}C_{x}p^x(1-p)^{n-x}$를 평균을 구할 때와 동일한 방법으로 치환해줍니다. 

$E[X^2]=np\sum_{k=0}^{m}x\frac{m!}{k!(m-k)!} p^{k} (1-p)^{m-k}$

x는 k+1 이므로 아래와 같이 치환해줍니다. 

$E[X^2]=np\sum_{k=0}^{m}(k+1)\frac{m!}{k!(m-k)!} p^{k} (1-p)^{m-k}$

아래와 같이 전개합니다. 

$E[X^2]=np\left\{ \sum_{k=0}^{m}k\frac{m!}{k!(m-k)!} p^{k} (1-p)^{m-k}+\sum_{k=0}^{m}\frac{m!}{k!(m-k)!} p^{k} (1-p)^{m-k} \right\}$

괄호 안의 첫 항은 이항분포 $B(m,p)$의 평균인 mp입니다. 괄호 안의 두번째 항은 이항분포 $B(m,p)$의 모든 확률을 더한 것이므로 1입니다. 따라서 위 식은 아래와 같이 계산됩니다. 

$E[X^2]=np(mp+1)$

m은 n-1을 치환한 것이므로 아래와 같이 바꿔줄 수 있습니다. 

$E[X^2]=np((n-1)p+1)$

괄호 안을 전개합니다. 

$E[X^2]=np(np-p+1)$

한번 더 전개합니다. 

$E[X^2]=n^2p^2-np^2+np$

분산을 계산하는 식에 넣어줍니다. 

$V[X]=E\left[ X^2 \right]-\left\{ E[X] \right\}^2=n^2p^2-np^2+np-n^2p^2$

아래와 같이 계산합니다. 

$V[X]=E\left[ X^2 \right]-\left\{ E[X] \right\}^2=-np^2+np$

np로 묶어줍니다. 이항분포 $B(n,p)$ 를 따르는 확률변수의 분산이 계산되었습니다. 

 

$V[X]=np(1-p)$

 

#영상 강의

 

반응형

댓글