본문 바로가기
@ 필수과목/손으로 푸는 확률분포

[손으로 푸는 확률분포] 이항분포 (3~5) 유도, 통계량, 그래프

by bigpicture 2019. 7. 4.
반응형

 

3) 일반화(유도)

어떤 독립시행에서 특정 사건이 발생할 확률은 p입니다. 이 시행을 n번 했을 때, 사건이 발생한 횟수를 x라고 합시다. 이때의 확률분포가 이항분포이고 아래와 같습니다. 

 

시행횟수가 n, 사건 발생활률이 p인 이항분포를 기호로 아래와 같이 나타냅니다. B는 binomial의 약자입니다. 

 

 

 

4-1) 통계량 - 평균

이항분포의 평균은 아래와 같이 정의됩니다. 

 

 

x가 0일때는 값이 0이므로 아래와 같이 시그마의 시작을 1으로 바꿀 수 있습니다. 

 

 

아래와 같이 변형합시다. 

 

 

p와 n은 시그마에 독립적이므로 아래와 같이 꺼내줄 수 있습니다. x는 약분됩니다. 

 

 

이제 치환을 하겠습니다. n-1을 m로, x-1을 r로 치환합시다. 

 

 

이번에는 n-1에서 x-1을 뺍시다. n-x가 나오고, 이 값은 m-r과 같습니다. 치환합시다. 구간도 아래와 같이 바꿔줍니다. 

 

 

조합표현으로 바꿔보겠습니다. 

 

 

빨간색 부분은 시행횟수가 m이고 사건 발생확률이 p인 이항분포의 전체 확률 합입니다. 따라서 값이 1이고, 아래와 같은 결과를 얻습니다. 

 

 

 

4-2) 통계량 - 분산

이항분포의 분산은 아래와 같이 정의됩니다. 

 

 

아래와 같이 변형합시다. x가 0일때는 값이 0이므로 아래와 같이 시그마의 시작을 1으로 바꿀 수 있습니다. 

 

p와 n은 시그마에 독립적이므로 아래와 같이 꺼내줄 수 있습니다. x는 약분됩니다. 

 

 

이제 치환을 하겠습니다. n-1을 m로, x-1을 r로 치환합시다. 

 

 

이번에는 n-1에서 x-1을 뺍시다. n-x가 나오고, 이 값은 m-r과 같습니다. 치환합시다. 구간도 아래와 같이 바꿔줍니다. x도 1+r로 바꿔줍니다. 

 

 

1+r을 전개합시다. 

 

 

조합 표현으로 바꿉시다. 

 

 

빨간식은 평균을 유도할 때 이야기했듯, 시행횟수가 m이고 사건 발생확률이 p인 이항분포의 전체 확률 합입니다. 따라서 값이 1입니다. 파란식은 시행횟수가 m이고 사건 발생확률이 p인 이항분포의 평균입니다. 따라서 mp입니다. 정리해봅시다. 

 

 

m 대신 n-1을 넣고 계산합시다. 

 

 

 

5) 그래프

R로 그린 이항분포 그래프입니다. n이 커지면 이항분포는 두가지 분포로 근사됩니다. p가 너무 크거나 작지 않은 경우(skewness가 너무 크지 않은 경우)에는 정규분포로 근사되구요. p가 0에 가까워지면 포아송분포로 근사됩니다. 자세한 내용은 나중에 다시 다루도록 하겠습니다.  (그래프 그리는 법 → rstatall.tistory.com/1)

 

 

반응형

댓글