본문 바로가기
반응형

확률분포40

[손으로 푸는 확률분포] 푸아송분포 (2-2) 미분방정식으로 유도 ① 준비 (2-2) 미분방정식으로 유도 ① 준비 지난시간에는 이산확률분포를 이용하여 포아송분포를 유도했는데요. 이번에는 미분방정식을 세워서 포아송분포를 유도해보겠습니다. 푸아송분포 첫번째 시간에 소개한 예시를 떠올려봅시다. 24시간 동안 길냥이를 만날 확률분포를 포아송분포의 예로 들었습니다. 길냥이를 만나는 사건이 최대 1번 일어날 수 있을 만큼 작은 시간을 Δt 라고 놓읍시다. Δt 라는 시간 동안 길냥이를 만날 사건이 1번 일어날 확률을 아래와 같이 놓겠습니다. 이 확률은 Δt에 비례할 것입니다. Δt가 길 수록 길냥이를 만날 확률이 높아질 것이기 때문입니다. 따라서 아래와 같이 놓을 수 있습니다. 비례상수를 k라고 합시다. 이때, Δt 동안 길냥이를 만나지 않을 확률은 아래와 같습니다. 전체확률이 1이므로 .. 2019. 11. 5.
[손으로 푸는 확률분포] 푸아송분포 (2-1) 이항분포로 부터 유도 (2-1) 이항분포로 부터 유도 이항분포 함수는 아래와 같습니다. 푸아송분포는 n과 p를 각각 다루지 않고, 이항분포의 평균인 np를 다룹니다. 이 값을 λ(람다)라고 놓습니다. 아래와 같이 변형합시다. 이항분포 수식의 p 자리에 위 식을 넣겠습니다. 조합 식을 팩토리얼로 전개합시다. 위 식의 빨간항을 아래와 같이 나눠서 써줍시다. 팩토리얼 식을 아래와 같이 풀어 써줍니다. 파란 부분끼리 약분해줍니다. x팩토리얼과, n의 x승의 자리를 바꿔줍니다. 위 식의 파란 부분을 아래와 같이 변형합시다 . 이번에는 아래 식을 봅시다. 몇개의 인수가 곱해져있는 걸가요? n!를 (n-x)!로 나눈 것인데, n!의 인수는 n개 입니다. (n-x)!의 인수는 (n-x)개입니다. n개 에서 (n-x)개를 약분하면, x개가 .. 2019. 10. 28.
[손으로 푸는 확률분포] 푸아송분포 (1) 소개 (1) 소개 푸아송 분포에 붙은 '푸아송'은 사람의 이름입니다. 시메옹 푸아송의 이름을 따서 만들었습니다. 시메옹 푸아송이 발견했기 때문입니다. 시메옹 푸아송은 1791년 프랑스에서 태어났습니다. 그의 직업은 공학자, 수학자, 물리학자였습니다. 기계나 재료를 전공한 분들이라면 반드시 들어보았을 푸아송비(poisson's ratio)도 이분이 만들었습니다. 에펠탑에 이름이 새겨진 72명의 과학자중 한명이라고 합니다. 푸아송분포는 이항분포의 특수한 경우로 생각할 수 있습니다. 이항분포에서 시행횟수가 무수히 많아지고, 발생확률은 아주 작은 경우입니다. 한가지 의문이 듭니다. 그럼 그냥 이항분포로 계산하면 되지, 왜 굳이 푸아송분포가 필요한거야? 이 의문을 해결해봅시다. 거리를 돌아다니다가 길냥이를 본적이 있을.. 2019. 9. 14.
[손으로 푸는 확률분포] 음이항분포 (4-2) 분산 4-2) 통계량 - 분산 분산은 아래 수식을 이용하여 구할 수 있습니다. 평균은 이전 강의에서 계산한 결과를 넣어줍시다. 우리가 모르는 값은 평균의 제곱이기 때문에, 따로 떼어서 계산하겠습니다. p(x)에 음이항분포식을 적용해봅시다. x가 0일때는 값이 0이므로, x를 1부터 계산해도 됩니다. 이항분포 식을 풀어서 씁시다. x를 약분해줍니다. p하나를 꺼내고, 1-p와 r을 나누고 곱해서 아래와 같이 변형합니다. r+1=s 로, x-1=t 로 치환합니다. t+1을 전개합시다. 위 그림의 빨간부분을 조합식으로 바꿔봅시다. 위 수식의 파란부분은 실패횟수가 s이고, 성공횟수(변수)가 t인 음이항분포의 분포함수입니다. 따라서 왼쪽식은 음이항분포의 평균을 구하는 식이고, 오른쪽 식은 분포함수의 전체 합이므로 1이.. 2019. 7. 5.
[손으로 푸는 확률분포] 음이항분포 (4-1) 평균 4-1) 통계량 - 평균 음이항분포의 평균은 아래와 같이 정의됩니다. x를 1부터로 바꿔도 계산 결과가 동일하므로 바꿔줍니다. 조합을 아래와 같이 풀어서 써봅시다. x를 약분해줍니다. p를 하나 분리해서 시그마 기호 밖으로 꺼내줍니다. r을 분자분모에 곱합니다. 1을 곱하는 것이므로 수식에 영향을 주지 않습니다. x-1을 y로 치환합니다. 조합 기호를 이용하여 표현해줍니다. r을 k-1로 치환합니다. 아래와 같이 변형합니다. 1/(1-p)를 밖으로 꺼냈습니다. 빨간색 부부은 NB(k,p)의 총합입니다. 확률분포의 총 합이므로 값은 1입니다. 따라서 평균은 아래와 같습니다. 2019. 7. 5.
[손으로 푸는 확률분포] 음이항분포 (3) 유도 3) 일반화(유도) 어떤 사건이 발생할 확률을 p라고 합시다. r번의 실패가 나오기까지 발생한 성공이 k번일 확률 p(X=k)의 분포가 음이항분포입니다. p와 r은 사전에 정해지는 값입니다. 변수는 k입니다. 이를 아래와 같이 표현합니다. k는 변수이고, r과 p은 주어진 값이라는 의미입니다. 이제 이런 조건을 따르는 확률분포 p(X=k)를 정의합시다. k가 확률변수 x라는 의미입니다. 총 r번의 실패와 k번의 성공이므로 전체 시행은 r+k번이 됩니다. 아래와 같이 정리합시다. 기호로 나타내면 아래와 같습니다. NB는 Negative binomial distribution(NB)의 약어입니다. 2019. 7. 5.
[손으로 푸는 확률분포] 음이항분포 (2) 예시 2) 예시 어떤 농구선수의 자유투 성공률이 30%라고 해봅시다. 이 농구선수가 3번의 실패가 나오기까지 발생한 성공이 x번인 확률이 음이항분포입니다. x가 0일 때부터 구해봅시다. 성공 없이 실패만 세번 하면 됩니다. x가 1일 때는 어떨까요. 실패를 3번 할 동안 성공이 1번 나오면 됩니다. 마지막에 실패로 끝나는 것이므로 아래와 같은 경우들이 가능합니다. 실패/실패/성공/실패 실패/성공/실패/실패 성공/실패/실패/실패 위와 같은 경우가 발생할 확률을 구해봅시다. 이번에는 x가 2일 때 발생 가능한 경우를 구해봅시다. 실패/실패/성공/성공/실패 실패/성공/실패/성공/실패 .... 경우가 많아서 세기가 귀찮습니다. 규칙을 찾아야 합니다. 마지막에는 실패로 끝나야 하니까. 실패횟수에서 하나를 빼놓습니다. .. 2019. 7. 5.
[손으로 푸는 확률분포] 기하분포 (1~2) 소개, 예시 1) 소개 베르누이 시행을 반복할 때, 처음 성공이 나오기까지 시행한 횟수를 확률변수 x로 할때의 확률분포입니다. 예를들어 확률변수가 4일 때의 확률은 "실패-실패-실패-성공" 인 경우의 확률입니다. 또 다른 정의도 있는데, 처음 성공이 나오기까지 실패한 횟수를 확률변수로 하는 경우도 있습니다. 이때는 확률변수 4의 확률이 "실패-실패-실패-실패-성공"의 확률이 됩니다. 본 글에서는 전자의 정의(성공이 나오기까지 시행한 횟수)를 따르겠습니다. 2) 예시 연애를 시작한 남녀가 결혼할 확률이 5%라고 가정합시다. x번째 사귄 이성과 결혼하게 될 확률분포가 기하분포입니다. 2019. 7. 4.
[손으로 푸는 확률분포] 확률분포의 종류 (연속확률분포, 이산확률분포) 통계학에서 사용되는 다양한 확률분포들을 설명하는 강의입니다. 각 확률분포의 간단한 예시, 유도, 통계량 계산, 그래프 등의 내용을 다룰 것입니다. 확률분포는 크게 '이산확률분포'와 '연속확률분포'로 나뉩니다. 이산확률분포는 확률변수의 개수를 셀 수 있는 경우를 말합니다. 개수가 유한개로 한정되지는 않습니다. 자연수는 무한개이지만 이산확률변수에 속합니다. 순서대로 셀 수 있기 때문입니다. 연속확률분포는 확률변수가 셀 수 없는 경우의 분포를 말합니다. 이산확률분포 : 확률변수 개수를 셀 수 있음 연속확류분포 : 확률변수 개수를 셀 수 없음 1. 이산확률분포 종류 강의에서 다룰 이산확률분포는 아래와 같습니다. - 베르누이분포 - 이항분포 - 기하분포 - 음이항분포 - 포아송분포 - 초기하분포 - 다항분포 2... 2018. 12. 24.
[손으로 푸는 통계] 12. 중심극한정리 증명 (#1. 확률분포가 같을 조건) 중심극한정리 증명 (#1. 확률분포가 같을 조건) 지난시간까지 중심극한정리 유도에 사용되는 두가지 재료를 공부해봤습니다. 두 가지 재료는 아래와 같습니다. - 테일러 급수 - 적률생성함수 중심극한정리는 표본의 크기가 커짐에 따라 '표본 평균'들의 분포가 정규분포에 가까워져 간다는 정리입니다. 표본의 크기가 충분히 클 경우 표본평균의 분포를 정규분포로 가정하는데 사용되는 정리입니다. t검정을 비롯하여 모수적 통계방법들의 기반이 되는 정리입니다. 중심극한정리를 유도하는 절차는 아래와 같습니다. #1. 두 확률변수의 적률생성함수가 같다면, 두 확률변수의 분포가 동일함을 보임 #2. 정규분포를 따르는 확률변수의 적률생성함수를 유도함 #3. 표본평균의 적률생성함수를 유도함, 정규분포를 따르는 확률변수의 적률생서함.. 2018. 3. 24.
반응형