본문 바로가기
반응형

@ 필수과목159

[손으로 푸는 통계 ver1.0] 33. 독립표본 Z검정 예제 독립표본 Z검정의 예제를 풀어봅시다. 우리가 핸드폰 케이스를 만드는 공장을 운영한다고 해봅시다. 플라스틱 재료를 구매하기 위해 두 업체와 컨택했습니다. A업체와 B업체라고 하겠습니다. 두 업체에서 같은 소재의 견적을 받았고 가격은 비슷했습니다. 제품에 대한 정보를 받긴 했는데, 직접 강도 테스트를 해보고 싶었습니다. 각 회사로부터 샘플 50개를 받기로 했습니다. 우리는 각 회사로 부터 크기가 50인 표본을 뽑으려는 것입니다. 50개 샘플을 받기 전에, 각 회사의 표본평균의 분포를 알 수 있습니다. (이 부분이 이해가 되셔야 합니다.) 표본의 크기가 충분히 크므로, 중심극한정리에 의해 정규분포를 가정할 수있습니다. 각 회사의 표본평균의 분포는 아래와 같습니다. 각 회사 재료 강도의 분산은 25과 16로 알.. 2020. 1. 26.
[손으로 푸는 통계 ver1.0] 32. 특성함수를 이용한 두 확률변수 차의 분포함수 유도 (3) 유도 우리는 2표본 z검정을 공부하고 있습니다. 2표본 z검정은 두 모집단의 평균을 비교하는 검정방법입니다. 두 모집단의 평균을 구할 수 없기 때문에, 각각 표본을 뽑았습니다. 표본의 크기 n이 충분히 크다과 가정하고 중심극한정리를 적용하면 두 모집단의 표본평균의 분포가 정규분포를 따른다고 할 수 있습니다. 따라서 두 모집단의 표본평균의 분포는 아래와 같았습니다. 표본의 크기가 다를 수 있으니 n_A과 n_B로 구분하였습니다. 문제는 표본평균의 분포함수에 모집단의 평균이 들어가 있다는 것입니다. 모집단의 평균을 소거하기 위해 표본평균의 차를 Y로 놓고 Y의 분포를 구하기로 했습니다. 이때 특성함수가 사용됩니다. 두 표본평균의 분포에 지난시간에 배운 정규분포의 특성함수를 적용하면 아래와 같습니다. 우리가 구해아.. 2020. 1. 25.
[손으로 푸는 확률분포] 다항분포 (2) 유도 (2) 유도 어떤 시행에서 일어날 수 있는 사건이 k개라고 합시다. 사건1,사건2,...,사건k 라고 놓겠습니다. 한번 시행에서 각 사건이 발생할 확률은 아래와 같습니다. 아래 등식이 성립합니다. n번 시행을 했을 때, 각 사건이 발생한 횟수를 아래와 같이 정의합시다. 아래 등식이 성립합니다. 이번에는 확률분포를 구해봅시다. 사건이 n번 발생했을 때, 각 사건이 위와 같이 발생할 확률은 아래와 같습니다. 2020. 1. 15.
[손으로 푸는 확률분포] 다항분포 (1) 소개 (1) 소개 이항분포는 시행의 결과가 두가지입니다. '사건의 발생, 사건이 발생하지 않음' 주사위를 예로 들면 시행의 결과가 아래와 같이 둘로 나뉘는 것입니다. - 6의 눈이 발생 - 6의 눈이 발생하지 않음 시행을 10번 했을 때 6의 눈이 3번 나올 확률 등이 이항분포의 확률에 해당됩니다. 확률을 구하면 아래와 같습니다. 반면에 다항분포는 시행의 결과가 셋 이상입니다. 주사위를 예로 들면 시행의 결과가 아래와 같이 나뉘는 경우가 다항분포가 됩니다 - 1의 눈이 발생 - 2이상 4이하의 눈이 발생 - 5의 눈이 발생 - 6의 눈이 발생 시행을 10번 했을 때 1의 눈이 3번, 2이상 4이하 눈이 5번, 5의 눈이 1번, 6의 눈이 1번 나올 확률이 다항분포에 해당됩니다. 확률을 구하면 아래와 같습니다... 2020. 1. 12.
[손으로 푸는 통계 ver1.0] 31. 특성함수를 이용한 두 확률변수 차의 분포함수 유도 (2) 정규분포의 특성함수 우리는 2표본 z검정을 공부하고 있습니다. 두 모집단의 평균을 비교하는 검정입니다. 중심극한정리를 이용하여 두 모집단의 표본평균이 정규분포를 따른다고 가정했습니다. 두 집단의 표본평균의 분포는 아래와 같습니다. 표본평균의 차이를 Y라고 놓고, Y의 분포를 유도하기로 했는데요. Y의 분포를 유도하는 방법은 세가지가 있었습니다. 1) 특성함수 2) 컨볼루션 적분 3) 기하적인 방법 원래 세가지를 다 다루려고 했는데요. 내용이 또 산으로 갈 것 같아서, 1번을 이용해서 유도하고 빨리 진행하기로 했습니다. 수학적인 다양한 접근방법들은 나중에 따로 강의를 만들어 다루도록 하겠습니다. 특성함수를 이용하여 유도하기로 했습니다. 지난시간에 특성함수가 무엇인지 배웠구요. 오늘은 정규분포의 특성함수를 구해볼겁니다. 두 모.. 2020. 1. 12.
[손으로 푸는 확률분포] 초기하분포 (8) 이항분포로의 근사 (8) 이항분포로의 근사 초기하분포에서 모집단의 크기를 무한대로 보낼겁니다. 모집단의 크기가 무한대로 가면, 모집단 안에 포함된 우리가 원하는 원소 k도 무한대로 갑니다. 초기하분포의 분포함수는 아래와 같습니다. 팩토리얼 형태로 나타냅시다. 아래와 같이 변형합니다. 빨간 부분끼리 모읍시다. 빨간 부분을 조합으로 표현합시다. 아래와 같이 (M-x)!을 분모와 분자에 곱합니다. 아래와 같이 자리를 바꿔줍니다. 아래와 같이 변형합니다. 나머지 두 항은 아래와 같이 변형합니다. 팩토리얼을 약분해줍니다. 이제 M과 k를 무한대로 보냅시다. 먼저 곱해진 인수의 개수를 알아야 합니다. 아래와 같이 구합니다. k-(k-x)=x M-(M-x)=x M-k-(M-k-(n-x))=n-x M-x-(M-n)=n-x 이제 아래와 .. 2020. 1. 7.
[손으로 푸는 확률분포] 초기하분포 (7) 이항분포와의 차이 (7) 이항분포와의 차이 초기하분포와 이항분포의 차이를 알아봅시다. 먼저 간단한 예시를 통해, 초기하분포를 다른 관점으로 이해해볼 것입니다. 흰구슬이 3개, 검정구슬이 2개 들어있는 상자가 있습니다. 이 상자에서 3개의 공을 꺼낼 때 검정구슬이 1개 포함될 확률을 구해봅시다. 이번에는 공을 1개씩 3번 꺼낼 때, 검정구슬이 1개 포함될 확률을 구해봅시다. 꺼낸 공은 다시 넣지 않습니다. 비복원추출입니다. 공이 뽑히는 순서에 따라 세가지 경우로 나뉩니다. 검흰흰 흰검흰 흰흰검 각각의 확률을 구해봅시다. 따라서 검은공이 한번 나올 확률은 아래와 같이 계산됩니다. 두 결과가 같습니다. 따라서 초기하분포는 크기가 M이고, 우리가 원하는 원소가 k개 들어있는 모집단에서, 크기가 1인 표본을 비복원추출로 n번 뽑을.. 2020. 1. 7.
[손으로 푸는 통계 ver1.0] 30. 특성함수를 이용한 두 확률변수 차의 분포함수 유도 (1) 특성함수란? 지난시간까지 2표본 z검정의 원리를 알아보았습니다. 2표본 z검정을 하기 위해, 정규분포를 따르는 두 확률변수의 차의 분포를 유도해야합니다. 두 확률변수는 아래와 같습니다. 두 확률변수의 차는 아래와 같습니다. Y의 분포를 유도해야하는데요. 특성함수를 이용하여 유도하겠습니다. 특성함수는 확률밀도함수에 '퓨리에 변환'을 적용한 함수입니다. 퓨리에변환은 아래와 같습니다. 퓨리에 변환은 시간에 대한 함수를 주파수성분으로 분해해주는 역할을 하는데요. 공대생 분들은 '공업수학'에서 보셨을겁니다. 퓨리에 변환을 통계학의 확률밀도함수 f(x)에 적용했더니 재밌는 일이 벌어졌습니다. 익숙한 모양입니다. 기댓값을 구하는 수식이 됩니다. 따라서 아래와 같은 의미를 갖습니다. 통계학에서 특별하게 사용될 함수이므로, 함수의 .. 2020. 1. 6.
[손으로 푸는 통계] 29. 2표본 z검정 (2) 원리 우리는 아래와 같은 두 모집단의 평균을 비교하고 있습니다. 모집단의 평균을 알지 못하기 때문에 표본을 하나씩 뽑았습니다. 그림으로 나타내면 아래와 같습니다. 이제 우리는 두 모집단의 평균을 통계적으로 비교할 방법을 찾아야 합니다. 우리에게 주어진 것들은 아래와 같습니다. 1) 각 모집단의 분산 ($\sigma_{A}^2$, $\sigma_{B}^2$) 2) 각 모집단의 표본평균의 분포 $f\left ( \bar{X}_{A} \right )=\frac{1}{\sqrt{2\pi}\frac{\sigma_{A}}{\sqrt{n}}}e^{-\frac{\left ( \bar{X}_{A}-\mu_{A} \right )^2 }{2\frac{\sigma_{A}^2}{n}}}$ $f\left ( \bar{X}_{B} \r.. 2020. 1. 4.
[손으로 푸는 통계] 28. 2표본 z검정 (1) 소개, 두 모집단과 표본 지금까지 우리는 1표본 Z검정을 배웠습니다. 1표본 Z검정은 모집단에서 표본을 하나 추출하여, 모집단의 평균을 검정하는 것입니다. 예를 들면 모집단의 평균이 30으로 알려진 상황에서 '정말 30이 맞아?'라는 의문을 해결하기 위해 검정을 하는 것입니다. 오늘 부터 배워볼 검정은 2표본 Z검정입니다. 2표본이니까 표본을 2개 뽑는다는 뜻인데요. 하나의 모집단에서 표본을 2개 뽑는 것은 아닙니다. 2표본 Z검정에서 모집단은 2개입니다. 2표본 Z검정은 두 모집단의 평균을 비교하는 검정입니다. 각 모집단에서 표본을 하나씩 뽑기 때문에 표본의 개수는 총 2개가 됩니다. 예를 들어 봅시다. 두 모집단 A와 B가 있습니다. 두 모집단의 분산만 알려져 있고 평균은 모르는 상황이라고 합시다. 그림으로 나타내면 아래와 .. 2020. 1. 3.
[손으로 푸는 통계] 27. 일부 영상을 내린 이유 & 변경된 계획 안녕하세요. 손으로 푸는 통계입니다. 제가 기존에 있던 27~48강 영상를 삭제하였습니다. 27~48강은 아래와 같은 내용입니다. - 분위수 - qq plot - 정규성검정 종류 - KS검정 도입부 이 내용을 없애고, 28강부터 다른 내용으로 이어가려고 합니다. 기존의 계획은 1표본 z검정 이후에 정규성검정을 설명하고, t검정에 대한 설명으로 이어가려고 했습니다. 그래서 분위수부터 시작해서 코로고로브-스미르노브 검정(KS 검정)의 도입부까지 영상을 올려놓은 상태였는데요. KS검정을 공부하다보니 내용이 상당히 어렵고 많았습니다. KS분포를 이해하려면 brownian bridge를 알아야 하고, brownian bridge를 알아야 하면 wiener process(위너 과정)를 알아야 하고, 이 내용들은 확.. 2020. 1. 2.
[손으로 푸는 확률분포] 초기하분포 (6) 이름에 '초기하'가 붙은 이유 (6) 이름의 유래이름에 '초기하'가 붙은 이유 초기하분포라는 이름이 어떻게 붙여졌는지 알기 위해서는 시간을 거슬러 올라가야합니다. 초기하분포는 초기하함수로부터 이름이 붙여졌고, 초기하함수는 다시 기하급수로 부터 유리된 이름입니다. 기하급수는 기하수열의 합입니다. 기하수열은 우리가 잘 아는 '등비수열'입니다. 따라서 유래의 순서는 아래와 같습니다. 기하(등비)수열 → 기하(등비)급수 → 초기하함수 → 초기하분포 기하수열을 하나 정의합시다. 공비를 r이라고 하겠습니다. 이 기하수열의 합이 기하급수입니다. 만약 r이 -1보다 크고 1보다 작고, n이 무한대로 갈 때 아래의 값으로 수렴합니다. 이 기하급수와 초기하함수와는 어떤 관계가 있을까요? 초기하함수는 여러 특수한 함수들을 포함하는 함수입니다. 어떤 변수.. 2019. 12. 28.
[손으로 푸는 확률분포] 초기하분포 (5) 그래프 (5) 그래프 초기하분포의 그래프를 그려봅시다. 초기하분포의 확률질량함수는 아래와 같습니다. $p(x)=\frac{_{k}C_{x}\cdot _{M-k}C_{n-x}}{_{M}C_{n}}$ 용어의 의미는 아래와 같습니다. 모집단의 크기 : M 모집단 중 원하는 원소 개수 : k 표본의 크기 : n 표본 중 원하는 원소 개수 : x 그래프 내에서는 표본의 크기 n을 바꾸고, 그래프 간에는 모집단 중 원하는 원소 수인 k를 바꿨습니다. 아래는 확률질량함수입니다. n이 커질 수록 그래프가 오른 쪽으로 이동하고, k가 커져도 그래프가 오른 쪽으로 이동합니다. 아래는 누적분포함수입니다. 사용한 코드는 아래와 같습니다. #####################################################.. 2019. 12. 24.
[손으로 푸는 확률분포] 초기하분포 (4) 분산 (4) 분산 이산확률변수 X의 분산은 아래와 같이 구합니다. 초기하분포의 평균을 대입하면 아래와 같습니다. 확률변수의 제곱의 평균을 시그마 형태로 바꾸면 아래와 같습니다. 이항분포의 확률분포는 아래와 같습니다. 분산을 구하던 식에 대입합시다. 아래와 같이 조합을 전개합시다. x에 0을 넣어주면 항이 0이 되므로, 1로 바꿔줘도 결과가 동일합니다. 약분하고 k를 꺼냅시다. 약분하고 k를 꺼냅시다. 평균을 유도할 때 사용했던 아래 원리를 이용하여 변형합시다. 아래와 같이 변형됩니다. n과 M을 밖으로 꺼냅시다. 아래와 같이 변형합시다. 첫번째 팩토리얼 식을 조합 식으로 바꿔줍시다. x-1을 y로 치환합니다. y+1을 전개합니다. 위 식의 빨간 부분은 모집단이 M-1, 모집단에 우리가 원하는 원소가 k-1개,.. 2019. 12. 17.
[손으로 푸는 확률분포] 초기하분포 (3) 평균 (3) 평균 이산확률변수 X의 평균은 아래와 같이 구합니다. 초기하분포의 확률분포는 아래와 같습니다 . 따라서 초기하분포의 평균은 아래와 같습니다. 아래와 같이 전개합시다. x를 약분하고, k를 하나 꺼냅시다. x에 0을 넣으면 항이 0이므로, x를 1부터 시작해도 됩니다. $MCN_{M}C_{n}$ 을 아래와 같이 변형할 수 있습니다. 평균을 계산하던 식에 대입합시다. 팩토리얼 식은 아래와 같이 조합으로 쓸 수 있습니다. M과 n을 밖으로 꺼냅시다. x-1를 y로 치환합시다. 위 식의 시그마 부분은 모집단의 크기가 M-1, 모집단 안에 우리가 원하는 원소가 k-1개, 표본의 크기 n-1개, 표본 안에 우리가 원하는 원소 y개인 초기하분포의 값의 합입니다. 따라서 1이 됩니다. 평균은 구했습니다. 이번에.. 2019. 12. 17.
[손으로 푸는 확률분포] 초기하분포 (2) 유도 (2) 유도 모집단의 크기는 M입니다. 모집단 안에는 우리가 원하는 원소가 k개 있습니다. 모집단에서 크기가 n인 표본을 뽑는 경우의 수는 아래와 같습니다. $_{M}C_{n}$ 우리가 뽑은 크기 n인 표본 안에 우리가 원하는 원소 x개가 들어 있을 경우의 수를 구해봅시다. 모집단에 있는 k개 중에서 x개가 뽑혀야 합니다. 총 n개가 뽑혀야 하므로, 나머지는 모집단에 있는 우리가 원하지 않는 것의 수 즉 M-k개 중에서 n-x개가 뽑히면 됩니다. 조합식으로 표현하며 아래와 같습니다. $_{k}C_{x}\cdot _{M-k}C_{n-x}$ 이산확률분포는 우리가 원하는 원소가 k개 들어 있는 크기가 M인 모집단에서 표본 n개를 뽑을 때, 우리가 원하는 원소가 x개 들어있을 확률분포입니다. 따라서 아래 확률은.. 2019. 12. 16.
[손으로 푸는 확률분포] 초기하분포 (1) 소개 (1) 소개 모집단이 있습니다. 모집단의 크기는 M입니다. 모집단 안에는 우리가 원하는 원소가 k개 있습니다. 모집단에서 크기가 n인 표본을 뽑을 것입니다. 이 표본 안에 우리가 원하는 원소가 x개 있을 확률분포가 초기하분포 입니다. 모집단의 크기 : M 모집단 중 원하는 원소 개수 : k 표본의 크기 : n 표본 중 원하는 원소 개수 : x 로또를 예로들어봅시다. 로또는 45개 숫자 중에서 6개를 맞추는 것입니다. 45개라는 모집단에 우리가 원하는 숫자 6개가 있는 것입니다. 45개라는 모집단에서 6개를 뽑았고, 그 중 우리가 원하는 숫자의 개수를 x라고 놓는다면 초기하분포가 됩니다. M : 45 k : 6 n : 6 x : 맞춘 번호 수 2019. 12. 5.
[손으로 푸는 확률분포] 푸아송분포 (6) 그래프 (6) 그래프 푸아송 분포의 그래프는 아래와 같습니다. 람다를 5부터 70까지 키워가며 그래프를 그렸습니다. 세로선은 평균입니다. 푸아송분포의 평균과 분산이 모두 λ입니다. λ가 커지면 평균이 커지는 것이므로 그래프가 우측으로 이동합니다. λ가 커지면 분산이 커지는 것이므로, 그래프가 좌우로 퍼집니다. 그래프는 R을 이용하여 그렸습니다. 아래는 사용 코드입니다. plot(0,type='n',ylim=c(0,0.2),xlim=c(0,100),ann=FALSE) title(main="Poisson distribution", xlab="x",ylab="p(x)") lambda=c(5,10,30,50,70) for (i in 1:5) { x=1:100 y=dpois(x, lambda[i], log = FALSE.. 2019. 12. 3.
[손으로 푸는 확률분포] 푸아송분포 (5) 분산 (5) 분산 푸아송 분포의 분산을 구해봅시다. 푸아송 분포함수는 아래와 같습니다. 푸아송분포의 분산은 아래와 같이 구합니다. x가 1부터 시작해도 결과가 같습니다. x를 약분합니다. 아래와 같이 변형합니다. 람다를 꺼냈습니다. x-1을 n으로 치환합니다. 전개합니다. 빨간 부분은 푸아송분포의 평균입니다. 파랑부분은 푸아송분포함수값의 총 합이므로 1입니다. 계산하면 아래와 같습니다. 2019. 12. 1.
[손으로 푸는 확률분포] 푸아송분포 (4) 평균 (4-1) 통계량 - 평균 푸아송분포는 λ 라고 가정하고 유도한 분포이므로, 평균은 당연히 λ 겠지만 확률분포의 평균을 구하는 수식으로도 구해보겠습니다. 푸아송분포 평균을 구할 때 테일러급수가 사용되므로, 먼저 테일러급수를 알아봅시다. f(x)의 테일러급수는 아래와 같습니다. a가 0일 때는 매클로린 급수라고 합니다. 이번에는 e^x의 매클로린 급수를 구해봅시다. x 자리에 λ를 대입합시다. 위 식을 증명에 사용할 것입니다. 1번식이라고 하겠습니다. 이제 푸아송 분포의 평균을 구해봅시다. 푸아송 분포함수는 아래와 같습니다. 푸아송분포의 평균은 아래와 같이 구합니다. x에 0을 넣으면 전체 항이 0이 되므로, x를 1부터 시작해도 됩니다. 아래와 같이 변형합니다. x-1을 n으로 치환하겠습니다. 빨간 식을.. 2019. 11. 29.
[손으로 푸는 확률분포] 푸아송분포 (3) 예시 (3) 예시 아래와 같은 푸아송 분포를 유도했습니다. 예시를 통해 위 식을 어떻게 사용하는지 알아봅시다. 증명에도 사용했던 길냥이 예시로 가봅시다. 하루동안 돌다니며 길냥이를 마주치는 평균 횟수가 3회라고 합시다. 오늘 하루 동안 길냥이를 1번 마주칠 확률은 얼마일까요? 위 경우는 람다가 3인 푸아송분포가 됩니다. 길냥이를 한번 마주칠 확률은 x에 1을 넣어서 구하면 됩니다. 2019. 11. 26.
[손으로 푸는 확률분포] 푸아송분포 (2-3) 두 증명 결과가 같은 이유 (2-3) 두 증명 결과가 같은 이유 두가지 방법으로 푸아송분포를 유도했습니다. 이항분포를 이용하여 유도한 결과는 아래와 같습니다. 미분방정식을 세워서 유도한 결과는 아래와 같습니다. λ 와 ks를 비교할겁니다. 의미가 같다는 것을 보이겠습니다. λ는 이항분포 B(n,p)의 평균입니다. 어떤 시간 동안의 시행횟수를 n, 사건 발생확률을 p라고 놓았을 때의 평균입니다. 이번에는 ks를 봅시다. s는 어떤 단위 시간을 의미합니다. 길냥이 예제에서는 '하루'라는 시간입니다. 시간 s 안에 Δt 라는 '사건이 최대 1번 일어나는 짧은 시간'을 잡은 것입니다. Δt 동안 사건이 1번 발생할 확률을 아래와 같이 정의했었습니다. 위 식을 k에 대해 정리하면 아래와 같습니다. 양변에 s를 곱합시다. 전체시간 s를 사건.. 2019. 11. 15.
[손으로 푸는 확률분포] 푸아송분포 (2-2) 미분방정식으로 유도 ② 유도 (2-2) 미분방정식으로 유도 ② 유도 지난시간에 세개의 식을 유도했습니다. 본격적으로 푸아송분포를 유도합시다. 길냥이 예제를 이어서 사용하겠습니다. 아래와 같은 확률을 정의해봅시다. 이 확률은 t+Δt 라는 시간동안 길냥이를 x번 만날 확률입니다. 이 확률은 아래와 같이 다른 두 확률의 곱으로 표현할 수 있습니다. t+Δt 라는 시간동안 길냥이를 x번 만날 확률은 t라는 시간동안 x번 만나고 이후 Δt라는 시간동안 0번 만날 확률과 t라는 시간동안 x-1번 만나고 이후 Δt라는 시간동안 1번 만날 확률의 합과 같습니다. 1,2번식(맨 위 빨간식)을 대입하여 정리합시다. 전개하겠습니다. 이항하여 아래와 같이 정리합시다. Δt로 양변을 나눠줍시다. Δt를 0으로 보내면 아래와 같은 미분방정식이 됩니다. 이.. 2019. 11. 7.
[손으로 푸는 확률분포] 푸아송분포 (2-2) 미분방정식으로 유도 ① 준비 (2-2) 미분방정식으로 유도 ① 준비 지난시간에는 이산확률분포를 이용하여 포아송분포를 유도했는데요. 이번에는 미분방정식을 세워서 포아송분포를 유도해보겠습니다. 푸아송분포 첫번째 시간에 소개한 예시를 떠올려봅시다. 24시간 동안 길냥이를 만날 확률분포를 포아송분포의 예로 들었습니다. 길냥이를 만나는 사건이 최대 1번 일어날 수 있을 만큼 작은 시간을 Δt 라고 놓읍시다. Δt 라는 시간 동안 길냥이를 만날 사건이 1번 일어날 확률을 아래와 같이 놓겠습니다. 이 확률은 Δt에 비례할 것입니다. Δt가 길 수록 길냥이를 만날 확률이 높아질 것이기 때문입니다. 따라서 아래와 같이 놓을 수 있습니다. 비례상수를 k라고 합시다. 이때, Δt 동안 길냥이를 만나지 않을 확률은 아래와 같습니다. 전체확률이 1이므로 .. 2019. 11. 5.
[손으로 푸는 확률분포] 푸아송분포 (2-1) 이항분포로 부터 유도 (2-1) 이항분포로 부터 유도 이항분포 함수는 아래와 같습니다. 푸아송분포는 n과 p를 각각 다루지 않고, 이항분포의 평균인 np를 다룹니다. 이 값을 λ(람다)라고 놓습니다. 아래와 같이 변형합시다. 이항분포 수식의 p 자리에 위 식을 넣겠습니다. 조합 식을 팩토리얼로 전개합시다. 위 식의 빨간항을 아래와 같이 나눠서 써줍시다. 팩토리얼 식을 아래와 같이 풀어 써줍니다. 파란 부분끼리 약분해줍니다. x팩토리얼과, n의 x승의 자리를 바꿔줍니다. 위 식의 파란 부분을 아래와 같이 변형합시다 . 이번에는 아래 식을 봅시다. 몇개의 인수가 곱해져있는 걸가요? n!를 (n-x)!로 나눈 것인데, n!의 인수는 n개 입니다. (n-x)!의 인수는 (n-x)개입니다. n개 에서 (n-x)개를 약분하면, x개가 .. 2019. 10. 28.
[손으로 푸는 확률분포] 푸아송분포 (1) 소개 (1) 소개 푸아송 분포에 붙은 '푸아송'은 사람의 이름입니다. 시메옹 푸아송의 이름을 따서 만들었습니다. 시메옹 푸아송이 발견했기 때문입니다. 시메옹 푸아송은 1791년 프랑스에서 태어났습니다. 그의 직업은 공학자, 수학자, 물리학자였습니다. 기계나 재료를 전공한 분들이라면 반드시 들어보았을 푸아송비(poisson's ratio)도 이분이 만들었습니다. 에펠탑에 이름이 새겨진 72명의 과학자중 한명이라고 합니다. 푸아송분포는 이항분포의 특수한 경우로 생각할 수 있습니다. 이항분포에서 시행횟수가 무수히 많아지고, 발생확률은 아주 작은 경우입니다. 한가지 의문이 듭니다. 그럼 그냥 이항분포로 계산하면 되지, 왜 굳이 푸아송분포가 필요한거야? 이 의문을 해결해봅시다. 거리를 돌아다니다가 길냥이를 본적이 있을.. 2019. 9. 14.
[손으로 푸는 확률분포] 음이항분포 (6) 이름의 유래 (6) 이름의 유래 음이항분포에서 '음'은 양수/음수에서의 '음'입니다. 영어로는 negative 입니다. 왜 이런 이름이 붙었는지 알아봅시다. 이항분포 함수는 아래와 같이 생겼습니다. 앞에 조합형태로 곱해져 있는 값을 '이항계수'라고 부릅니다. 한편 음이항분포 함수는 아래와 같은 모양입니다. 음이항분포의 계수를 변형해보겠습니다. 먼저 펙토리얼 형태로 써봅시다. 분자에서 (r-1)!를 약분하면 아래와 같습니다. 우변 분자의 인수 개수가 x개입니다. 따라서 아래와 같이 변형할 수 있습니다. -1을 x개를 두번 곱해준 것과 같습니다. 결과적으로 1을 곱한 것이라 수식에 변화는 없습니다. 이번에는 양변에 (-r-x)! 을 곱해줍시다. 음수의 팩토리얼이라 직관적으로 완전히 받아들여지지는 않지만, 수식계산을 할 .. 2019. 9. 14.
[손으로 푸는 확률분포] 음이항분포 (5) 그래프 5) 그래프 음이항분포는 r번의 실패(사건 미발생)가 나오기까지 성공(사건발생)이 x번 발생할 확률분포입니다. 음이항분포의 분포함수, 평균, 분산은 아래와 같습니다. r이 커질수록 평균과 분산은 커집니다. p가 커질 수록 평균과 분산이 커집니다. r이 커질 수록 평균이 커진다는 것은 r이 커질 수록 성공횟수 x가 높은 값에서 발생할 확률이 높아진다는 말입니다. 예를 들어서 r이 1이고 x가 10이라고 해봅시다. 이때는 성공이 10번 연속 발생하고, 마지막에 실패가 1번 발생해야 하는데 이 확률은 정말 작습니다. r이 10이고 x가 10이라면 확률이 더 높아질 것입니다. 또 반대로 r이 10인데 x가 1인 경우에도 확률이 희박해집니다. 물론 p의 영향을 받겠지만, r이 커지면 r이 작을때에 비해서 큰 값의.. 2019. 7. 19.
[손으로 푸는 확률분포] 음이항분포 (4-2) 분산 4-2) 통계량 - 분산 분산은 아래 수식을 이용하여 구할 수 있습니다. 평균은 이전 강의에서 계산한 결과를 넣어줍시다. 우리가 모르는 값은 평균의 제곱이기 때문에, 따로 떼어서 계산하겠습니다. p(x)에 음이항분포식을 적용해봅시다. x가 0일때는 값이 0이므로, x를 1부터 계산해도 됩니다. 이항분포 식을 풀어서 씁시다. x를 약분해줍니다. p하나를 꺼내고, 1-p와 r을 나누고 곱해서 아래와 같이 변형합니다. r+1=s 로, x-1=t 로 치환합니다. t+1을 전개합시다. 위 그림의 빨간부분을 조합식으로 바꿔봅시다. 위 수식의 파란부분은 실패횟수가 s이고, 성공횟수(변수)가 t인 음이항분포의 분포함수입니다. 따라서 왼쪽식은 음이항분포의 평균을 구하는 식이고, 오른쪽 식은 분포함수의 전체 합이므로 1이.. 2019. 7. 5.
[손으로 푸는 확률분포] 음이항분포 (4-1) 평균 4-1) 통계량 - 평균 음이항분포의 평균은 아래와 같이 정의됩니다. x를 1부터로 바꿔도 계산 결과가 동일하므로 바꿔줍니다. 조합을 아래와 같이 풀어서 써봅시다. x를 약분해줍니다. p를 하나 분리해서 시그마 기호 밖으로 꺼내줍니다. r을 분자분모에 곱합니다. 1을 곱하는 것이므로 수식에 영향을 주지 않습니다. x-1을 y로 치환합니다. 조합 기호를 이용하여 표현해줍니다. r을 k-1로 치환합니다. 아래와 같이 변형합니다. 1/(1-p)를 밖으로 꺼냈습니다. 빨간색 부부은 NB(k,p)의 총합입니다. 확률분포의 총 합이므로 값은 1입니다. 따라서 평균은 아래와 같습니다. 2019. 7. 5.
반응형