본문 바로가기
반응형

@ 필수과목/손으로 푸는 확률분포55

[손으로 푸는 확률분포] 정규분포 (2) 과녁을 이용한 유도 정규분포를 유도하는 방법은 두 가지가 있습니다. 과녁 맞추기를 이용한 유도와 이항분포를 이용한 유도입니다. 두 유도방법 모두 '정규분포가 무엇인가' 라는 질문에 좋은 답변을 제공해줍니다. 오늘은 첫번째 방법인 '과녁 맞추기를 이용한 유도'를 알아봅시다. 우리가 어떤 물체의 길이를 측정하는 상황이라고 해봅시다. 우리가 측정할 때 마다 측정값은 조금씩 달라질 것입니다. 측정에는 항상 오차가 있기 때문입니다. 측정을 무한히 반복했다고 가정하고, 측정된 값들을 확률분포로 만들고 싶었습니다. 실제로 측정을 무한 번 하지는 않을 거구요. 그럴듯한 수학 모델을 만들어 볼 겁니다. 그럴듯한 수학 모델을 만들기 위해 물체의 길이를 측정하는 것과 비슷한 상황 하나를 생각해냈습니다. 바로 '과녁 맞추기' 입니다. 아래와 같.. 2022. 4. 1.
[손으로 푸는 확률분포] 정규분포 (1) 풀리지 않았던 의문 아마 여러분이 정규분포를 처음 접한 때는 고등학교 확률과 통계 시간일 것입니다. 고등학교 확률과 통계 시간에는 정규분포를 이렇게 가르칩니다. 연속확률변수 X의 확률밀도함수가 $f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x-\mu}{\sigma} \right )^{2}}$ 일 때 X의 확률분포를 정규분포라고 한다. 마치 하늘에서 정규분포가 뚝 하고 떨어진 것처럼 배웁니다. 그리고 바로 정규분포의 성질을 배웁니다. $\mu$ 는 평균이고, $\sigma$는 표준편차이다. 좌우 대칭이다. 평균에 가까울 수록 확률밀도가 크고 멀 수록 작다. 모양은 종모양이다. 우리는 이항분포를 배울 때 저렇게 배우지 않았습니다. 이항분포의 확률질량함수를 먼저 .. 2021. 9. 25.
[손으로 푸는 확률분포] 지수분포 (8) 비기억성 (무기억성) 지수분포의 누적분포함수는 아래와 같습니다. $F(t)=1-e^{-\lambda t}$ 람다는 어떤 사건이 단위시간동안 발생하는 평균 횟수입니다. 누적분포함수 $F(t)$ 는 사건이 발생할 때 까지 걸리는 시간이 t 이하일 확률입니다. 다른 말로 하면 시간 t가 되기 전에 사건이 발생할 확률입니다. 지수분포는 비기억성이라는 대표적인 특징있습니다. 이전 일을 기억하지 못한다는 의미인데요. 수식으로 이해하는 편이 쉽습니다. 아래 성질을 비기억성이라고 합니다. $P(X>a+t|X>a)=P(X>t)$ 먼저 이 성질을 설명하고 나서, 지수분포에서 성립한다는 것을 보이겠습니다. 확률변수 X는 사건이 처음 발생한 시간입니다. 따라서 우변은 t 시간 이후에 사건이 발생할 확률입니다. 사건을 어떤 물건의 '고장'이라고 한.. 2021. 9. 25.
[손으로 푸는 확률분포] 지수분포 (7) 누적분포함수 지수분포는 주로 누적분포함수의 형태로 사용됩니다. 누적분포함수는 영어로 Cumulative distribution function 인데 줄여서 CDF라고 부릅니다. 누적분포함수는 확률밀도함수를 적분하여 구하는데, 지수분포는 그럴 필요가 없습니다. 지수분포의 누적분포함수를 이미 유도했기 때문입니다. 우리는 지수분포의 누적분포함수를 먼저 유도하고, 누적분포함수를 미분하여 확률밀도함수를 구했습니다. 지수분포를 유도할 때, 단위시간 동안 사건이 발생하는 평균 횟수를 λ 로 놓았고. 사건이 처음 발생할 때 까지 걸리는 시간이 T 이하일 확률을 먼저 유도했습니다. 그러고 나서 $f(t)$ 를 구했죠. $$P\left ( 0\leq t\leq T \right )=1-e^{-\lambda T}=\int_{0}^{T}f.. 2021. 1. 18.
[손으로 푸는 확률분포] 지수분포 (6) 분산 (6) 분산 지수분포의 분산을 구해봅시다. 지수분포의 분산은 아래와 같이 구할 수 있습니다. 적분변수가 시간이므로 0부터 무한대 사이의 값을 갖습니다. E(T)는 지난 강의에서 구했습니다. 확률변수의 제곱의 평균항만 구하면 됩니다. 적분형태로 표현하면 아래와 같습니다. 지수분포 함수를 대입하면 아래와 같습니다. 부분적분을 적용합시다. 파란 항은 아래와 같이 변형할 수 있습니다. 파란항이 평균과 같으므로 아래와 같이 계산됩니다. 빨간항은 아래와 같이 계산됩니다. 분수형태로 변형합시다. 로피탈 정리를 이용하면 극한값이 0임을 알 수 있습니다. 결과를 V(T)식에 대입합시다. 이항분포의 분산은 아래와 같이 계산됩니다. 2020. 11. 23.
[손으로 푸는 확률분포] 지수분포 (5) 평균 (5) 평균 지수분포의 평균을 구해봅시다. 지수분포의 평균은 아래와 같이 구할 수 있습니다. 적분변수가 시간이므로 0부터 무한대 사이의 값을 갖습니다. 지수분포 함수를 대입하면 아래와 같습니다. 부분적분을 적용합니다. 마지막 항도 적분해줍시다. 적분상수가 무한대인 경우는 아래와 같이 극한형태로 표현할 수 있습니다. 파란 부분의 극한은 0으로 수렴한다는 것을 쉽게 알 수 있습니다. 따라서 아래와 같이 정리할 수 있습니다. 빨간 부분의 극한이 문제인데요. 아래와 같이 분수형태로 나타내봅시다. 형태를 간단하게 하기 위해 람다를 분자에 곱하고 나눠줍니다. 빨간 limit 안의 부분은 아래와 같은 극한문제와 같습니다. 이제 아래 극한을 구하면 됩니다. 직관적으로는 0이라는 것을 알 수 있습니다. exponenti.. 2020. 11. 16.
[손으로 푸는 확률분포] 지수분포 (4) 예시 : 카페 대기시간 (4) 예시 : 카페 대기시간 지수분포에는 아래와 같은 예시들이 있습니다. - 전자 제품의 5년간 고장횟수가 평균 1회일 때, 1년 안에 고장날 확률 - 평균 대기시간은 10분인 어느 카페에 갔을 때, 기다리는 시간이 10분~20분 사이일 확률 오늘은 두번째 예시입니다. 먼저 람다(λ) 를 구해야야합니다. 프아송분포에서 람다는 딘위시간동안의 평균 발생횟수였습니다. 첫번째 예시는 평균횟수가 드러나 있지만, 두번째 예시는 그렇지 않습니다. 위 정보를 이용하여 구할 있습니다. 대기시간이 10분이라는 것은 10분에 1명꼴로 주문을 한다고 할 수 있습니다. 10분간 평균 주문 횟수가 1회라는 것입니다. 단위시간을 1분으로 놓으면 평균 주문횟수는 0.1회가 됩니다. 따라서 람다는 0.1 입니다. 이때의 지수분포는 .. 2020. 11. 3.
[손으로 푸는 확률분포] 지수분포 (3) 예시 : 전자제품 고장확률 (3) 예시 : 전자제품 고장확률 지수분포에는 아래와 같은 예시들이 있습니다. - 전자 제품의 5년간 고장횟수가 평균 1회일 때, 1년 안에 고장날 확률 - 평균 대기시간은 10분인 어느 카페에 갔을 때, 기다리는 시간이 10분~20분 사이일 확률 우리는 위 예제에서 람다(λ) 를 구해야야합니다. 프아송분포에서 람다는 딘위시간동안의 평균 발생횟수였습니다. 위 상황에서 단위시간을 정하고 발생횟수를 구해야 합니다. 이번글에서는 첫번째 예제를 풀어보겠습니다. 단위시간은 우리가 원하는 대로 설정할 수 있습니다. 예를들어 단위시간을 1년으로 정해봅시다. 평균 5년에 1번 고장나는 것이므로, 1년에는 0.2번 고장난다고 할 수 있습니다. 따라서 람다(λ)는 0.2가 됩니다. 이때의 지수분포는 아래와 같습니다. 1년.. 2020. 10. 26.
[손으로 푸는 확률분포] 지수분포 (2) 유도 (2) 유도 오늘은 지수분포를 유도해봅시다. 먼저 길냥이 예제를 이용하여 유도 과정을 이해하고, 일반화시키도록 하겠습니다. 길냥이 예제를 가져오겠습니다. 하루동안 길냥이를 만날 평균 횟수가 3회 일 때, 하루 동안 길냥이를 x번 만날 확률은 아래와 같았습니다. 아래 분포는 프아송 분포입니다. 이때, 길냥이를 마주칠 때까지 걸리는 기간이 5일 이하일 확률을 구해봅시다. 지수분포함수를 f(t)라고 하면, 길냥이를 마주칠 때까지 걸리는 기간이 5일 이하일 확률은 아래와 같이 표현할 수 있습니다. 위 값은 두가지 방법으로 구할 수 있습니다. 먼저 첫번째 방법입니다. 아래 확률들을 더하는 것입니다. 1일차에 길냥이 만날 확률 1일차에 길냥이 만나지 않고, 2일차에 만날 확률 1,2일차에 길냥이 만나지 않고, 3일.. 2020. 10. 1.
[손으로 푸는 확률분포] 지수분포 (1) 소개 (1) 소개 지수분포는 프아송분포에서 유도된 분포입니다. 아래와 같은 프아송분포가 있다고 합시다. 프아송분포에서 λ 는 단위 시간당 사건의 평균발생횟수였습니다. 프아송분포 강의에서 예로 들었던 길냥이 예제를 가져오겠습니다. 하루동안 길냥이를 만날 평균 횟수가 3회 일 때, 하루 동안 길냥이를 x번 만날 확률이 프아송분포입니다. 이 프아송분포가 성립하는 상황에서 아래 질문이 이어질 수 있습니다. 길냥이를 마주칠 때가지 걸리는 기간이 T일 이하일 확률이 얼마일까? 일반화 시키면 아래와 같은 질문입니다. 단위시간당 사건의 발생 횟수 평균이 λ 일 때, 사건이 처음 발생할 때 까지 걸리는 시간이 T단위시간 이하일 확률이 얼마일까? 그 확률이 아래 면적이 되도록 하는 함수 f(t)가 지수분포입니다. 수식으로 표현.. 2020. 10. 1.
[손으로 푸는 확률분포] 균등분포 (3) 예시 (3) 예시 5분에 한대씩 오는 버스가 있습니다. 임의의 시간에 정류장에 나갔을 때, 버스를 기다릴 시간이 x일 확률을 구해봅시다. 버스를 기다릴 시간은 0분에서 5분 사이입니다. 따라서 X의 범위는 아래와 같습니다. 임의의 시간에 나가는 것이므로 모든 확률은 같습니다. 그런데 X는 셀 수 없는 변수입니다. 연속확률변수입니다. 셀 수 없다는 것은 단순히 그 개수가 무한개라는 것이 아닙니다. 자연수도 개수가 무한개지만 셀 수 있습니다. 1다음에 오는 것이 2입니다. 그런데 위 예제에서 0분 다음에 오는 것이 뭘까요? 0.1분? 0.001분? 셀 수 없습니다. 연속확률변수이기 때문에 함수 값은 확률이 아니라 확률밀도입니다. 이 확률밀도를 일단 k라고 놓고 그래프를 그려봅시다. 확률의 총 합은 1이므로, 닫힌.. 2020. 2. 29.
[손으로 푸는 확률분포] 균등분포 (2) 평균과 분산 (2-1) 평균 확률변수 X가 균등분포를 따를 때, 확률밀도함수는 아래와 같다는 것을 지난시간에 유도했습니다. 균등분포를 따르는 확률변수 X는 연속확률변수입니다. 연속확률변수의 평균은 아래와 같이 구합니다. 균등분포함수에 적용해봅시다. 적분은 어렵지 않습니다. 적분해봅시다. 계산합시다. 인수분해합시다. 약분하면 아래와 같이 균등분포의 평균이 구해집니다. (2-2) 분산 연속확률변수의 분산은 아래와 같이 구합니다. 평균은 위에서 구해서 알고 있으므로, 확률변수의 제곱의 평균만 구하면 됩니다. 위 식에 균등분포의 확률밀도함수를 대입합니다. 적분은 어렵지 않습니다. 적분해봅시다. 계산합시다. 인수분해합시다. 약분하면 아래와 같습니다. 분산을 구하는 식에 넣어줍니다. 맨 오른쪽 항을 계산해줍니다. 통분합시다. .. 2020. 2. 26.
[손으로 푸는 확률분포] 균등분포 (1) 소개,그래프,유도 (1) 소개, 유도, 그래프 이번 시간부터는 연속확률분포를 배워보겠습니다. 오늘 배울 분포는 "균등 분포"입니다. 균등분포는 영어로 uniform distribution 입니다. 더 정확히 이야기하면 '연속균등분포'입니다. 다루지는 않았지만 이산확률분포에서도 균등분포를 정의할 수 있기 때문입니다. 균등분포는 모든 확률변수의 함수값이 동일한 분포입니다. 여기서 함수값은 확률이 아닙니다. 확률 밀도입니다. 확률변수의 범위를 a≤x≤b 로 놓고 함수 값은 k라고 한다면 그래프는 아래와 같이 그릴 수 있습니다. 확률밀도함수에서는 면적이 확률이므로 아래 면적이 1이 됩니다. 따라서 아래 등식이 성립합니다. k를 계산하면 아래와 같습니다. 따라서 균등분포는 아래와 같이 정의할 수 있습니다. 기호로는 아래와 같이 나.. 2020. 2. 24.
[손으로 푸는 확률분포] 이산확률분포들 사이의 관계 우리는 지금까지 이산확률분포들을 배웠습니다. 아래의 7가지 분포입니다. - 베르누이분포 - 이항분포 - 기하분포 - 음이항분포 - 포아송분포 - 초기하분포 - 다항분포 이번 글에서는 각 분포들 사이의 관계망을 만들어보도록 하겠습니다. 베르누이분포로 시작합니다. 베르누이분포는 시행횟수가 1회이고, 시행의 결과가 성공/실패 둘 뿐인 분포입니다. 분포함수는 아래와 같습니다. 기호로는 B(1,p)로 나타냅니다. 베르누이분포에서 시행횟수를 n회로 늘리면 이항분포가 됩니다. 기호로는 B(n,p)로 나타냅니다. 이항분포에서 시행의 결과로 발생하는 사건의 종류를 늘리면 다항분포가 됩니다. 기호로는 M(n,p1,p2,...)로 나타냅니다. 이항분포에서 시행횟수를 무한대로 보내고, 사건 발생확률을 0으로 보내면 푸아송분포.. 2020. 2. 22.
[손으로 푸는 확률분포] 이산확률분포 7가지 총정리 우리는 지금까지 이산확률분포들을 배웠습니다. 아래의 7가지 분포입니다. - 베르누이분포 - 이항분포 - 기하분포 - 음이항분포 - 포아송분포 - 초기하분포 - 다항분포 이번 글에서는 7가지 분포들을 리뷰해봅시다. 정의, 분포함수, 기호, 예시를 표로 정리해보았습니다. 2020. 2. 18.
[손으로 푸는 확률분포] 다항분포 (6) 그래프 (6) 그래프 다항분포의 그래프를 인간이 그리기에는 차원의 한계가 있습니다. 우리는 좌표공간인 3차원까지만 그래프를 그릴 수 있습니다. (색(color)를 이용하면 차원을 하나 늘일 수는 있습니다) 먼저 좌표평면에 그래프를 그려봅시다. 좌표평면에 그래프를 그리려면 독립변수 하나와 종속변수 하나가 필요합니다. 확률분포에서 독립변수는 확률변수이고 종속변수는 확률입니다. 다항분포가 하나의 독립변수를 갖는 경우는 시행의 결과가 두가지 사건으로 나뉠때 입니다. 이는 이항분포와 같고 지난강의에서 설명했습니다. 이항분포의 그래프는 아래와 같습니다. 시행횟수가 커질 수록 좌우 대칭인 종모양에 가까워져갑니다. 이항분포에서 n을 무한대로 보내면 정규분포로 수렵합니다. (참고영상 : http:// https://youtu... 2020. 2. 15.
[손으로 푸는 확률분포] 다항분포 (5) 독립변수의 개수 (5) 독립변수의 개수 시행의 결과가 A,B,C 세가지인 다항분포에서 독립변수의 개수는 몇개일까요? 세개라고 생각하시는 분들이 아마 계실거 같은데 정답은 2개입니다. 시행의 결과가 두가지인 경우를 생각해봅시다. 시행의 결과는 A, B 두가지이고 n번에 시행에서 각각이 발생한 횟수를 x회와 y회라과 하겠습니다. x와 y가 둘 다 독립변수 같아 보이지만 사실 둘 중 하나만 독립변수입니다. x+y=n 이기 때문에 한 변수가 결정되면 다른 변수는 저절로 정해기디 때문입니다. 위 식에서 y=n-x로 바꿔봅시다. 두 확률의 합도 1이므로, 아래와 같이 변형됩니다. 이항분포가 되었죠? 이항분포는 시행의 결과가 두가지인 다항분포입니다. '이항'이라는 말은 시행의 결과가 '두 가지'라는 뜻입니다. 시행의 결과가 '사건의.. 2020. 2. 11.
[손으로 푸는 확률분포] 다항분포 (4) 평균과 분산 (4) 평균과 분산 다항분포의 기댓값은 각 사건별로 구하거나 사건의 합집합의 기댓값을 구할 수 있습니다. 예를 들어 어떤 시행에서 세가지 사건이 발생할 수 있다고 하겠습니다. 사건 A, 사건 B, 사건C 입니다. 한번의 시행에서 각 사건이 발생할 확률은 $P_{A}$, $P_{B}$, $P_{C}$ 라고 합시다. n번의 시행에서 사건 A가 X번, 사건 B가 Y번, 사건 C가 Z번 발생할 확률은 아래와 같습니다. 다항분포의 기댓값을 구해볼건데요. 우리는 각 사건의 기댓값을 구할 수 있고, 여러 사건들의 교집합 또는 합집합의 기댓값을 구할 수 있습니다. 먼저 사건 A의 기댓값을 구해봅시다. 사건 A의 관점에서 보면, 어떤 시행의 결과는 사건 A가 발생하거나 사건 A가 발생하지 않거나의 두가지 입니다. 따라서.. 2020. 2. 7.
[손으로 푸는 확률분포] 다항분포 (3) 예시 (3) 예시 상자가 있습니다. 상자 안에는 100개의 공이 들어있는데요. 빨간공이 20개, 파란공이 30개, 노란공이 50개 들어있습니다. 이 상자에서 복원추출로 공을 10번 뽑을 때, 빨간공이 5개, 파란공이 2개, 노란공이 3개 나올 확률을 구해봅시다. 상자에서 공을 하나 뽑을 때, 각 공이 뽑힐 확률은 아래와 같습니다. 빨간공 : 0.2 파란공 : 0.3 노란공 : 0.5 지난시간에 유도한 다항분포를 적용합시다. 상자 n번 공을 뽑을 때, 빨간공이 X개, 파란공이 Y개, 노란공이 Z개 뽑힐 확률은 아래와 같습니다. $P\left( x,y,z; \ n ; \ 0.2,0.3,0.5 \right)=\frac{n!}{x!y!z!}0.2^x 0.3^y 0.5^z$ 위 예시를 풀기 위해서 X에 5, Y에 2,.. 2020. 2. 6.
[손으로 푸는 확률분포] 다항분포 (2) 유도 (2) 유도 어떤 시행에서 일어날 수 있는 사건이 k개라고 합시다. 사건1,사건2,...,사건k 라고 놓겠습니다. 한번 시행에서 각 사건이 발생할 확률은 아래와 같습니다. 아래 등식이 성립합니다. n번 시행을 했을 때, 각 사건이 발생한 횟수를 아래와 같이 정의합시다. 아래 등식이 성립합니다. 이번에는 확률분포를 구해봅시다. 사건이 n번 발생했을 때, 각 사건이 위와 같이 발생할 확률은 아래와 같습니다. 2020. 1. 15.
[손으로 푸는 확률분포] 다항분포 (1) 소개 (1) 소개 이항분포는 시행의 결과가 두가지입니다. '사건의 발생, 사건이 발생하지 않음' 주사위를 예로 들면 시행의 결과가 아래와 같이 둘로 나뉘는 것입니다. - 6의 눈이 발생 - 6의 눈이 발생하지 않음 시행을 10번 했을 때 6의 눈이 3번 나올 확률 등이 이항분포의 확률에 해당됩니다. 확률을 구하면 아래와 같습니다. 반면에 다항분포는 시행의 결과가 셋 이상입니다. 주사위를 예로 들면 시행의 결과가 아래와 같이 나뉘는 경우가 다항분포가 됩니다 - 1의 눈이 발생 - 2이상 4이하의 눈이 발생 - 5의 눈이 발생 - 6의 눈이 발생 시행을 10번 했을 때 1의 눈이 3번, 2이상 4이하 눈이 5번, 5의 눈이 1번, 6의 눈이 1번 나올 확률이 다항분포에 해당됩니다. 확률을 구하면 아래와 같습니다... 2020. 1. 12.
[손으로 푸는 확률분포] 초기하분포 (8) 이항분포로의 근사 (8) 이항분포로의 근사 초기하분포에서 모집단의 크기를 무한대로 보낼겁니다. 모집단의 크기가 무한대로 가면, 모집단 안에 포함된 우리가 원하는 원소 k도 무한대로 갑니다. 초기하분포의 분포함수는 아래와 같습니다. 팩토리얼 형태로 나타냅시다. 아래와 같이 변형합니다. 빨간 부분끼리 모읍시다. 빨간 부분을 조합으로 표현합시다. 아래와 같이 (M-x)!을 분모와 분자에 곱합니다. 아래와 같이 자리를 바꿔줍니다. 아래와 같이 변형합니다. 나머지 두 항은 아래와 같이 변형합니다. 팩토리얼을 약분해줍니다. 이제 M과 k를 무한대로 보냅시다. 먼저 곱해진 인수의 개수를 알아야 합니다. 아래와 같이 구합니다. k-(k-x)=x M-(M-x)=x M-k-(M-k-(n-x))=n-x M-x-(M-n)=n-x 이제 아래와 .. 2020. 1. 7.
[손으로 푸는 확률분포] 초기하분포 (7) 이항분포와의 차이 (7) 이항분포와의 차이 초기하분포와 이항분포의 차이를 알아봅시다. 먼저 간단한 예시를 통해, 초기하분포를 다른 관점으로 이해해볼 것입니다. 흰구슬이 3개, 검정구슬이 2개 들어있는 상자가 있습니다. 이 상자에서 3개의 공을 꺼낼 때 검정구슬이 1개 포함될 확률을 구해봅시다. 이번에는 공을 1개씩 3번 꺼낼 때, 검정구슬이 1개 포함될 확률을 구해봅시다. 꺼낸 공은 다시 넣지 않습니다. 비복원추출입니다. 공이 뽑히는 순서에 따라 세가지 경우로 나뉩니다. 검흰흰 흰검흰 흰흰검 각각의 확률을 구해봅시다. 따라서 검은공이 한번 나올 확률은 아래와 같이 계산됩니다. 두 결과가 같습니다. 따라서 초기하분포는 크기가 M이고, 우리가 원하는 원소가 k개 들어있는 모집단에서, 크기가 1인 표본을 비복원추출로 n번 뽑을.. 2020. 1. 7.
[손으로 푸는 확률분포] 초기하분포 (6) 이름에 '초기하'가 붙은 이유 (6) 이름의 유래이름에 '초기하'가 붙은 이유 초기하분포라는 이름이 어떻게 붙여졌는지 알기 위해서는 시간을 거슬러 올라가야합니다. 초기하분포는 초기하함수로부터 이름이 붙여졌고, 초기하함수는 다시 기하급수로 부터 유리된 이름입니다. 기하급수는 기하수열의 합입니다. 기하수열은 우리가 잘 아는 '등비수열'입니다. 따라서 유래의 순서는 아래와 같습니다. 기하(등비)수열 → 기하(등비)급수 → 초기하함수 → 초기하분포 기하수열을 하나 정의합시다. 공비를 r이라고 하겠습니다. 이 기하수열의 합이 기하급수입니다. 만약 r이 -1보다 크고 1보다 작고, n이 무한대로 갈 때 아래의 값으로 수렴합니다. 이 기하급수와 초기하함수와는 어떤 관계가 있을까요? 초기하함수는 여러 특수한 함수들을 포함하는 함수입니다. 어떤 변수.. 2019. 12. 28.
[손으로 푸는 확률분포] 초기하분포 (5) 그래프 (5) 그래프 초기하분포의 그래프를 그려봅시다. 초기하분포의 확률질량함수는 아래와 같습니다. $p(x)=\frac{_{k}C_{x}\cdot _{M-k}C_{n-x}}{_{M}C_{n}}$ 용어의 의미는 아래와 같습니다. 모집단의 크기 : M 모집단 중 원하는 원소 개수 : k 표본의 크기 : n 표본 중 원하는 원소 개수 : x 그래프 내에서는 표본의 크기 n을 바꾸고, 그래프 간에는 모집단 중 원하는 원소 수인 k를 바꿨습니다. 아래는 확률질량함수입니다. n이 커질 수록 그래프가 오른 쪽으로 이동하고, k가 커져도 그래프가 오른 쪽으로 이동합니다. 아래는 누적분포함수입니다. 사용한 코드는 아래와 같습니다. #####################################################.. 2019. 12. 24.
[손으로 푸는 확률분포] 초기하분포 (4) 분산 (4) 분산 이산확률변수 X의 분산은 아래와 같이 구합니다. 초기하분포의 평균을 대입하면 아래와 같습니다. 확률변수의 제곱의 평균을 시그마 형태로 바꾸면 아래와 같습니다. 이항분포의 확률분포는 아래와 같습니다. 분산을 구하던 식에 대입합시다. 아래와 같이 조합을 전개합시다. x에 0을 넣어주면 항이 0이 되므로, 1로 바꿔줘도 결과가 동일합니다. 약분하고 k를 꺼냅시다. 약분하고 k를 꺼냅시다. 평균을 유도할 때 사용했던 아래 원리를 이용하여 변형합시다. 아래와 같이 변형됩니다. n과 M을 밖으로 꺼냅시다. 아래와 같이 변형합시다. 첫번째 팩토리얼 식을 조합 식으로 바꿔줍시다. x-1을 y로 치환합니다. y+1을 전개합니다. 위 식의 빨간 부분은 모집단이 M-1, 모집단에 우리가 원하는 원소가 k-1개,.. 2019. 12. 17.
[손으로 푸는 확률분포] 초기하분포 (3) 평균 (3) 평균 이산확률변수 X의 평균은 아래와 같이 구합니다. 초기하분포의 확률분포는 아래와 같습니다 . 따라서 초기하분포의 평균은 아래와 같습니다. 아래와 같이 전개합시다. x를 약분하고, k를 하나 꺼냅시다. x에 0을 넣으면 항이 0이므로, x를 1부터 시작해도 됩니다. $MCN_{M}C_{n}$ 을 아래와 같이 변형할 수 있습니다. 평균을 계산하던 식에 대입합시다. 팩토리얼 식은 아래와 같이 조합으로 쓸 수 있습니다. M과 n을 밖으로 꺼냅시다. x-1를 y로 치환합시다. 위 식의 시그마 부분은 모집단의 크기가 M-1, 모집단 안에 우리가 원하는 원소가 k-1개, 표본의 크기 n-1개, 표본 안에 우리가 원하는 원소 y개인 초기하분포의 값의 합입니다. 따라서 1이 됩니다. 평균은 구했습니다. 이번에.. 2019. 12. 17.
[손으로 푸는 확률분포] 초기하분포 (2) 유도 (2) 유도 모집단의 크기는 M입니다. 모집단 안에는 우리가 원하는 원소가 k개 있습니다. 모집단에서 크기가 n인 표본을 뽑는 경우의 수는 아래와 같습니다. $_{M}C_{n}$ 우리가 뽑은 크기 n인 표본 안에 우리가 원하는 원소 x개가 들어 있을 경우의 수를 구해봅시다. 모집단에 있는 k개 중에서 x개가 뽑혀야 합니다. 총 n개가 뽑혀야 하므로, 나머지는 모집단에 있는 우리가 원하지 않는 것의 수 즉 M-k개 중에서 n-x개가 뽑히면 됩니다. 조합식으로 표현하며 아래와 같습니다. $_{k}C_{x}\cdot _{M-k}C_{n-x}$ 이산확률분포는 우리가 원하는 원소가 k개 들어 있는 크기가 M인 모집단에서 표본 n개를 뽑을 때, 우리가 원하는 원소가 x개 들어있을 확률분포입니다. 따라서 아래 확률은.. 2019. 12. 16.
[손으로 푸는 확률분포] 초기하분포 (1) 소개 (1) 소개 모집단이 있습니다. 모집단의 크기는 M입니다. 모집단 안에는 우리가 원하는 원소가 k개 있습니다. 모집단에서 크기가 n인 표본을 뽑을 것입니다. 이 표본 안에 우리가 원하는 원소가 x개 있을 확률분포가 초기하분포 입니다. 모집단의 크기 : M 모집단 중 원하는 원소 개수 : k 표본의 크기 : n 표본 중 원하는 원소 개수 : x 로또를 예로들어봅시다. 로또는 45개 숫자 중에서 6개를 맞추는 것입니다. 45개라는 모집단에 우리가 원하는 숫자 6개가 있는 것입니다. 45개라는 모집단에서 6개를 뽑았고, 그 중 우리가 원하는 숫자의 개수를 x라고 놓는다면 초기하분포가 됩니다. M : 45 k : 6 n : 6 x : 맞춘 번호 수 2019. 12. 5.
[손으로 푸는 확률분포] 푸아송분포 (6) 그래프 (6) 그래프 푸아송 분포의 그래프는 아래와 같습니다. 람다를 5부터 70까지 키워가며 그래프를 그렸습니다. 세로선은 평균입니다. 푸아송분포의 평균과 분산이 모두 λ입니다. λ가 커지면 평균이 커지는 것이므로 그래프가 우측으로 이동합니다. λ가 커지면 분산이 커지는 것이므로, 그래프가 좌우로 퍼집니다. 그래프는 R을 이용하여 그렸습니다. 아래는 사용 코드입니다. plot(0,type='n',ylim=c(0,0.2),xlim=c(0,100),ann=FALSE) title(main="Poisson distribution", xlab="x",ylab="p(x)") lambda=c(5,10,30,50,70) for (i in 1:5) { x=1:100 y=dpois(x, lambda[i], log = FALSE.. 2019. 12. 3.
반응형