본문 바로가기
반응형

이산확률분포22

[손으로 푸는 확률분포] 이산확률분포들 사이의 관계 우리는 지금까지 이산확률분포들을 배웠습니다. 아래의 7가지 분포입니다. - 베르누이분포 - 이항분포 - 기하분포 - 음이항분포 - 포아송분포 - 초기하분포 - 다항분포 이번 글에서는 각 분포들 사이의 관계망을 만들어보도록 하겠습니다. 베르누이분포로 시작합니다. 베르누이분포는 시행횟수가 1회이고, 시행의 결과가 성공/실패 둘 뿐인 분포입니다. 분포함수는 아래와 같습니다. 기호로는 B(1,p)로 나타냅니다. 베르누이분포에서 시행횟수를 n회로 늘리면 이항분포가 됩니다. 기호로는 B(n,p)로 나타냅니다. 이항분포에서 시행의 결과로 발생하는 사건의 종류를 늘리면 다항분포가 됩니다. 기호로는 M(n,p1,p2,...)로 나타냅니다. 이항분포에서 시행횟수를 무한대로 보내고, 사건 발생확률을 0으로 보내면 푸아송분포.. 2020. 2. 22.
[손으로 푸는 확률분포] 이산확률분포 7가지 총정리 우리는 지금까지 이산확률분포들을 배웠습니다. 아래의 7가지 분포입니다. - 베르누이분포 - 이항분포 - 기하분포 - 음이항분포 - 포아송분포 - 초기하분포 - 다항분포 이번 글에서는 7가지 분포들을 리뷰해봅시다. 정의, 분포함수, 기호, 예시를 표로 정리해보았습니다. 2020. 2. 18.
[손으로 푸는 확률분포] 다항분포 (6) 그래프 (6) 그래프 다항분포의 그래프를 인간이 그리기에는 차원의 한계가 있습니다. 우리는 좌표공간인 3차원까지만 그래프를 그릴 수 있습니다. (색(color)를 이용하면 차원을 하나 늘일 수는 있습니다) 먼저 좌표평면에 그래프를 그려봅시다. 좌표평면에 그래프를 그리려면 독립변수 하나와 종속변수 하나가 필요합니다. 확률분포에서 독립변수는 확률변수이고 종속변수는 확률입니다. 다항분포가 하나의 독립변수를 갖는 경우는 시행의 결과가 두가지 사건으로 나뉠때 입니다. 이는 이항분포와 같고 지난강의에서 설명했습니다. 이항분포의 그래프는 아래와 같습니다. 시행횟수가 커질 수록 좌우 대칭인 종모양에 가까워져갑니다. 이항분포에서 n을 무한대로 보내면 정규분포로 수렵합니다. (참고영상 : http:// https://youtu... 2020. 2. 15.
[손으로 푸는 확률분포] 초기하분포 (7) 이항분포와의 차이 (7) 이항분포와의 차이 초기하분포와 이항분포의 차이를 알아봅시다. 먼저 간단한 예시를 통해, 초기하분포를 다른 관점으로 이해해볼 것입니다. 흰구슬이 3개, 검정구슬이 2개 들어있는 상자가 있습니다. 이 상자에서 3개의 공을 꺼낼 때 검정구슬이 1개 포함될 확률을 구해봅시다. 이번에는 공을 1개씩 3번 꺼낼 때, 검정구슬이 1개 포함될 확률을 구해봅시다. 꺼낸 공은 다시 넣지 않습니다. 비복원추출입니다. 공이 뽑히는 순서에 따라 세가지 경우로 나뉩니다. 검흰흰 흰검흰 흰흰검 각각의 확률을 구해봅시다. 따라서 검은공이 한번 나올 확률은 아래와 같이 계산됩니다. 두 결과가 같습니다. 따라서 초기하분포는 크기가 M이고, 우리가 원하는 원소가 k개 들어있는 모집단에서, 크기가 1인 표본을 비복원추출로 n번 뽑을.. 2020. 1. 7.
[손으로 푸는 확률분포] 초기하분포 (6) 이름에 '초기하'가 붙은 이유 (6) 이름의 유래이름에 '초기하'가 붙은 이유 초기하분포라는 이름이 어떻게 붙여졌는지 알기 위해서는 시간을 거슬러 올라가야합니다. 초기하분포는 초기하함수로부터 이름이 붙여졌고, 초기하함수는 다시 기하급수로 부터 유리된 이름입니다. 기하급수는 기하수열의 합입니다. 기하수열은 우리가 잘 아는 '등비수열'입니다. 따라서 유래의 순서는 아래와 같습니다. 기하(등비)수열 → 기하(등비)급수 → 초기하함수 → 초기하분포 기하수열을 하나 정의합시다. 공비를 r이라고 하겠습니다. 이 기하수열의 합이 기하급수입니다. 만약 r이 -1보다 크고 1보다 작고, n이 무한대로 갈 때 아래의 값으로 수렴합니다. 이 기하급수와 초기하함수와는 어떤 관계가 있을까요? 초기하함수는 여러 특수한 함수들을 포함하는 함수입니다. 어떤 변수.. 2019. 12. 28.
[손으로 푸는 확률분포] 초기하분포 (4) 분산 (4) 분산 이산확률변수 X의 분산은 아래와 같이 구합니다. 초기하분포의 평균을 대입하면 아래와 같습니다. 확률변수의 제곱의 평균을 시그마 형태로 바꾸면 아래와 같습니다. 이항분포의 확률분포는 아래와 같습니다. 분산을 구하던 식에 대입합시다. 아래와 같이 조합을 전개합시다. x에 0을 넣어주면 항이 0이 되므로, 1로 바꿔줘도 결과가 동일합니다. 약분하고 k를 꺼냅시다. 약분하고 k를 꺼냅시다. 평균을 유도할 때 사용했던 아래 원리를 이용하여 변형합시다. 아래와 같이 변형됩니다. n과 M을 밖으로 꺼냅시다. 아래와 같이 변형합시다. 첫번째 팩토리얼 식을 조합 식으로 바꿔줍시다. x-1을 y로 치환합니다. y+1을 전개합니다. 위 식의 빨간 부분은 모집단이 M-1, 모집단에 우리가 원하는 원소가 k-1개,.. 2019. 12. 17.
[손으로 푸는 확률분포] 초기하분포 (3) 평균 (3) 평균 이산확률변수 X의 평균은 아래와 같이 구합니다. 초기하분포의 확률분포는 아래와 같습니다 . 따라서 초기하분포의 평균은 아래와 같습니다. 아래와 같이 전개합시다. x를 약분하고, k를 하나 꺼냅시다. x에 0을 넣으면 항이 0이므로, x를 1부터 시작해도 됩니다. $MCN_{M}C_{n}$ 을 아래와 같이 변형할 수 있습니다. 평균을 계산하던 식에 대입합시다. 팩토리얼 식은 아래와 같이 조합으로 쓸 수 있습니다. M과 n을 밖으로 꺼냅시다. x-1를 y로 치환합시다. 위 식의 시그마 부분은 모집단의 크기가 M-1, 모집단 안에 우리가 원하는 원소가 k-1개, 표본의 크기 n-1개, 표본 안에 우리가 원하는 원소 y개인 초기하분포의 값의 합입니다. 따라서 1이 됩니다. 평균은 구했습니다. 이번에.. 2019. 12. 17.
[손으로 푸는 확률분포] 초기하분포 (2) 유도 (2) 유도 모집단의 크기는 M입니다. 모집단 안에는 우리가 원하는 원소가 k개 있습니다. 모집단에서 크기가 n인 표본을 뽑는 경우의 수는 아래와 같습니다. $_{M}C_{n}$ 우리가 뽑은 크기 n인 표본 안에 우리가 원하는 원소 x개가 들어 있을 경우의 수를 구해봅시다. 모집단에 있는 k개 중에서 x개가 뽑혀야 합니다. 총 n개가 뽑혀야 하므로, 나머지는 모집단에 있는 우리가 원하지 않는 것의 수 즉 M-k개 중에서 n-x개가 뽑히면 됩니다. 조합식으로 표현하며 아래와 같습니다. $_{k}C_{x}\cdot _{M-k}C_{n-x}$ 이산확률분포는 우리가 원하는 원소가 k개 들어 있는 크기가 M인 모집단에서 표본 n개를 뽑을 때, 우리가 원하는 원소가 x개 들어있을 확률분포입니다. 따라서 아래 확률은.. 2019. 12. 16.
[손으로 푸는 확률분포] 초기하분포 (1) 소개 (1) 소개 모집단이 있습니다. 모집단의 크기는 M입니다. 모집단 안에는 우리가 원하는 원소가 k개 있습니다. 모집단에서 크기가 n인 표본을 뽑을 것입니다. 이 표본 안에 우리가 원하는 원소가 x개 있을 확률분포가 초기하분포 입니다. 모집단의 크기 : M 모집단 중 원하는 원소 개수 : k 표본의 크기 : n 표본 중 원하는 원소 개수 : x 로또를 예로들어봅시다. 로또는 45개 숫자 중에서 6개를 맞추는 것입니다. 45개라는 모집단에 우리가 원하는 숫자 6개가 있는 것입니다. 45개라는 모집단에서 6개를 뽑았고, 그 중 우리가 원하는 숫자의 개수를 x라고 놓는다면 초기하분포가 됩니다. M : 45 k : 6 n : 6 x : 맞춘 번호 수 2019. 12. 5.
[손으로 푸는 확률분포] 푸아송분포 (5) 분산 (5) 분산 푸아송 분포의 분산을 구해봅시다. 푸아송 분포함수는 아래와 같습니다. 푸아송분포의 분산은 아래와 같이 구합니다. x가 1부터 시작해도 결과가 같습니다. x를 약분합니다. 아래와 같이 변형합니다. 람다를 꺼냈습니다. x-1을 n으로 치환합니다. 전개합니다. 빨간 부분은 푸아송분포의 평균입니다. 파랑부분은 푸아송분포함수값의 총 합이므로 1입니다. 계산하면 아래와 같습니다. 2019. 12. 1.
[손으로 푸는 확률분포] 음이항분포 (6) 이름의 유래 (6) 이름의 유래 음이항분포에서 '음'은 양수/음수에서의 '음'입니다. 영어로는 negative 입니다. 왜 이런 이름이 붙었는지 알아봅시다. 이항분포 함수는 아래와 같이 생겼습니다. 앞에 조합형태로 곱해져 있는 값을 '이항계수'라고 부릅니다. 한편 음이항분포 함수는 아래와 같은 모양입니다. 음이항분포의 계수를 변형해보겠습니다. 먼저 펙토리얼 형태로 써봅시다. 분자에서 (r-1)!를 약분하면 아래와 같습니다. 우변 분자의 인수 개수가 x개입니다. 따라서 아래와 같이 변형할 수 있습니다. -1을 x개를 두번 곱해준 것과 같습니다. 결과적으로 1을 곱한 것이라 수식에 변화는 없습니다. 이번에는 양변에 (-r-x)! 을 곱해줍시다. 음수의 팩토리얼이라 직관적으로 완전히 받아들여지지는 않지만, 수식계산을 할 .. 2019. 9. 14.
[손으로 푸는 확률분포] 음이항분포 (5) 그래프 5) 그래프 음이항분포는 r번의 실패(사건 미발생)가 나오기까지 성공(사건발생)이 x번 발생할 확률분포입니다. 음이항분포의 분포함수, 평균, 분산은 아래와 같습니다. r이 커질수록 평균과 분산은 커집니다. p가 커질 수록 평균과 분산이 커집니다. r이 커질 수록 평균이 커진다는 것은 r이 커질 수록 성공횟수 x가 높은 값에서 발생할 확률이 높아진다는 말입니다. 예를 들어서 r이 1이고 x가 10이라고 해봅시다. 이때는 성공이 10번 연속 발생하고, 마지막에 실패가 1번 발생해야 하는데 이 확률은 정말 작습니다. r이 10이고 x가 10이라면 확률이 더 높아질 것입니다. 또 반대로 r이 10인데 x가 1인 경우에도 확률이 희박해집니다. 물론 p의 영향을 받겠지만, r이 커지면 r이 작을때에 비해서 큰 값의.. 2019. 7. 19.
[손으로 푸는 확률분포] 음이항분포 (1) 소개 1) 소개 (음이항분포는 여러가지로 정의된다!) 이미 배운 기하분포를 떠올려봅시다. 음이항분포는 기하분포의 확장버젼이라고 할 수 있습니다. 더 정확히 말하면 음이항분포의 여러 정의중 하나가, 기하분포의 확장버전입니다. 기하분포의 정의는 아래와 같습니다. 성공확률을 p라고 했을 때, x번째 시행에서 첫번째 성공이 나올 확률 p(x)의 분포 이 정의에서 첫번째를 k번째로 바꾸면 음이항분포가 됩니다. 성공확률을 p라고 했을 때, x번째 시행에서 k번째 성공이 나올 확률 p(x)의 분포. 위 음이항분포를 보면, 사전에 정의되어야할 값이 성공확률 p 말고 k도 있습니다. p와 k이 정해져야 확률분포함수가 정의된다는 말입니다. 음이항분포는 위의 방법 외에 정의하는 방법이 더 있습니다. 또한 위 방법은 일반적으로 사.. 2019. 7. 4.
[손으로 푸는 확률분포] 기하분포 (6) 이름의 유래 6) 기하분포 이름의 유래 문득 이름이 왜 '기하분포'인지 궁금해졌습니다. 자료들을 찾아보니 기하분포는 '기하수열'에서 온 말이라고 합니다. 기하수열은 다시 '기하평균'에서 온 말입니다. 기하평균(geometric mean) → 기하(등비)수열(Geometric sequence) → 기하분포(Geometric distribution) 기하(등비)수열과 기하평균에 기하라는 이름이 붙어있는데요. '기하(geometric)'는 어떤 의미인지 먼저 알아봅시다. 기하는 '선' '곡선' '도형'에 관련된 것을 의미합니다. 기하평균은 도형에서 발견한 평균입니다. 아래와 같은 사각형을 봅시다. 변의 길이가 a와 c인 직사각형이 있습니다. 넓이의 관점에서 이 길이의 평균은 얼마일까요. 넓이가 유지되도록 하는 b를 찾으면.. 2019. 7. 4.
[손으로 푸는 확률분포] 기하분포 (5) 그래프 5) 그래프 기하분포의 분포함수는 아래와 같습니다. 성공확률을 0.1,0.3,0.5,0.7,0.9 놓고 각각의 그래프를 그렸습니다. 성공확률이 높을 수록 감소하는 속도가 빠릅니다. 2019. 7. 4.
[손으로 푸는 확률분포] 기하분포 (4) 분산 4-2) 통계량 - 분산 기하분포의 분산은 아래와 같이 정의됩니다. 시그마를 전개해봅시다. 아래 식을 1번식이라고 하겠습니다. 양변에 (1-p)를 곱합시다. 1식에서 2식을 빼겠습니다. 이제 빨간색 부분을 시그마 형태로 다시 바꿔봅시다. 양변의 p는 약분하구요. 시그마 안쪽의 식을 인수분해합니다. 계산하면 아래와 같습니다. 전개해봅시다. 빨간부분은 평균을 구할때의 식에서 p가 빠진 형태와 동일합니다. 따라서 평균의 결과를 p로 나눠준 값과 동일합니다. 파란부분은 등비수열의 합으로 구할 수 있고, 마지막 항은 0으로 수렴합니다. 계산해봅시다. 이제 아래 식에 결과를 넣어봅시다. 2019. 7. 4.
[손으로 푸는 확률분포] 기하분포 (3~4) 유도, 평균 3) 일반화(유도) 어떤 사건이 발생할 확률이 p라고 합시다. 사건이 발생하지 않을 확률은 1-p 입니다. 성공과 실패로 봐도 됩니다. 이때 기하분포는 아래와 같습니다. 확률변수 x는 모든 자연수입니다. 기호로는 아래와 같이 나타냅니다. 4-1) 통계량 - 평균 미적분을 이용해서 유도하는 짧은 방법이 있긴 한데, 더 많은 분들이 이해할 수 있도록 길지만 미적분이 들어가지 않는 방법으로 유도하겠습니다. 기하분포의 평균은 아래와 같이 정의됩니다. 시그마를 전개해봅시다. 확률변수는 모든 자연수이기 때문에 극한이 등장합니다. 아래 식을 1번 식이라고 합시다. $E(X)=\lim_{n\rightarrow \infty}p\left \{ 1+2(1-p)+\cdots +(n-1)(1-p)^{n-2}+n(1-p)^{n-.. 2019. 7. 4.
[손으로 푸는 확률분포] 기하분포 (1~2) 소개, 예시 1) 소개 베르누이 시행을 반복할 때, 처음 성공이 나오기까지 시행한 횟수를 확률변수 x로 할때의 확률분포입니다. 예를들어 확률변수가 4일 때의 확률은 "실패-실패-실패-성공" 인 경우의 확률입니다. 또 다른 정의도 있는데, 처음 성공이 나오기까지 실패한 횟수를 확률변수로 하는 경우도 있습니다. 이때는 확률변수 4의 확률이 "실패-실패-실패-실패-성공"의 확률이 됩니다. 본 글에서는 전자의 정의(성공이 나오기까지 시행한 횟수)를 따르겠습니다. 2) 예시 연애를 시작한 남녀가 결혼할 확률이 5%라고 가정합시다. x번째 사귄 이성과 결혼하게 될 확률분포가 기하분포입니다. 2019. 7. 4.
[손으로 푸는 확률분포] 이항분포 (1~2) 소개, 예시 1) 소개 베르누이 시행을 n번 했습니다. 각각의 시행은 독립시행입니다. 각 시행이 독립이라는 것은 베르누이 시행의 조건 중 하나입니다. 따라서 베르누이시행이라고 말하면 독립이라고 따로 언급할 필요는 없습니다. 이 시행에서 사건이 발생할 확률을 p라고 하고, 사건이 발행한 횟수를 확률변수 x로 할 때의 분포가 이항분포입니다. 2) 예시 어떤 농구선수의 자유투 성공률은 80%입니다. 공을 10번 던질 때, 자유투의 성공 횟수와 그 확률을 구해하면 아래와 같습니다. 자유투 성공횟수를 확률변수 x로 놓겠습니다. 예를 들어 자유투가 두번 성공할 확률을 구하면 아래와 같습니다. 2019. 7. 4.
[손으로 푸는 확률분포] 베르누이분포 (3~5) 유도, 통계량, 그래프 3) 일반화(유도) 어떤 시행의 결과가 성공, 혹은 실패라고 합시다. 성공할 확률은 p이고 실패할 확률은 1-p 또는 q입니다. 시행이 성공하면 1, 실패하면 0의 값을 갖습니다. 이때, 베르누이 분포는 아래와 같습니다. 또는 아래와 같이 쓸 수도 있습니다. 4) 통계량(평균,분산) 베르누이분포의 평균은 아래와 같이 계산합니다. 베르누이분포의 분산은 아래와 같이 계산합니다. 5) 그래프 베르누이분포의 그래프는 아래와 같습니다. 2019. 7. 4.
[손으로 푸는 확률분포] 베르누이분포 (1~2) 소개, 예시 1) 소개 베르누이 분포는 시행의 횟수가 1회이고, 시행의 결과가 오직 두 가지인 분포입니다. 시행의 두가지 결과를 보통 '성공' 과 '실패'라고 부릅니다. 시행횟수 : 1회 시행결과 : 성공 or 실패 성공은 1의 값을 실패는 0의 값을 갖습니다. 확률변수가 0과 1인 뿐인 것입니다. 이름만 거창하지 알고 나면 굉장히 단순한 확률분포입니다. 시행의 결과가 오직 두가지 뿐인 시행을 '베르누이 시행'이라고 합니다. 베르누이분포보다 베르누이시행이라는 말을 더 자주보게 될겁니다. 동전을 던지는 시행, 주사위를 던질 때 2가 나오는 시행 등이 베르누이시행입니다. 앞면/뒷면 또는 주사위눈이2/주사위눈이2가아님, 이렇게 두가지 결과만을 갖는 시행이기 때문입니다. 2) 예시 빨간공 7개와 검정공 3개가 들어있는 주머.. 2019. 5. 8.
[손으로 푸는 확률분포] 확률분포의 종류 (연속확률분포, 이산확률분포) 통계학에서 사용되는 다양한 확률분포들을 설명하는 강의입니다. 각 확률분포의 간단한 예시, 유도, 통계량 계산, 그래프 등의 내용을 다룰 것입니다. 확률분포는 크게 '이산확률분포'와 '연속확률분포'로 나뉩니다. 이산확률분포는 확률변수의 개수를 셀 수 있는 경우를 말합니다. 개수가 유한개로 한정되지는 않습니다. 자연수는 무한개이지만 이산확률변수에 속합니다. 순서대로 셀 수 있기 때문입니다. 연속확률분포는 확률변수가 셀 수 없는 경우의 분포를 말합니다. 이산확률분포 : 확률변수 개수를 셀 수 있음 연속확류분포 : 확률변수 개수를 셀 수 없음 1. 이산확률분포 종류 강의에서 다룰 이산확률분포는 아래와 같습니다. - 베르누이분포 - 이항분포 - 기하분포 - 음이항분포 - 포아송분포 - 초기하분포 - 다항분포 2... 2018. 12. 24.
반응형