본문 바로가기
반응형

@ 필수과목159

[손으로 푸는 통계 ver1.0] 48. 표본분산의 분포 유도 (13) 감마함수의 등장 (보완) 지난시간에 설명한 감마함수의 등장과정이 매끄럽지 않은 것 같아서 한번 더 설명하려고 합니다. 매끄럽지 않은 부분부터 말씀드리겠습니다. f(n)=(n-1)! 에서 도출할 수 있는 식은 아래와 같습니다. f(n)=(n-1)f(n-1) 이 식을 실수 x로 확장한다는 부분입니다. f(x)=(x-1)f(x-1) 위 성질이 결국 만족하게 되기는 하지만, n을 갑자기 x로 바꾸는 부분이 매끄럽지 않습니다. 팩토리얼 함수 이후부터 다시 설명하겠습니다. 팩토리얼 함수는 아래와 같이 정의했었습니다. f(n)=(n-1)! 0과 양의정수에서 정의된 함수입니다. 이 함수를 실수의 영역으로 확장해야하는데요. 실수 영역으로 확장한다는 것의 의미를 이해해봅시다. 팩토리얼 함수를 그래프로 그려보면 아래와 같습니다. 팩토리얼함수를 실수.. 2020. 12. 14.
[손으로 푸는 확률분포] 지수분포 (6) 분산 (6) 분산 지수분포의 분산을 구해봅시다. 지수분포의 분산은 아래와 같이 구할 수 있습니다. 적분변수가 시간이므로 0부터 무한대 사이의 값을 갖습니다. E(T)는 지난 강의에서 구했습니다. 확률변수의 제곱의 평균항만 구하면 됩니다. 적분형태로 표현하면 아래와 같습니다. 지수분포 함수를 대입하면 아래와 같습니다. 부분적분을 적용합시다. 파란 항은 아래와 같이 변형할 수 있습니다. 파란항이 평균과 같으므로 아래와 같이 계산됩니다. 빨간항은 아래와 같이 계산됩니다. 분수형태로 변형합시다. 로피탈 정리를 이용하면 극한값이 0임을 알 수 있습니다. 결과를 V(T)식에 대입합시다. 이항분포의 분산은 아래와 같이 계산됩니다. 2020. 11. 23.
[손으로 푸는 확률분포] 지수분포 (5) 평균 (5) 평균 지수분포의 평균을 구해봅시다. 지수분포의 평균은 아래와 같이 구할 수 있습니다. 적분변수가 시간이므로 0부터 무한대 사이의 값을 갖습니다. 지수분포 함수를 대입하면 아래와 같습니다. 부분적분을 적용합니다. 마지막 항도 적분해줍시다. 적분상수가 무한대인 경우는 아래와 같이 극한형태로 표현할 수 있습니다. 파란 부분의 극한은 0으로 수렴한다는 것을 쉽게 알 수 있습니다. 따라서 아래와 같이 정리할 수 있습니다. 빨간 부분의 극한이 문제인데요. 아래와 같이 분수형태로 나타내봅시다. 형태를 간단하게 하기 위해 람다를 분자에 곱하고 나눠줍니다. 빨간 limit 안의 부분은 아래와 같은 극한문제와 같습니다. 이제 아래 극한을 구하면 됩니다. 직관적으로는 0이라는 것을 알 수 있습니다. exponenti.. 2020. 11. 16.
[손으로 푸는 확률분포] 지수분포 (4) 예시 : 카페 대기시간 (4) 예시 : 카페 대기시간 지수분포에는 아래와 같은 예시들이 있습니다. - 전자 제품의 5년간 고장횟수가 평균 1회일 때, 1년 안에 고장날 확률 - 평균 대기시간은 10분인 어느 카페에 갔을 때, 기다리는 시간이 10분~20분 사이일 확률 오늘은 두번째 예시입니다. 먼저 람다(λ) 를 구해야야합니다. 프아송분포에서 람다는 딘위시간동안의 평균 발생횟수였습니다. 첫번째 예시는 평균횟수가 드러나 있지만, 두번째 예시는 그렇지 않습니다. 위 정보를 이용하여 구할 있습니다. 대기시간이 10분이라는 것은 10분에 1명꼴로 주문을 한다고 할 수 있습니다. 10분간 평균 주문 횟수가 1회라는 것입니다. 단위시간을 1분으로 놓으면 평균 주문횟수는 0.1회가 됩니다. 따라서 람다는 0.1 입니다. 이때의 지수분포는 .. 2020. 11. 3.
[손으로 푸는 확률분포] 지수분포 (3) 예시 : 전자제품 고장확률 (3) 예시 : 전자제품 고장확률 지수분포에는 아래와 같은 예시들이 있습니다. - 전자 제품의 5년간 고장횟수가 평균 1회일 때, 1년 안에 고장날 확률 - 평균 대기시간은 10분인 어느 카페에 갔을 때, 기다리는 시간이 10분~20분 사이일 확률 우리는 위 예제에서 람다(λ) 를 구해야야합니다. 프아송분포에서 람다는 딘위시간동안의 평균 발생횟수였습니다. 위 상황에서 단위시간을 정하고 발생횟수를 구해야 합니다. 이번글에서는 첫번째 예제를 풀어보겠습니다. 단위시간은 우리가 원하는 대로 설정할 수 있습니다. 예를들어 단위시간을 1년으로 정해봅시다. 평균 5년에 1번 고장나는 것이므로, 1년에는 0.2번 고장난다고 할 수 있습니다. 따라서 람다(λ)는 0.2가 됩니다. 이때의 지수분포는 아래와 같습니다. 1년.. 2020. 10. 26.
[손으로 푸는 확률분포] 지수분포 (2) 유도 (2) 유도 오늘은 지수분포를 유도해봅시다. 먼저 길냥이 예제를 이용하여 유도 과정을 이해하고, 일반화시키도록 하겠습니다. 길냥이 예제를 가져오겠습니다. 하루동안 길냥이를 만날 평균 횟수가 3회 일 때, 하루 동안 길냥이를 x번 만날 확률은 아래와 같았습니다. 아래 분포는 프아송 분포입니다. 이때, 길냥이를 마주칠 때까지 걸리는 기간이 5일 이하일 확률을 구해봅시다. 지수분포함수를 f(t)라고 하면, 길냥이를 마주칠 때까지 걸리는 기간이 5일 이하일 확률은 아래와 같이 표현할 수 있습니다. 위 값은 두가지 방법으로 구할 수 있습니다. 먼저 첫번째 방법입니다. 아래 확률들을 더하는 것입니다. 1일차에 길냥이 만날 확률 1일차에 길냥이 만나지 않고, 2일차에 만날 확률 1,2일차에 길냥이 만나지 않고, 3일.. 2020. 10. 1.
[손으로 푸는 확률분포] 지수분포 (1) 소개 (1) 소개 지수분포는 프아송분포에서 유도된 분포입니다. 아래와 같은 프아송분포가 있다고 합시다. 프아송분포에서 λ 는 단위 시간당 사건의 평균발생횟수였습니다. 프아송분포 강의에서 예로 들었던 길냥이 예제를 가져오겠습니다. 하루동안 길냥이를 만날 평균 횟수가 3회 일 때, 하루 동안 길냥이를 x번 만날 확률이 프아송분포입니다. 이 프아송분포가 성립하는 상황에서 아래 질문이 이어질 수 있습니다. 길냥이를 마주칠 때가지 걸리는 기간이 T일 이하일 확률이 얼마일까? 일반화 시키면 아래와 같은 질문입니다. 단위시간당 사건의 발생 횟수 평균이 λ 일 때, 사건이 처음 발생할 때 까지 걸리는 시간이 T단위시간 이하일 확률이 얼마일까? 그 확률이 아래 면적이 되도록 하는 함수 f(t)가 지수분포입니다. 수식으로 표현.. 2020. 10. 1.
[손으로 푸는 통계 ver1.0] 47. 표본분산의 분포 유도 (12) 감마함수의 등장 지난시간까지 n자유도 카이제곱분포의 짝수형과 홀수형을 더블팩토리얼형태로 유도하고, 팩토리얼 형태로 변형했습니다. 결과는 아래와 같습니다. 짝수형은 팩토리얼 형태로 변형할 수 있었지만, 홀수형은 불가능했습니다. 홀수형의 대괄호안 인수들이 자연수가 아니라 유리수이기 때문입니다. 팩토리얼은 자연수에서만 정의됩니다. 우리는 팩토리얼 개념을 자연수에서 유리수로 확장해야하는 상황입니다. 우리가 알고 있는 팩토리얼의 정의는 아래와 같습니다. 함수 형태로 만들어봅시다. 팩토리얼 함수를 아래와 같이 정의하겠습니다. 왜 f(n)=n! 으로 정의하지 않았냐는 의문이 드는 분도 계실겁니다. n이 자연수이기 때문에 f(n)=n! 으로 정의할 경우 함수값이 1! 부터 시작됩니다. 하지만 팩토리얼은 0! 부터 정의되어 있기 떄문에.. 2020. 8. 26.
[손으로 푸는 통계 ver1.0] 46. 표본분산의 분포 유도 (11) 더블 팩토리얼 변형 지난시간까지 n자유도 카이제곱분포를 유도했습니다. n이 짝수인 경우와, 홀수인 경우를 따로 유도했습니다. n이 짝수인 경우 카이제곱분포 n이 홀수인 경우 카이제곱분포 오늘은 더블팩토리얼을 변형할건데요. 짝수형부터 변형해보겠습니다. 편하게 유도하기 위해 계수의 분모만 가져다가 유도하겠습니다. 1) 짝수형 변형 (자유도 n이 짝수) 짝수형 수식에서 계수의 분모는 아래와 같습니다. 더블팩토리얼을 전개합시다. 대괄호 안에 있는 인수 개수가 몇개일까요?? 2부터, 짝수 n까지 곱하면 2/n개 입니다. n에서 하나 앞인 n-2까지 곱한 것이므로, $\frac{n}{2}-1$ 개입니다. 몇개의 숫자를 넣어보면 쉽게 알 수 있습니다. n에 4를 넣어봅시다. 2 이므로, 1개입니다. n에 6을 넣어봅시다. 4x2 이므로.. 2020. 8. 16.
[손으로 푸는 통계 ver1.0] 45. 표본분산의 분포 유도 (10) 카이제곱분포 점화식 풀이 지난시간까지 유도해본 n자유도 카이제곱분포의 분포함수는 아래와 같습니다. 문제는 상수 $C_{n}$ 이었는데요. 규칙이 보이지 않았습니다. 점화식 형태로도 표현한 결과는 아래와 같습니다. ... 이번에는 우리가 유도한 분포함수를 점화식에 대입해보았습니다. 아래와 같이 소거합시다. 적분과 상관없는 항은 밖으로 꺼내겠습니다. 적분합시다. 정리하면 아래와 같습니다. 자유도가 n인 카이제곱분포의 상수 $C_{n}$ 은 아래와 같이 표현됩니다. 우리가 풀 수 있는 형태의 점화식이 되었습니다. 점화식을 풀어보겠습니다. n 이 짝수인 경우와 홀수인 경우로 나뉩니다. 1) n이 홀수인 경우 ... double factorial 이라는 기호가 있습니다. !! 인데요. factorial은 1씩 빼서 곱하는 반면, doub.. 2020. 6. 30.
[손으로 푸는 통계 ver1.0] 44. 표본분산의 분포 유도 (9) 1~5자유도 카이제곱분포에서 규칙찾기, 점화식 세우기 이제 1,2,3,4,5 자유도 카이제곱 분포를 살펴보면서 규칙을 찾아봅시다. 지수함수와 멱함수에서는 규칙이 보입니다. 지수함수는 같은 형태가 유지되고 있고, 멱함수의 지수부분은 1/2 씩 더해지고 있습니다. 이 규칙이 계속 유지될 것이라는 것도 쉽게 보일 수 있습니다. 예를들어 5자유도 분포를 구할 때, 우리는 2자유도와 3자유도를 결합합니다. 지수항수는 항상 같은 형태로 남겨지고, 멱함수는 2자유도 전의 멱함수가 적분됩니다. 따라서 2자유도 증가할 때마다 차수가 1 증가하는 것이므로, 1자유도 증가시 차수가 1/2 증가하게 됩니다. 따라서 n자유도 카이제곱 분포는 아래와 같은 모양일 것으로 생각됩니다. 확률변수를 X로 놓겠습니다. 문제는 상수 $C_{n}$ 입니다. 규칙이 보이지 않았습니다. 점화식 형.. 2020. 6. 30.
[손으로 푸는 통계 ver1.0] 43. 표본분산의 분포 유도 (8) 3,4,5자유도 카이제곱분포 유도 지난시간까지 유도한 1,2 자유도의 카이제곱분포는 아래와 같습니다. 변수는 X에 아래첨자에 자유도가 추가된 형태로 놓겠습니다. 오늘은 3,4,5 자유도의 카이제곱분포를 유도하고 규칙을 찾아보도록 하겠습니다. 먼저 3자유도 카이제곱분포입니다. 3자유도 카이제곱분포 유도 1,2 자유도 카이제곱분포에 컨볼루션 적분을 적용하면 아래와 같은 수식이 됩니다. 분포함수를 대입하면 아래와 같습니다. 아래와 같이 지수형태의 식을 둘로 분리합시다. $ e^{-\frac{x_{1}}{2}}$ 를 소거합시다. 적분변수와 무관한 항은 밖으로 꺼냅시다. 적분합시다. 계산하면 아래와 같습니다. 4자유도 카이제곱분포 유도 이번에는 4자유도 카이제곱분포를 유도해봅시다. 2자유도 카이제곱분포 함수가 가장 간단하기 때문에 이 함수를 이용.. 2020. 6. 13.
[손으로 푸는 통계 ver1.0] 42. 표본분산의 분포 유도 (7) 2자유도 카이제곱분포 유도 서로 독립인 두 확률변수 X와 Y가 있다고 합시다. 두 확률변수는 0부터 무한대 사이의 정수를 갖는다고 합시다. X가 발생할 확률은 P(X=x), Y가 발생할 확률은 P(Y=y)입니다. X와 Y를 합한 확률변수를 Z라고 놓겠습니다. 표기를 P(X), P(Y)로 하지 않는 이유는 혼동을 피하기 위함입니다. x가 1일 확률과 y가 1일 확률이 다를 수도 있는데 P(1), P(1) 로 똑같이 표기되기 때문입니다. P(X=1), P(Y=1)이라고 표기하면 오해가 생기지 않습니다. Z=X+Y 이때 Z가 발생할 확률은 어떻게 정의할 수 있을까요? Z가 발생하는 모든 X,Y 조합을 찾아봅시다. X 값에는 0부터 올 수 있으므로 아래와 같습니다. (0,z) (1,z-1) (2,z-2) ... (z,0) 각각의 확률은 .. 2020. 5. 16.
[손으로 푸는 통계 ver1.0] 41. 표본분산의 분포 유도 (6) 2자유도 카이제곱분포를 특성함수나 적률생섬함수로 유도할 수 없는 이유 우리는 자유도가 n인 카이제곱분포를 유도하고 있는데요. 제가 생각한 과정은 자유도가 1인 카이제곱분포를 유도하고, 자유도가 1인 카이제곱분포의 적률생성함수 또는 특성함수를 이용하여 자유도가 2인 카이제곱분포를 유도하는 것이었습니다. 그리고 이 과정에서 찾은 관계를 이용하여 자유도 n으로 확장하려고 했는데요. 이 방법으로는 안되더라구요. 지금은 다른 방법을 찾았고 시도하는 중입니다. 이 경우에 왜 적률생성함수나 특성함수로는 불가능한지 공유하는 것 자체가 의미가 있을 것 같아서 공유드리려고 합니다. 먼저 자유도가 1인 카이제곱분포의 적률생성함수를 유도해보겠습니다. 특성함수 유도가 훨씬 복잡해서 적률생성함수로 설명하겠습니다. 자유도가 1인 카이제곱분포를 따르는 확률변수를 Y라고 놓겠습니다. Y의 적률생성함수는.. 2020. 5. 6.
[손으로 푸는 통계 ver1.0] 40. 표본분산의 분포 유도 (5) 크기가 2인 표본분산의 분포 표본분산의 분포를 구하기 위해 아래 정의에서 출발했습니다. 위 정의를 이용해서 아래 수식을 유도했습니다. 우변은 자유도가 n-1인 카이제곱 분포를 따르는데요. 우리는 아직 자유도가 1인 카이제곱분포만 유도한 상태입니다. 자유도가 1인 카이제곱분포는 n이 2일 때를 의미합니다. n이 2라는 것은 표본의 크기가 2라는 말입니다. 위 식에서 n에 2를 넣으면 아래와 같은 식이 됩니다. 우변이 자유도가 1인 카이제곱분포입니다. 위 식을 Y라고 놓고 분포함수를 유도했었습니다. 우리가 유도한 Y의 분포함수는 아래와 같습니다. 그래프를 그려봅시다. 손으로 그리기 어렵기 때문에 R을 이용하여 그렸습니다. 0에 가까울 수록 발생확률이 높고, 0보다 커질수록 발생확률이 작아지는 형태의 분포입니다. x=seq(0,4,0.0.. 2020. 5. 1.
[손으로 푸는 통계 ver1.0] 39. 표본분산의 분포 유도 (4) 자유도가 1인 카이제곱분포의 평균과 분산 36~38강에서 표본분산의 분포는 표준정규분포를 따르는 확률변수의 제곱을 n-1개 더한 분포라는 것을 유도했습니다. 표준정규분포의 제곱의 합의 분포를 단계적으로 유도하기 위해 표준정규분포 1개의 제곱의 분포를 유도했습니다. 이는 자유도 1인 카이제곱분포였습니다. 자유도가 1인 카이제곱분포를 표본분산의 분포로 이용하는 방법을 알아보기 전에 자유도가 1인 카이제곱분포의 평균과 분산을 구해보겠습니다. 먼저 평균을 유도해봅시다. 평균 평균은 아래와 같이 정의됩니다. 아래와 같이 계산할 수 있습니다. 부분적분을 합시다. e^(y/2)을 적분할 것입니다. 빨간항은 0이 됩니다. 2를 약분해줍시다. 적분기호 안은 자유도가 1인 카이제곱분포의 확률밀도함수입니다. 전체구간으로 적분하면 값은 1입니다. 따라서 평균은 1이.. 2020. 4. 27.
[손으로 푸는 통계 ver1.0] 38. 표본분산의 분포 유도 (3) 자유도가 1인 카이제곱분포 유도 36강과 37강에서 아래 수식을 유도했습니다. 우변의 각 항은 표준정규분포를 따르는 변수의 제곱입니다. 따라서 아래와 같이 바꿔쓸 수 있습니다. 2020. 4. 4.
[손으로 푸는 통계 ver1.0] 37. 표본분산의 분포 유도 (2) 표준화 표본분산의 분포를 계속해서 유도해봅시다. 아래는 표본분산의 계산식입니다. 지난시간에 우리는 위 수식을 아래와 같이 변형하였습니다. 우변은 정규분포를 따르는 모집단의 확률변수의 제곱 n개 에서, 정규분포를 따르는 표본평균의 제곱 n개를 뺀 형태입니다. 정규분포보다 표준정규분포가 다루기 쉬우므로, 변형해주겠습니다. 표준화를 할 것입니다. 모집단의 확률변수들은 평균이 모평균 μ 이고 분산이 모분산 σ² 입니다. 표본평균의 평균은 모평균 μ이고, 분산은 모분산을 n으로 나눈 값입니다. 아래와 같이 완전제곱식을 만들게해주는 항을 더하고 빼줍시다. 아래와 같이 꺼내줍시다. 완전제곱식으로 만들어줍시다. 위 식의 파란식들도 완전제곱식으로 만들기 위해 아래와 같이 더하고 뻅시다. 완전제곱식으로 묶고, 소거할 수 있는 항.. 2020. 4. 4.
[손으로 푸는 통계 ver1.0] 36. 표본분산의 분포 유도 (1) 표본분산 수식 변형하기 표본분산의 분포를 유도해봅시다. 일단 시도해보면서 어떤 내용들이 더 필요할지 알아볼 것입니다. 만만치 않은 과정이 될 것 같네요. 평균이 μ 이고 분산이 σ² 인 모집단이 있습니다. 이 모집단에서 뽑을 수 있는 크기가 n인 표본의 표본분산은 아래와 같이 정의됩니다. s² 는 표본분산의 확률변수입니다. 모집단에서 뽑은 수많은 표본분산을 원소로 갖는 집합입니다. 우리가 실제로 표본을뽑는다면, 그 표본을 이 함수에 대입하여 표본분산을 구할 수 있습니다. 확률변수로 놓는 것은 3강에서도 설명한 개념인데요. 이 부분이 이해 안되시는 분들은 댓글을 달아주세요. 많은 분들이 이해를 어려워하시면 더 와닿는 설명을 생각해 보겠습니다. 이제 위 식을 전개해봅시다. 앙변에 n-1을 곱합시다. 시그마와 무관한 식들은 시그마 .. 2020. 4. 1.
[손으로 푸는 통계 ver1.0] 35. z검정의 한계 (우리는 이유도 모른채 모분산 대신 표본분산을 사용했었다) 오늘은 z검정의 한계에 대한 이야기를 해볼것입니다. 우리는 지금까지 z검정을 열심히 배웠지만, 실제로 z검정을 사용할 수 있는 상황은 거의 없습니다. 왜그럴까요? z검정을 하기 위해서 우리는 모집단의 분산을 알아야 합니다. z검정에서 표본평균의 분포를 정의하는데, 이때 표본평균의 분산이 모분산/n이기 때문입니다. 모평균도 몰라서 추정하고 있는데 모분산을 아는 경우가 얼마나 될까요? 없을겁니다. z검정이라는 아주 유용한 검정을 발견했지만, 모분산을 알 수 없는 상황에서는 z검정을 사용할 수가 없습니다. 이 문제를 어떻게 해결할 수 있을까요. 가장 쉽게 떠오르는 방법은 아래와 같을 것입니다. "표본의 분산을 모분산 대신 사용하자" 아래와 같이 대체하는 것입니다. (σ는 모표준편차, s는 표본표분편차입니다.).. 2020. 3. 30.
[손으로 푸는 확률분포] 균등분포 (3) 예시 (3) 예시 5분에 한대씩 오는 버스가 있습니다. 임의의 시간에 정류장에 나갔을 때, 버스를 기다릴 시간이 x일 확률을 구해봅시다. 버스를 기다릴 시간은 0분에서 5분 사이입니다. 따라서 X의 범위는 아래와 같습니다. 임의의 시간에 나가는 것이므로 모든 확률은 같습니다. 그런데 X는 셀 수 없는 변수입니다. 연속확률변수입니다. 셀 수 없다는 것은 단순히 그 개수가 무한개라는 것이 아닙니다. 자연수도 개수가 무한개지만 셀 수 있습니다. 1다음에 오는 것이 2입니다. 그런데 위 예제에서 0분 다음에 오는 것이 뭘까요? 0.1분? 0.001분? 셀 수 없습니다. 연속확률변수이기 때문에 함수 값은 확률이 아니라 확률밀도입니다. 이 확률밀도를 일단 k라고 놓고 그래프를 그려봅시다. 확률의 총 합은 1이므로, 닫힌.. 2020. 2. 29.
[손으로 푸는 확률분포] 균등분포 (2) 평균과 분산 (2-1) 평균 확률변수 X가 균등분포를 따를 때, 확률밀도함수는 아래와 같다는 것을 지난시간에 유도했습니다. 균등분포를 따르는 확률변수 X는 연속확률변수입니다. 연속확률변수의 평균은 아래와 같이 구합니다. 균등분포함수에 적용해봅시다. 적분은 어렵지 않습니다. 적분해봅시다. 계산합시다. 인수분해합시다. 약분하면 아래와 같이 균등분포의 평균이 구해집니다. (2-2) 분산 연속확률변수의 분산은 아래와 같이 구합니다. 평균은 위에서 구해서 알고 있으므로, 확률변수의 제곱의 평균만 구하면 됩니다. 위 식에 균등분포의 확률밀도함수를 대입합니다. 적분은 어렵지 않습니다. 적분해봅시다. 계산합시다. 인수분해합시다. 약분하면 아래와 같습니다. 분산을 구하는 식에 넣어줍니다. 맨 오른쪽 항을 계산해줍니다. 통분합시다. .. 2020. 2. 26.
[손으로 푸는 확률분포] 균등분포 (1) 소개,그래프,유도 (1) 소개, 유도, 그래프 이번 시간부터는 연속확률분포를 배워보겠습니다. 오늘 배울 분포는 "균등 분포"입니다. 균등분포는 영어로 uniform distribution 입니다. 더 정확히 이야기하면 '연속균등분포'입니다. 다루지는 않았지만 이산확률분포에서도 균등분포를 정의할 수 있기 때문입니다. 균등분포는 모든 확률변수의 함수값이 동일한 분포입니다. 여기서 함수값은 확률이 아닙니다. 확률 밀도입니다. 확률변수의 범위를 a≤x≤b 로 놓고 함수 값은 k라고 한다면 그래프는 아래와 같이 그릴 수 있습니다. 확률밀도함수에서는 면적이 확률이므로 아래 면적이 1이 됩니다. 따라서 아래 등식이 성립합니다. k를 계산하면 아래와 같습니다. 따라서 균등분포는 아래와 같이 정의할 수 있습니다. 기호로는 아래와 같이 나.. 2020. 2. 24.
[손으로 푸는 확률분포] 이산확률분포들 사이의 관계 우리는 지금까지 이산확률분포들을 배웠습니다. 아래의 7가지 분포입니다. - 베르누이분포 - 이항분포 - 기하분포 - 음이항분포 - 포아송분포 - 초기하분포 - 다항분포 이번 글에서는 각 분포들 사이의 관계망을 만들어보도록 하겠습니다. 베르누이분포로 시작합니다. 베르누이분포는 시행횟수가 1회이고, 시행의 결과가 성공/실패 둘 뿐인 분포입니다. 분포함수는 아래와 같습니다. 기호로는 B(1,p)로 나타냅니다. 베르누이분포에서 시행횟수를 n회로 늘리면 이항분포가 됩니다. 기호로는 B(n,p)로 나타냅니다. 이항분포에서 시행의 결과로 발생하는 사건의 종류를 늘리면 다항분포가 됩니다. 기호로는 M(n,p1,p2,...)로 나타냅니다. 이항분포에서 시행횟수를 무한대로 보내고, 사건 발생확률을 0으로 보내면 푸아송분포.. 2020. 2. 22.
[손으로 푸는 확률분포] 이산확률분포 7가지 총정리 우리는 지금까지 이산확률분포들을 배웠습니다. 아래의 7가지 분포입니다. - 베르누이분포 - 이항분포 - 기하분포 - 음이항분포 - 포아송분포 - 초기하분포 - 다항분포 이번 글에서는 7가지 분포들을 리뷰해봅시다. 정의, 분포함수, 기호, 예시를 표로 정리해보았습니다. 2020. 2. 18.
[손으로 푸는 확률분포] 다항분포 (6) 그래프 (6) 그래프 다항분포의 그래프를 인간이 그리기에는 차원의 한계가 있습니다. 우리는 좌표공간인 3차원까지만 그래프를 그릴 수 있습니다. (색(color)를 이용하면 차원을 하나 늘일 수는 있습니다) 먼저 좌표평면에 그래프를 그려봅시다. 좌표평면에 그래프를 그리려면 독립변수 하나와 종속변수 하나가 필요합니다. 확률분포에서 독립변수는 확률변수이고 종속변수는 확률입니다. 다항분포가 하나의 독립변수를 갖는 경우는 시행의 결과가 두가지 사건으로 나뉠때 입니다. 이는 이항분포와 같고 지난강의에서 설명했습니다. 이항분포의 그래프는 아래와 같습니다. 시행횟수가 커질 수록 좌우 대칭인 종모양에 가까워져갑니다. 이항분포에서 n을 무한대로 보내면 정규분포로 수렵합니다. (참고영상 : http:// https://youtu... 2020. 2. 15.
[손으로 푸는 확률분포] 다항분포 (5) 독립변수의 개수 (5) 독립변수의 개수 시행의 결과가 A,B,C 세가지인 다항분포에서 독립변수의 개수는 몇개일까요? 세개라고 생각하시는 분들이 아마 계실거 같은데 정답은 2개입니다. 시행의 결과가 두가지인 경우를 생각해봅시다. 시행의 결과는 A, B 두가지이고 n번에 시행에서 각각이 발생한 횟수를 x회와 y회라과 하겠습니다. x와 y가 둘 다 독립변수 같아 보이지만 사실 둘 중 하나만 독립변수입니다. x+y=n 이기 때문에 한 변수가 결정되면 다른 변수는 저절로 정해기디 때문입니다. 위 식에서 y=n-x로 바꿔봅시다. 두 확률의 합도 1이므로, 아래와 같이 변형됩니다. 이항분포가 되었죠? 이항분포는 시행의 결과가 두가지인 다항분포입니다. '이항'이라는 말은 시행의 결과가 '두 가지'라는 뜻입니다. 시행의 결과가 '사건의.. 2020. 2. 11.
[손으로 푸는 통계 ver1.0] 34. 1~33강 요약 손으로 푸는 통계는 't검정의 원리'를 이해하는 강의입니다. t검정,분산분석,회귀분석 등 우리가 접하는 통계기법들의 근본 원리는 동일합니다. t검정을 이해하기 위해서는 꽤 많은 선행 내용이 필요했습니다. 33개의 강의를 진행했고, 곧 t검정이 등장합니다. 이번 강의에서는 지금까지 배운 내용을 요약해봅시다. 1. 평균, 편차, 분산, 표준편차 2. 자유도와 불편추정량 (왜 n-1로 나누나요?) 3. 표본평균의 평균이 모평균과 같은 이유 4. 표본분산의 기댓값이 모분산과 같은 이유 5. 표본평균의 분산이 모분산/n 인 이유(고등학생들 꼭 보세요) 6. E(XY)=E(X)E(Y) 의 성립조건과 증명 7. 크기가 1인 표본평균의 평균과 분산이 모집단과 같은 이유 증명 8. 1~7강 요약(세로영상) 9. 중심극한.. 2020. 2. 10.
[손으로 푸는 확률분포] 다항분포 (4) 평균과 분산 (4) 평균과 분산 다항분포의 기댓값은 각 사건별로 구하거나 사건의 합집합의 기댓값을 구할 수 있습니다. 예를 들어 어떤 시행에서 세가지 사건이 발생할 수 있다고 하겠습니다. 사건 A, 사건 B, 사건C 입니다. 한번의 시행에서 각 사건이 발생할 확률은 $P_{A}$, $P_{B}$, $P_{C}$ 라고 합시다. n번의 시행에서 사건 A가 X번, 사건 B가 Y번, 사건 C가 Z번 발생할 확률은 아래와 같습니다. 다항분포의 기댓값을 구해볼건데요. 우리는 각 사건의 기댓값을 구할 수 있고, 여러 사건들의 교집합 또는 합집합의 기댓값을 구할 수 있습니다. 먼저 사건 A의 기댓값을 구해봅시다. 사건 A의 관점에서 보면, 어떤 시행의 결과는 사건 A가 발생하거나 사건 A가 발생하지 않거나의 두가지 입니다. 따라서.. 2020. 2. 7.
[손으로 푸는 확률분포] 다항분포 (3) 예시 (3) 예시 상자가 있습니다. 상자 안에는 100개의 공이 들어있는데요. 빨간공이 20개, 파란공이 30개, 노란공이 50개 들어있습니다. 이 상자에서 복원추출로 공을 10번 뽑을 때, 빨간공이 5개, 파란공이 2개, 노란공이 3개 나올 확률을 구해봅시다. 상자에서 공을 하나 뽑을 때, 각 공이 뽑힐 확률은 아래와 같습니다. 빨간공 : 0.2 파란공 : 0.3 노란공 : 0.5 지난시간에 유도한 다항분포를 적용합시다. 상자 n번 공을 뽑을 때, 빨간공이 X개, 파란공이 Y개, 노란공이 Z개 뽑힐 확률은 아래와 같습니다. $P\left( x,y,z; \ n ; \ 0.2,0.3,0.5 \right)=\frac{n!}{x!y!z!}0.2^x 0.3^y 0.5^z$ 위 예시를 풀기 위해서 X에 5, Y에 2,.. 2020. 2. 6.
반응형