본문 바로가기
반응형

@ 필수과목159

[손으로 푸는 확률분포] 음이항분포 (3) 유도 3) 일반화(유도) 어떤 사건이 발생할 확률을 p라고 합시다. r번의 실패가 나오기까지 발생한 성공이 k번일 확률 p(X=k)의 분포가 음이항분포입니다. p와 r은 사전에 정해지는 값입니다. 변수는 k입니다. 이를 아래와 같이 표현합니다. k는 변수이고, r과 p은 주어진 값이라는 의미입니다. 이제 이런 조건을 따르는 확률분포 p(X=k)를 정의합시다. k가 확률변수 x라는 의미입니다. 총 r번의 실패와 k번의 성공이므로 전체 시행은 r+k번이 됩니다. 아래와 같이 정리합시다. 기호로 나타내면 아래와 같습니다. NB는 Negative binomial distribution(NB)의 약어입니다. 2019. 7. 5.
[손으로 푸는 확률분포] 음이항분포 (2) 예시 2) 예시 어떤 농구선수의 자유투 성공률이 30%라고 해봅시다. 이 농구선수가 3번의 실패가 나오기까지 발생한 성공이 x번인 확률이 음이항분포입니다. x가 0일 때부터 구해봅시다. 성공 없이 실패만 세번 하면 됩니다. x가 1일 때는 어떨까요. 실패를 3번 할 동안 성공이 1번 나오면 됩니다. 마지막에 실패로 끝나는 것이므로 아래와 같은 경우들이 가능합니다. 실패/실패/성공/실패 실패/성공/실패/실패 성공/실패/실패/실패 위와 같은 경우가 발생할 확률을 구해봅시다. 이번에는 x가 2일 때 발생 가능한 경우를 구해봅시다. 실패/실패/성공/성공/실패 실패/성공/실패/성공/실패 .... 경우가 많아서 세기가 귀찮습니다. 규칙을 찾아야 합니다. 마지막에는 실패로 끝나야 하니까. 실패횟수에서 하나를 빼놓습니다. .. 2019. 7. 5.
[손으로 푸는 확률분포] 음이항분포 (1) 소개 1) 소개 (음이항분포는 여러가지로 정의된다!) 이미 배운 기하분포를 떠올려봅시다. 음이항분포는 기하분포의 확장버젼이라고 할 수 있습니다. 더 정확히 말하면 음이항분포의 여러 정의중 하나가, 기하분포의 확장버전입니다. 기하분포의 정의는 아래와 같습니다. 성공확률을 p라고 했을 때, x번째 시행에서 첫번째 성공이 나올 확률 p(x)의 분포 이 정의에서 첫번째를 k번째로 바꾸면 음이항분포가 됩니다. 성공확률을 p라고 했을 때, x번째 시행에서 k번째 성공이 나올 확률 p(x)의 분포. 위 음이항분포를 보면, 사전에 정의되어야할 값이 성공확률 p 말고 k도 있습니다. p와 k이 정해져야 확률분포함수가 정의된다는 말입니다. 음이항분포는 위의 방법 외에 정의하는 방법이 더 있습니다. 또한 위 방법은 일반적으로 사.. 2019. 7. 4.
[손으로 푸는 확률분포] 기하분포 (6) 이름의 유래 6) 기하분포 이름의 유래 문득 이름이 왜 '기하분포'인지 궁금해졌습니다. 자료들을 찾아보니 기하분포는 '기하수열'에서 온 말이라고 합니다. 기하수열은 다시 '기하평균'에서 온 말입니다. 기하평균(geometric mean) → 기하(등비)수열(Geometric sequence) → 기하분포(Geometric distribution) 기하(등비)수열과 기하평균에 기하라는 이름이 붙어있는데요. '기하(geometric)'는 어떤 의미인지 먼저 알아봅시다. 기하는 '선' '곡선' '도형'에 관련된 것을 의미합니다. 기하평균은 도형에서 발견한 평균입니다. 아래와 같은 사각형을 봅시다. 변의 길이가 a와 c인 직사각형이 있습니다. 넓이의 관점에서 이 길이의 평균은 얼마일까요. 넓이가 유지되도록 하는 b를 찾으면.. 2019. 7. 4.
[손으로 푸는 확률분포] 기하분포 (5) 그래프 5) 그래프 기하분포의 분포함수는 아래와 같습니다. 성공확률을 0.1,0.3,0.5,0.7,0.9 놓고 각각의 그래프를 그렸습니다. 성공확률이 높을 수록 감소하는 속도가 빠릅니다. 2019. 7. 4.
[손으로 푸는 확률분포] 기하분포 (4) 분산 4-2) 통계량 - 분산 기하분포의 분산은 아래와 같이 정의됩니다. 시그마를 전개해봅시다. 아래 식을 1번식이라고 하겠습니다. 양변에 (1-p)를 곱합시다. 1식에서 2식을 빼겠습니다. 이제 빨간색 부분을 시그마 형태로 다시 바꿔봅시다. 양변의 p는 약분하구요. 시그마 안쪽의 식을 인수분해합니다. 계산하면 아래와 같습니다. 전개해봅시다. 빨간부분은 평균을 구할때의 식에서 p가 빠진 형태와 동일합니다. 따라서 평균의 결과를 p로 나눠준 값과 동일합니다. 파란부분은 등비수열의 합으로 구할 수 있고, 마지막 항은 0으로 수렴합니다. 계산해봅시다. 이제 아래 식에 결과를 넣어봅시다. 2019. 7. 4.
[손으로 푸는 확률분포] 기하분포 (3~4) 유도, 평균 3) 일반화(유도) 어떤 사건이 발생할 확률이 p라고 합시다. 사건이 발생하지 않을 확률은 1-p 입니다. 성공과 실패로 봐도 됩니다. 이때 기하분포는 아래와 같습니다. 확률변수 x는 모든 자연수입니다. 기호로는 아래와 같이 나타냅니다. 4-1) 통계량 - 평균 미적분을 이용해서 유도하는 짧은 방법이 있긴 한데, 더 많은 분들이 이해할 수 있도록 길지만 미적분이 들어가지 않는 방법으로 유도하겠습니다. 기하분포의 평균은 아래와 같이 정의됩니다. 시그마를 전개해봅시다. 확률변수는 모든 자연수이기 때문에 극한이 등장합니다. 아래 식을 1번 식이라고 합시다. $E(X)=\lim_{n\rightarrow \infty}p\left \{ 1+2(1-p)+\cdots +(n-1)(1-p)^{n-2}+n(1-p)^{n-.. 2019. 7. 4.
[손으로 푸는 확률분포] 기하분포 (1~2) 소개, 예시 1) 소개 베르누이 시행을 반복할 때, 처음 성공이 나오기까지 시행한 횟수를 확률변수 x로 할때의 확률분포입니다. 예를들어 확률변수가 4일 때의 확률은 "실패-실패-실패-성공" 인 경우의 확률입니다. 또 다른 정의도 있는데, 처음 성공이 나오기까지 실패한 횟수를 확률변수로 하는 경우도 있습니다. 이때는 확률변수 4의 확률이 "실패-실패-실패-실패-성공"의 확률이 됩니다. 본 글에서는 전자의 정의(성공이 나오기까지 시행한 횟수)를 따르겠습니다. 2) 예시 연애를 시작한 남녀가 결혼할 확률이 5%라고 가정합시다. x번째 사귄 이성과 결혼하게 될 확률분포가 기하분포입니다. 2019. 7. 4.
[손으로 푸는 확률분포] 이항분포 (3~5) 유도, 통계량, 그래프 3) 일반화(유도) 어떤 독립시행에서 특정 사건이 발생할 확률은 p입니다. 이 시행을 n번 했을 때, 사건이 발생한 횟수를 x라고 합시다. 이때의 확률분포가 이항분포이고 아래와 같습니다. 시행횟수가 n, 사건 발생활률이 p인 이항분포를 기호로 아래와 같이 나타냅니다. B는 binomial의 약자입니다. 4-1) 통계량 - 평균 이항분포의 평균은 아래와 같이 정의됩니다. x가 0일때는 값이 0이므로 아래와 같이 시그마의 시작을 1으로 바꿀 수 있습니다. 아래와 같이 변형합시다. p와 n은 시그마에 독립적이므로 아래와 같이 꺼내줄 수 있습니다. x는 약분됩니다. 이제 치환을 하겠습니다. n-1을 m로, x-1을 r로 치환합시다. 이번에는 n-1에서 x-1을 뺍시다. n-x가 나오고, 이 값은 m-r과 같습니.. 2019. 7. 4.
[손으로 푸는 확률분포] 이항분포 (1~2) 소개, 예시 1) 소개 베르누이 시행을 n번 했습니다. 각각의 시행은 독립시행입니다. 각 시행이 독립이라는 것은 베르누이 시행의 조건 중 하나입니다. 따라서 베르누이시행이라고 말하면 독립이라고 따로 언급할 필요는 없습니다. 이 시행에서 사건이 발생할 확률을 p라고 하고, 사건이 발행한 횟수를 확률변수 x로 할 때의 분포가 이항분포입니다. 2) 예시 어떤 농구선수의 자유투 성공률은 80%입니다. 공을 10번 던질 때, 자유투의 성공 횟수와 그 확률을 구해하면 아래와 같습니다. 자유투 성공횟수를 확률변수 x로 놓겠습니다. 예를 들어 자유투가 두번 성공할 확률을 구하면 아래와 같습니다. 2019. 7. 4.
[손으로 푸는 확률분포] 베르누이분포 (3~5) 유도, 통계량, 그래프 3) 일반화(유도) 어떤 시행의 결과가 성공, 혹은 실패라고 합시다. 성공할 확률은 p이고 실패할 확률은 1-p 또는 q입니다. 시행이 성공하면 1, 실패하면 0의 값을 갖습니다. 이때, 베르누이 분포는 아래와 같습니다. 또는 아래와 같이 쓸 수도 있습니다. 4) 통계량(평균,분산) 베르누이분포의 평균은 아래와 같이 계산합니다. 베르누이분포의 분산은 아래와 같이 계산합니다. 5) 그래프 베르누이분포의 그래프는 아래와 같습니다. 2019. 7. 4.
[손으로 푸는 확률분포] 베르누이분포 (1~2) 소개, 예시 1) 소개 베르누이 분포는 시행의 횟수가 1회이고, 시행의 결과가 오직 두 가지인 분포입니다. 시행의 두가지 결과를 보통 '성공' 과 '실패'라고 부릅니다. 시행횟수 : 1회 시행결과 : 성공 or 실패 성공은 1의 값을 실패는 0의 값을 갖습니다. 확률변수가 0과 1인 뿐인 것입니다. 이름만 거창하지 알고 나면 굉장히 단순한 확률분포입니다. 시행의 결과가 오직 두가지 뿐인 시행을 '베르누이 시행'이라고 합니다. 베르누이분포보다 베르누이시행이라는 말을 더 자주보게 될겁니다. 동전을 던지는 시행, 주사위를 던질 때 2가 나오는 시행 등이 베르누이시행입니다. 앞면/뒷면 또는 주사위눈이2/주사위눈이2가아님, 이렇게 두가지 결과만을 갖는 시행이기 때문입니다. 2) 예시 빨간공 7개와 검정공 3개가 들어있는 주머.. 2019. 5. 8.
[손으로 푸는 확률분포] 확률분포의 종류 (연속확률분포, 이산확률분포) 통계학에서 사용되는 다양한 확률분포들을 설명하는 강의입니다. 각 확률분포의 간단한 예시, 유도, 통계량 계산, 그래프 등의 내용을 다룰 것입니다. 확률분포는 크게 '이산확률분포'와 '연속확률분포'로 나뉩니다. 이산확률분포는 확률변수의 개수를 셀 수 있는 경우를 말합니다. 개수가 유한개로 한정되지는 않습니다. 자연수는 무한개이지만 이산확률변수에 속합니다. 순서대로 셀 수 있기 때문입니다. 연속확률분포는 확률변수가 셀 수 없는 경우의 분포를 말합니다. 이산확률분포 : 확률변수 개수를 셀 수 있음 연속확류분포 : 확률변수 개수를 셀 수 없음 1. 이산확률분포 종류 강의에서 다룰 이산확률분포는 아래와 같습니다. - 베르누이분포 - 이항분포 - 기하분포 - 음이항분포 - 포아송분포 - 초기하분포 - 다항분포 2... 2018. 12. 24.
[손으로 푸는 통계] 26. 1표본 Z검정 예제 1표본 Z검정 예제를 하나 풀어봅시다. A회사 K젤리라는 예제입니다. A제과회사에서는 K젤리라는 인기상품을 팔고 있습니다. A회사는 K젤리 무게의 평균과 표준편차를 아래와 같다고 주장하고 있습니다. $75g \pm 5g$ A회사의 경쟁사인 B사에서는 A사가 K젤리의 무게를 부풀렸다고 생각합니다. B회사에서는 이를 통계적으로 입증하기 위해 K젤리 100개를 구매했습니다. 모집단에서 크기가 100인 표본을 뽑은 것입니다. 포장을 뜯어 100개의 K젤리 무게의 표본평균과 표본표준편차를 계산했더니 아래와 같았습니다. $\bar{X}_{1}=68.5$ $\sigma{1}=2$ 귀무가설과 대립가설을 세워봅시다. 귀무가설은 K젤리의 무게 평균이 70g 이라는 것입니다. 대립가설은 우리의 주장이 담긴 것으로 '70g보.. 2018. 5. 31.
[손으로 푸는 통계] 25. 통계적 가설검정 감잡기 5 (1종오류 vs 2종오류) 통계적 가설검정은 귀무가설과 대립가설을 세우고 p값에 따라 기각 여부를 결정하는 것을 말합니다. 통계적 가설검정에는 아래와 같은 네 가지 상황이 발생할 수 있습니다. 1. 귀무가설이 참 → 채택 2. 귀무가설이 참 → 기각 (1종 오류, α 오류) 3. 귀무가설이 거짓 → 채택 (2종 오류, β 오류) 4. 귀무가설이 거짓 → 기각 쉽게 이해하기 위해 아래와 같은 표를 만들어 봅시다. 통계적 가설검정은 확률이 개입되기 때문에 항상 옳은 결정을 내릴 수 없습니다. 실제로 귀무가설이 참인데 기각할 수도 있고, 귀무가설이 거짓인데 채택할 수도 있습니다. 이러한 잘못된 선택을 오류라고 합니다. 귀무가설이 참인데도 기각하는 오류를 1종오류 또는 α 오류라고 합니다. 귀무가설이 거짓인데도 기각을 하지 않는 오류를 .. 2018. 5. 21.
[손으로 푸는 통계] 24. 통계적 가설 검정 감잡기 4 (양측검정 vs 단측검정) 우리는 지난시간까지 아래 내용을 배운 상태입니다. - 귀무가설, 대립가설 - 가설검정 원리 - 유의수준 ($\alpha$) - 유의확률 (p-value) 이번시간에는 기각역, 양측검정, 단측검정을 배워봅시다. 지난시간에 사용한 예시를 가져옵시다. 모집단이 하나 있는데, 평균이 $\mu$라고 알려져 있습니다. 우리는 이 주장에 반대하는 상황입니다. Z검정을 하기 위해 귀무가설과 대립가설을 아래와 같이 세웠습니다. 귀무가설 : $E[\bar{X}]=\mu$ (기존의 주장) 대립가설 : $E[\bar{X}] \neq \mu$ (기존의 주장에 반대하는 우리의 주장) 이 모집단에서 표본을 하나 뽑아서 평균을 구했습니다. 우리가 뽑은 표본의 평균을 $\bar{X}_{1}$ 라고 합시다. $\bar{X}_{1}$ 보.. 2018. 5. 19.
[손으로 푸는 통계] 23. 통계적 가설 검정 감잡기 3 (유의수준 α, 유의확률 p-value) 오늘은 가설검정에서 사용되는 중요한 개념인 유의수준과 유의확률에 대해 배워볼 것입니다. 그 전에 지난 시간에 배운 내용을 간단히 복습하고 오늘 내용을 배워봅시다. 어떤 사람이 모집단의 평균이 $\mu$ 라고 주장하고 있습니다. 우리는 아니라고 생각합니다. 이를 밝혀내기 위해 두 가지 가설을 세웠습니다. 귀무가설 : $E[\bar{X}]=\mu$ (기존의 주장) 대립가설 : $E[\bar{X}] \neq \mu$ (기존의 주장에 반대하는 우리의 주장) 기존의 주장이 맞다고 가정하고 진행하겠습니다. 평균이 $\mu$인 모집단에서 크기가 n인 표본평균 분포함수를 정의했습니다. 표본을 뽑지 않아도 분포함수를 정의할 수 있다는 것을 이미 배웠습니다. 아래와 같습니다. $\bar{X} \sim N \left ( \.. 2018. 5. 16.
[손으로 푸는 통계] 22. 통계적 가설 검정 감잡기 2 (1표본 Z검정) 지난글에서 통계적 가설검정이 무엇인지 간단히 살펴봤습니다. 오늘은 통계적 가설검정의 절차를 자세히 공부할 것입니다. 통계적 가설검정은 귀무가설과 대립가설을 세우고 해당 가설이 참인지를 확률적으로 판단하는 방법입니다. 모집단의 평균이 $\mu$라고 알려진 상황이고 우리는 이러한 사실을 반박하고 싶습니다. 이때 귀무가설과 대립가설은 아래와 같이 세웁니다. 귀무가설 : $E[\bar{X}]=\mu$ (기존의 주장) 대립가설 : $E[\bar{X}] \neq \mu$ (기존의 주장에 반대하는 우리의 주장) 표본평균의 평균은 모평균과 같으므로 위 가설의 $E[\bar{X}]$ 는 '모집단의 평균' 을 다른 기호로 나타낸 것 뿐입니다. 우리는 귀무가설이 참인지 여부를 통계적으로 판단해야 합니다. 판단 방법의 핵심은.. 2018. 5. 12.
[손으로 푸는 통계] 21. 통계적 가설 검정 감잡기 1 (귀무가설, 대립가설) 지난시간까지 배운 내용은 아래와 같습니다. - 통계량 (평균,분산,표준편차) - 모집단의 통계량과 표본의 통계량 사이의 관계 - 중심극한정리 - 정규분포 유도 기본 내용에 대한 정리가 어느정도 끝났습니다. 이번시간부터는 통계적 가설검정에 대해 배워봅시다. t검정, 분산분석, 회귀분석 등 대부분의 통계분석 방법의 기본 원리는 '통계적 가설검정'입니다. 통계적 가설검정 가설검정은 어떤 가설을 세우고 그 가설이 맞는지 틀린지를 시험하는 것입니다. 통계적 가설검정에서는 통계 이론과 확률을 이용하여 가설을 검정합니다. 가설검정은 영어로 hypothesis test 입니다. 어떤 가설을 세울까 통계적 가설검정에서는 주로 어떤 가설을 세울까요? 통계량을 이용하여 가설을 세웁니다. 우리가 배운 통계량은 평균, 분산이 .. 2018. 5. 10.
[손으로 푸는 통계] 20. 정규분포를 유도하며 알게 된 것들 고등학교에서 정규분포를 처음 배울 때 함수의 수식부터 배웠떤 기억이 있습니다. 이어서 정규분포의 성질들을 배웠습니다. 정규분포의 모양ㅇ느 종을 엎어놓은 모양이고, 표준편차가 작아질 수록 얇고 높아진다 등을 배웠습니다. 그 당시 정규분포의 유도과정이 궁금했었는데 왜 선생님에게 질문을 하지 않았었는지는 기억이 안납니다. 나름대로 내렸던 결론은 유도과정이 없고 여러 현상에서 발견되는 분포들을 수학적으로 fitting 하여 찾아냈을 것이라 생각했었습니다. 졸업 후 한참이 지난 20대 후반에 취미로 통계공부를 시작했고, 정규분포의 유도과정이 있다는 것을 알았습니다. 제가 찾은 방법은 두 가지였고 지난시간까지 두 방법 모두 다뤘습니다. 두 방법은 아래와 같습니다. 방법1. 과녁 맞추기를 이용한 유도 방법2. 이항분.. 2018. 4. 14.
[손으로 푸는 통계] 19. 정규분포함수 유도하기 (방법2. 이항분포 이용 2/2) 이항분포를 이용하여 정규분포를 유도하고 있습니다. 지난시간에 유도한 내용을 간단히 요약합시다. 이항분포를 $f(r)$에서 $g(r)=\ln f(r)$ 로 놓고 $g(r)$을 구하였습니다. 이를 1번 식이라고 하였습니다. $\begin{align} g(r)&=n\ln n-r\ln r- (n-r)\ln (n-r) \\ &+\frac{1}{2}\ln( n)-\frac{1}{2}\ln(r)-\frac{1}{2}\ln(2\pi ) -\frac{1}{2}\ln((n-r)) \\ &+r\ln p +(n-r)\ln q \end{align}$ (1번식) $g(r)$의 미분을 구했습니다. 2번 식이라고 하였습니다. $\begin{align} g'(r)&=-\ln r+\ln (n-r) \\ &-\frac{1}{2r} -\f.. 2018. 4. 12.
[손으로 푸는 통계] 18. 정규분포함수 유도하기 (방법2. 이항분포 이용 1/2) 정규분포 함수를 유도하는 방법은 두가지가 있고 아래와 같습니다. 1) 과녁 맞추기를 이용한 유도 2) 이항분포를 이용한 유도 15,16강에서 1번 방법으로 정규분포를 유도하였습니다. 이번 강의부터 2번 방법으로 정규분포를 유도하겠습니다. 내용이 많아서 이번강의와 다음강의 둘로 나눠서 설명하겠습니다. 이항분포를 정규분포로 근사시키는 방법을 통해 정규분포를 유도하겠습니다. 이항분포 $B(n,p)$의 확률질량함수는 아래와 같습니다. $f(r)=_{n}C_{r}p^rq^{n-r}$ 확률변수를 r로 놓았습니다. 위 식에서 조합으로 표현된 부분을 팩토리얼 형태로 바꿔줍시다. $f(r)=\frac{n!}{r!(n-r)!}p^rq^{n-r}$ 양변에 자연로그를 취해줍니다. $\ln f(r)=\ln n!-\ln r! -.. 2018. 4. 12.
[손으로 푸는 통계] 17. 이항분포의 평균과 분산 정규분포의 두가지 유도방법을 공부하고 있습니다. 두가지 유도방법은 아래와 같습니다. 1) 과녁 맞추기를 이용한 유도 2) 이항분포를 이용한 유도 지난시간까지 1번인 과녁 맞추기를 이용한 유도를 공부해보았습니다. 이제 2번인 이항분포를 이용하여 정규분포를 유도할 차례입니다. 이항분포를 이용하여 정규분포를 유도할 때 이항분포의 평균과 분산이 사용됩니다. 이번시간에는 이항분포의 평균과 분산을 구해봅시다. 이항분포는 $B(n,p)$ 라고 나타냅니다. B는 binomial distribution 의 첫글자를 딴 것입니다. n은 시행횟수이고 p는 특정 사건이 발생할 확률입니다. 동전던지기를 동전을 100번 던질 때 앞면이 나오는 횟수의 확률분포는 $B(100,0.5)$ 입니다. 이항분포 $B(n,p)$ 를 식으로 .. 2018. 4. 12.
[손으로 푸는 통계] 16. 정규분포 함수 유도 (방법1. 과녁맞추기를 이용한 유도 2/2) 정규분포 함수 유도 (방법1. 과녁맞추기를 이용한 유도 2/2) 정규분포 함수 유도 두번째 시간입니다. 지난 시간에 정규분포 함수의 형태를 찾았고 아래와 같습니다. $f(x)=Ae^{\frac{C}{2}x^2}$ A의 부호 판별 오늘은 계수를 구해보겠습니다. 먼저 A의 부호를 판별해봅시다. $f(x)$는 확률밀도함수이기 때문에 음수값을 가질 수 없습니다. 따라서 항상 양수여야 합니다. $e^{\frac{C}{2}x^2}$ 는 항상 양수이므로, A도 항상 양수입니다. $A>0$ C의 부호 판별 $f(x)=Ae^{\frac{C}{2}x^2}$에서 만약 C가 양수라면 x가 커질 수록 $f(x)$는 한없이 커집니다. x가 커질 수록 전체 값은 작아지는 것이 초기에 설정한 조건이었습니다. x가 커질 수록 전체 값.. 2018. 3. 25.
[손으로 푸는 통계] 15. 정규분포 함수 유도 (방법1. 과녁맞추기를 이용한 유도 1/2) 정규분포 함수 유도 (방법1. 과녁맞추기를 이용한 유도 1/2) 지난 세 강에 걸쳐서 표본의 크기 n이 충분히 클 때 표본평균의 분포가 정규분포를 따른다는 것을 유도했습니다. 정규분포는 당연히 알고 있다는 듯 사용했지만, 우리는 정규분포가 어디에서 왔는지 모릅니다. 정규분포함수는 고등학교 확률과 통계시간에 처음 배웠던걸로 기억합니다. 고등학교 시절 정규분포를 접했을 때, 도데체 이 함수가 어디서 온 것인지 궁금했었습니다. 정규분포가 우리 주변에 여러곳에서 발견된다는 이야기를 듣고, 이와 비슷한 모양의 함수를 찾은 것인가 생각하기도 했습니다. 언젠가 꼭 이유를 밝혀보고 싶다는 생각을 갖고 있었는데요. 우연히 통계 유튜브와 블로그를 시작하게 됐고, 결국 궁금증을 해결할 수 있었습니다. 제가 찾은 정규분포 유.. 2018. 3. 25.
[손으로 푸는 통계] 14. 중심극한정리 증명 (#3. 표본평균의 적률생성함수) 중심극한정리 증명 (#3. 표본평균의 적률생성함수) 중심극한정리 증명의 마지막 시간입니다. 첫 시간에는 두 확률변수의 확률분포가 같을 조건을 배웠습니다. 두 확률변수의 적률생성함수가 같다면, 두 확률변수의 확률분포가 같았습니다. 두번째 시간에는 정규분포의 적률생성함수를 유도했습니다. 정규분포의 적률생성함수는 아래와 같습니다. $M_{X}(t)=E(e^{tx})=e^{ \mu t+\frac{+ \sigma^2 t^2 }{2} }$ 이번 시간에는 표본평균의 적률생성함수를 유도할 것입니다. 유도된 적률생성함수가 정규분포의 적률생성함수와 같다면, 표본평균의 분포와 정규분포가 같다고 할 수 있습니다. 표본평균의 분포가 정규분포를 따른다는 것을 보일 수 있는 것입니다. 목차 1. 표본평균의 적률생성함수 유도 2. .. 2018. 3. 24.
[손으로 푸는 통계] 13. 중심극한정리 증명 (#2. 정규분포의 적률생성함수) 중심극한정리 증명 (#2. 정규분포의 적률생성함수) 지난시간에 두 확률변수의 확률분포가 같을 조건을 배웠습니다. 두 확률변수의 적률생성함수가 같다면 두 확률변수의 확률분포가 같았습니다. 두 확률분포의 적률생성함수가 같음 → 두 확률변수의 확률분포가 같음. 이 원리를 이용하여 중심극한정리를 증명할 수 있습니다. 표본의 크기가 무한히 커질 때 표본평균의 적률생성함수를 구하고, 이를 정규분포의 적률생성함수와 비교합니다. 두 적률생성함수가 같다는 것을 보이면, 표본평균의 분포가 정규분포라는 것을 보일 수 있습니다. 이번글에서는 정규분포의 적률생성함수를 유도해보겠습니다. 다음 글에서 표본평균의 적률생성함수를 유도하고 둘을 비교할 것입니다. 정규분포의 적률생성함수 유도 정규분포를 따르는 확률변수 X가 있다고 합시다.. 2018. 3. 24.
[손으로 푸는 통계] 12. 중심극한정리 증명 (#1. 확률분포가 같을 조건) 중심극한정리 증명 (#1. 확률분포가 같을 조건) 지난시간까지 중심극한정리 유도에 사용되는 두가지 재료를 공부해봤습니다. 두 가지 재료는 아래와 같습니다. - 테일러 급수 - 적률생성함수 중심극한정리는 표본의 크기가 커짐에 따라 '표본 평균'들의 분포가 정규분포에 가까워져 간다는 정리입니다. 표본의 크기가 충분히 클 경우 표본평균의 분포를 정규분포로 가정하는데 사용되는 정리입니다. t검정을 비롯하여 모수적 통계방법들의 기반이 되는 정리입니다. 중심극한정리를 유도하는 절차는 아래와 같습니다. #1. 두 확률변수의 적률생성함수가 같다면, 두 확률변수의 분포가 동일함을 보임 #2. 정규분포를 따르는 확률변수의 적률생성함수를 유도함 #3. 표본평균의 적률생성함수를 유도함, 정규분포를 따르는 확률변수의 적률생서함.. 2018. 3. 24.
[손으로 푸는 통계] 11. 적률생성함수 (중심극한정리를 위한 재료 #2) 우리는 중심극한정리를 증명하기 위해 필요한 사전지식들을 공부하고 있습니다. 지난시간에는 테일러급수가 무엇인지 배웠구요. 이번시간에는 적률생성함수가 무엇인지 배워보겠습니다. 적률생성함수는 말 그대로 '적률'을 생성하는 함수입니다. 적률이 무엇인지 부터 알아야 합니다. 적률(Moment) 수학에서 적률은 아래와 같이 정의됩니다. n차적률이라고 부릅니다. $\mu_{n}=\int_{-\infty }^{\infty }\left ( x-c \right )^nf(x)dx$ 수학에서 정의된 적률이라는 개념을 통계학에 적용해 봅시다. 먼저 상수 c에 0을 넣습니다. $\mu_{n}=\int_{-\infty }^{\infty } x^{n} f(x)dx$ 이제 x를 확률변수, f(x)를 확률밀도함수로 해석하면 됩니다. $.. 2018. 3. 24.
[손으로 푸는 통계] 10. 테일러 급수 유도하기 (중심극한정리 재료 #1) 중심극한정리를 증명하는 과정에서 테일러급수가 사용됩니다. 오늘은 테일러급수를 유도해보도록 하겠습니다. 테일러급수 설명 테일러급수는 브룩 테일러(Brook Taylor)가 1715년에 처음 소개했습니다. 테일러급수는 무한급수입니다. 어떤 함수를 다항함수로 만들어진 무한급수로 바꿔줍니다. 어떤 함수 $f(x)$에 테일러급수를 적용하면 아래와 같습니다. $f(x)=f(a)+\frac{f'(a)}{1!}(x-a)+\frac{f''(a)}{2!}(x-a)^{2}+\frac{f'''(a)}{3!}(x-a)^{3}+...$ 임의의 점 a에서의 미분값을 이용해서 함수 값을 계산할 수 있게 해줍니다. a근처에서의 함수값을 구할 경우 고차항(H.O.T)들의 크기가 아주 작아지기 때문에, 고차항들을 날려버리고 함수의 근사값.. 2018. 3. 24.
반응형