본문 바로가기
반응형

@ 필수과목/손으로 푸는 통계101

[손으로 푸는 통계 ver1.0] 41. 표본분산의 분포 유도 (6) 2자유도 카이제곱분포를 특성함수나 적률생섬함수로 유도할 수 없는 이유 우리는 자유도가 n인 카이제곱분포를 유도하고 있는데요. 제가 생각한 과정은 자유도가 1인 카이제곱분포를 유도하고, 자유도가 1인 카이제곱분포의 적률생성함수 또는 특성함수를 이용하여 자유도가 2인 카이제곱분포를 유도하는 것이었습니다. 그리고 이 과정에서 찾은 관계를 이용하여 자유도 n으로 확장하려고 했는데요. 이 방법으로는 안되더라구요. 지금은 다른 방법을 찾았고 시도하는 중입니다. 이 경우에 왜 적률생성함수나 특성함수로는 불가능한지 공유하는 것 자체가 의미가 있을 것 같아서 공유드리려고 합니다. 먼저 자유도가 1인 카이제곱분포의 적률생성함수를 유도해보겠습니다. 특성함수 유도가 훨씬 복잡해서 적률생성함수로 설명하겠습니다. 자유도가 1인 카이제곱분포를 따르는 확률변수를 Y라고 놓겠습니다. Y의 적률생성함수는.. 2020. 5. 6.
[손으로 푸는 통계 ver1.0] 40. 표본분산의 분포 유도 (5) 크기가 2인 표본분산의 분포 표본분산의 분포를 구하기 위해 아래 정의에서 출발했습니다. 위 정의를 이용해서 아래 수식을 유도했습니다. 우변은 자유도가 n-1인 카이제곱 분포를 따르는데요. 우리는 아직 자유도가 1인 카이제곱분포만 유도한 상태입니다. 자유도가 1인 카이제곱분포는 n이 2일 때를 의미합니다. n이 2라는 것은 표본의 크기가 2라는 말입니다. 위 식에서 n에 2를 넣으면 아래와 같은 식이 됩니다. 우변이 자유도가 1인 카이제곱분포입니다. 위 식을 Y라고 놓고 분포함수를 유도했었습니다. 우리가 유도한 Y의 분포함수는 아래와 같습니다. 그래프를 그려봅시다. 손으로 그리기 어렵기 때문에 R을 이용하여 그렸습니다. 0에 가까울 수록 발생확률이 높고, 0보다 커질수록 발생확률이 작아지는 형태의 분포입니다. x=seq(0,4,0.0.. 2020. 5. 1.
[손으로 푸는 통계 ver1.0] 39. 표본분산의 분포 유도 (4) 자유도가 1인 카이제곱분포의 평균과 분산 36~38강에서 표본분산의 분포는 표준정규분포를 따르는 확률변수의 제곱을 n-1개 더한 분포라는 것을 유도했습니다. 표준정규분포의 제곱의 합의 분포를 단계적으로 유도하기 위해 표준정규분포 1개의 제곱의 분포를 유도했습니다. 이는 자유도 1인 카이제곱분포였습니다. 자유도가 1인 카이제곱분포를 표본분산의 분포로 이용하는 방법을 알아보기 전에 자유도가 1인 카이제곱분포의 평균과 분산을 구해보겠습니다. 먼저 평균을 유도해봅시다. 평균 평균은 아래와 같이 정의됩니다. 아래와 같이 계산할 수 있습니다. 부분적분을 합시다. e^(y/2)을 적분할 것입니다. 빨간항은 0이 됩니다. 2를 약분해줍시다. 적분기호 안은 자유도가 1인 카이제곱분포의 확률밀도함수입니다. 전체구간으로 적분하면 값은 1입니다. 따라서 평균은 1이.. 2020. 4. 27.
[손으로 푸는 통계 ver1.0] 38. 표본분산의 분포 유도 (3) 자유도가 1인 카이제곱분포 유도 36강과 37강에서 아래 수식을 유도했습니다. 우변의 각 항은 표준정규분포를 따르는 변수의 제곱입니다. 따라서 아래와 같이 바꿔쓸 수 있습니다. 2020. 4. 4.
[손으로 푸는 통계 ver1.0] 37. 표본분산의 분포 유도 (2) 표준화 표본분산의 분포를 계속해서 유도해봅시다. 아래는 표본분산의 계산식입니다. 지난시간에 우리는 위 수식을 아래와 같이 변형하였습니다. 우변은 정규분포를 따르는 모집단의 확률변수의 제곱 n개 에서, 정규분포를 따르는 표본평균의 제곱 n개를 뺀 형태입니다. 정규분포보다 표준정규분포가 다루기 쉬우므로, 변형해주겠습니다. 표준화를 할 것입니다. 모집단의 확률변수들은 평균이 모평균 μ 이고 분산이 모분산 σ² 입니다. 표본평균의 평균은 모평균 μ이고, 분산은 모분산을 n으로 나눈 값입니다. 아래와 같이 완전제곱식을 만들게해주는 항을 더하고 빼줍시다. 아래와 같이 꺼내줍시다. 완전제곱식으로 만들어줍시다. 위 식의 파란식들도 완전제곱식으로 만들기 위해 아래와 같이 더하고 뻅시다. 완전제곱식으로 묶고, 소거할 수 있는 항.. 2020. 4. 4.
[손으로 푸는 통계 ver1.0] 36. 표본분산의 분포 유도 (1) 표본분산 수식 변형하기 표본분산의 분포를 유도해봅시다. 일단 시도해보면서 어떤 내용들이 더 필요할지 알아볼 것입니다. 만만치 않은 과정이 될 것 같네요. 평균이 μ 이고 분산이 σ² 인 모집단이 있습니다. 이 모집단에서 뽑을 수 있는 크기가 n인 표본의 표본분산은 아래와 같이 정의됩니다. s² 는 표본분산의 확률변수입니다. 모집단에서 뽑은 수많은 표본분산을 원소로 갖는 집합입니다. 우리가 실제로 표본을뽑는다면, 그 표본을 이 함수에 대입하여 표본분산을 구할 수 있습니다. 확률변수로 놓는 것은 3강에서도 설명한 개념인데요. 이 부분이 이해 안되시는 분들은 댓글을 달아주세요. 많은 분들이 이해를 어려워하시면 더 와닿는 설명을 생각해 보겠습니다. 이제 위 식을 전개해봅시다. 앙변에 n-1을 곱합시다. 시그마와 무관한 식들은 시그마 .. 2020. 4. 1.
[손으로 푸는 통계 ver1.0] 35. z검정의 한계 (우리는 이유도 모른채 모분산 대신 표본분산을 사용했었다) 오늘은 z검정의 한계에 대한 이야기를 해볼것입니다. 우리는 지금까지 z검정을 열심히 배웠지만, 실제로 z검정을 사용할 수 있는 상황은 거의 없습니다. 왜그럴까요? z검정을 하기 위해서 우리는 모집단의 분산을 알아야 합니다. z검정에서 표본평균의 분포를 정의하는데, 이때 표본평균의 분산이 모분산/n이기 때문입니다. 모평균도 몰라서 추정하고 있는데 모분산을 아는 경우가 얼마나 될까요? 없을겁니다. z검정이라는 아주 유용한 검정을 발견했지만, 모분산을 알 수 없는 상황에서는 z검정을 사용할 수가 없습니다. 이 문제를 어떻게 해결할 수 있을까요. 가장 쉽게 떠오르는 방법은 아래와 같을 것입니다. "표본의 분산을 모분산 대신 사용하자" 아래와 같이 대체하는 것입니다. (σ는 모표준편차, s는 표본표분편차입니다.).. 2020. 3. 30.
[손으로 푸는 통계 ver1.0] 34. 1~33강 요약 손으로 푸는 통계는 't검정의 원리'를 이해하는 강의입니다. t검정,분산분석,회귀분석 등 우리가 접하는 통계기법들의 근본 원리는 동일합니다. t검정을 이해하기 위해서는 꽤 많은 선행 내용이 필요했습니다. 33개의 강의를 진행했고, 곧 t검정이 등장합니다. 이번 강의에서는 지금까지 배운 내용을 요약해봅시다. 1. 평균, 편차, 분산, 표준편차 2. 자유도와 불편추정량 (왜 n-1로 나누나요?) 3. 표본평균의 평균이 모평균과 같은 이유 4. 표본분산의 기댓값이 모분산과 같은 이유 5. 표본평균의 분산이 모분산/n 인 이유(고등학생들 꼭 보세요) 6. E(XY)=E(X)E(Y) 의 성립조건과 증명 7. 크기가 1인 표본평균의 평균과 분산이 모집단과 같은 이유 증명 8. 1~7강 요약(세로영상) 9. 중심극한.. 2020. 2. 10.
[손으로 푸는 통계 ver1.0] 33. 독립표본 Z검정 예제 독립표본 Z검정의 예제를 풀어봅시다. 우리가 핸드폰 케이스를 만드는 공장을 운영한다고 해봅시다. 플라스틱 재료를 구매하기 위해 두 업체와 컨택했습니다. A업체와 B업체라고 하겠습니다. 두 업체에서 같은 소재의 견적을 받았고 가격은 비슷했습니다. 제품에 대한 정보를 받긴 했는데, 직접 강도 테스트를 해보고 싶었습니다. 각 회사로부터 샘플 50개를 받기로 했습니다. 우리는 각 회사로 부터 크기가 50인 표본을 뽑으려는 것입니다. 50개 샘플을 받기 전에, 각 회사의 표본평균의 분포를 알 수 있습니다. (이 부분이 이해가 되셔야 합니다.) 표본의 크기가 충분히 크므로, 중심극한정리에 의해 정규분포를 가정할 수있습니다. 각 회사의 표본평균의 분포는 아래와 같습니다. 각 회사 재료 강도의 분산은 25과 16로 알.. 2020. 1. 26.
[손으로 푸는 통계 ver1.0] 32. 특성함수를 이용한 두 확률변수 차의 분포함수 유도 (3) 유도 우리는 2표본 z검정을 공부하고 있습니다. 2표본 z검정은 두 모집단의 평균을 비교하는 검정방법입니다. 두 모집단의 평균을 구할 수 없기 때문에, 각각 표본을 뽑았습니다. 표본의 크기 n이 충분히 크다과 가정하고 중심극한정리를 적용하면 두 모집단의 표본평균의 분포가 정규분포를 따른다고 할 수 있습니다. 따라서 두 모집단의 표본평균의 분포는 아래와 같았습니다. 표본의 크기가 다를 수 있으니 n_A과 n_B로 구분하였습니다. 문제는 표본평균의 분포함수에 모집단의 평균이 들어가 있다는 것입니다. 모집단의 평균을 소거하기 위해 표본평균의 차를 Y로 놓고 Y의 분포를 구하기로 했습니다. 이때 특성함수가 사용됩니다. 두 표본평균의 분포에 지난시간에 배운 정규분포의 특성함수를 적용하면 아래와 같습니다. 우리가 구해아.. 2020. 1. 25.
[손으로 푸는 통계 ver1.0] 31. 특성함수를 이용한 두 확률변수 차의 분포함수 유도 (2) 정규분포의 특성함수 우리는 2표본 z검정을 공부하고 있습니다. 두 모집단의 평균을 비교하는 검정입니다. 중심극한정리를 이용하여 두 모집단의 표본평균이 정규분포를 따른다고 가정했습니다. 두 집단의 표본평균의 분포는 아래와 같습니다. 표본평균의 차이를 Y라고 놓고, Y의 분포를 유도하기로 했는데요. Y의 분포를 유도하는 방법은 세가지가 있었습니다. 1) 특성함수 2) 컨볼루션 적분 3) 기하적인 방법 원래 세가지를 다 다루려고 했는데요. 내용이 또 산으로 갈 것 같아서, 1번을 이용해서 유도하고 빨리 진행하기로 했습니다. 수학적인 다양한 접근방법들은 나중에 따로 강의를 만들어 다루도록 하겠습니다. 특성함수를 이용하여 유도하기로 했습니다. 지난시간에 특성함수가 무엇인지 배웠구요. 오늘은 정규분포의 특성함수를 구해볼겁니다. 두 모.. 2020. 1. 12.
[손으로 푸는 통계 ver1.0] 30. 특성함수를 이용한 두 확률변수 차의 분포함수 유도 (1) 특성함수란? 지난시간까지 2표본 z검정의 원리를 알아보았습니다. 2표본 z검정을 하기 위해, 정규분포를 따르는 두 확률변수의 차의 분포를 유도해야합니다. 두 확률변수는 아래와 같습니다. 두 확률변수의 차는 아래와 같습니다. Y의 분포를 유도해야하는데요. 특성함수를 이용하여 유도하겠습니다. 특성함수는 확률밀도함수에 '퓨리에 변환'을 적용한 함수입니다. 퓨리에변환은 아래와 같습니다. 퓨리에 변환은 시간에 대한 함수를 주파수성분으로 분해해주는 역할을 하는데요. 공대생 분들은 '공업수학'에서 보셨을겁니다. 퓨리에 변환을 통계학의 확률밀도함수 f(x)에 적용했더니 재밌는 일이 벌어졌습니다. 익숙한 모양입니다. 기댓값을 구하는 수식이 됩니다. 따라서 아래와 같은 의미를 갖습니다. 통계학에서 특별하게 사용될 함수이므로, 함수의 .. 2020. 1. 6.
[손으로 푸는 통계] 29. 2표본 z검정 (2) 원리 우리는 아래와 같은 두 모집단의 평균을 비교하고 있습니다. 모집단의 평균을 알지 못하기 때문에 표본을 하나씩 뽑았습니다. 그림으로 나타내면 아래와 같습니다. 이제 우리는 두 모집단의 평균을 통계적으로 비교할 방법을 찾아야 합니다. 우리에게 주어진 것들은 아래와 같습니다. 1) 각 모집단의 분산 ($\sigma_{A}^2$, $\sigma_{B}^2$) 2) 각 모집단의 표본평균의 분포 $f\left ( \bar{X}_{A} \right )=\frac{1}{\sqrt{2\pi}\frac{\sigma_{A}}{\sqrt{n}}}e^{-\frac{\left ( \bar{X}_{A}-\mu_{A} \right )^2 }{2\frac{\sigma_{A}^2}{n}}}$ $f\left ( \bar{X}_{B} \r.. 2020. 1. 4.
[손으로 푸는 통계] 28. 2표본 z검정 (1) 소개, 두 모집단과 표본 지금까지 우리는 1표본 Z검정을 배웠습니다. 1표본 Z검정은 모집단에서 표본을 하나 추출하여, 모집단의 평균을 검정하는 것입니다. 예를 들면 모집단의 평균이 30으로 알려진 상황에서 '정말 30이 맞아?'라는 의문을 해결하기 위해 검정을 하는 것입니다. 오늘 부터 배워볼 검정은 2표본 Z검정입니다. 2표본이니까 표본을 2개 뽑는다는 뜻인데요. 하나의 모집단에서 표본을 2개 뽑는 것은 아닙니다. 2표본 Z검정에서 모집단은 2개입니다. 2표본 Z검정은 두 모집단의 평균을 비교하는 검정입니다. 각 모집단에서 표본을 하나씩 뽑기 때문에 표본의 개수는 총 2개가 됩니다. 예를 들어 봅시다. 두 모집단 A와 B가 있습니다. 두 모집단의 분산만 알려져 있고 평균은 모르는 상황이라고 합시다. 그림으로 나타내면 아래와 .. 2020. 1. 3.
[손으로 푸는 통계] 27. 일부 영상을 내린 이유 & 변경된 계획 안녕하세요. 손으로 푸는 통계입니다. 제가 기존에 있던 27~48강 영상를 삭제하였습니다. 27~48강은 아래와 같은 내용입니다. - 분위수 - qq plot - 정규성검정 종류 - KS검정 도입부 이 내용을 없애고, 28강부터 다른 내용으로 이어가려고 합니다. 기존의 계획은 1표본 z검정 이후에 정규성검정을 설명하고, t검정에 대한 설명으로 이어가려고 했습니다. 그래서 분위수부터 시작해서 코로고로브-스미르노브 검정(KS 검정)의 도입부까지 영상을 올려놓은 상태였는데요. KS검정을 공부하다보니 내용이 상당히 어렵고 많았습니다. KS분포를 이해하려면 brownian bridge를 알아야 하고, brownian bridge를 알아야 하면 wiener process(위너 과정)를 알아야 하고, 이 내용들은 확.. 2020. 1. 2.
[손으로 푸는 통계] 26. 1표본 Z검정 예제 1표본 Z검정 예제를 하나 풀어봅시다. A회사 K젤리라는 예제입니다. A제과회사에서는 K젤리라는 인기상품을 팔고 있습니다. A회사는 K젤리 무게의 평균과 표준편차를 아래와 같다고 주장하고 있습니다. $75g \pm 5g$ A회사의 경쟁사인 B사에서는 A사가 K젤리의 무게를 부풀렸다고 생각합니다. B회사에서는 이를 통계적으로 입증하기 위해 K젤리 100개를 구매했습니다. 모집단에서 크기가 100인 표본을 뽑은 것입니다. 포장을 뜯어 100개의 K젤리 무게의 표본평균과 표본표준편차를 계산했더니 아래와 같았습니다. $\bar{X}_{1}=68.5$ $\sigma{1}=2$ 귀무가설과 대립가설을 세워봅시다. 귀무가설은 K젤리의 무게 평균이 70g 이라는 것입니다. 대립가설은 우리의 주장이 담긴 것으로 '70g보.. 2018. 5. 31.
[손으로 푸는 통계] 25. 통계적 가설검정 감잡기 5 (1종오류 vs 2종오류) 통계적 가설검정은 귀무가설과 대립가설을 세우고 p값에 따라 기각 여부를 결정하는 것을 말합니다. 통계적 가설검정에는 아래와 같은 네 가지 상황이 발생할 수 있습니다. 1. 귀무가설이 참 → 채택 2. 귀무가설이 참 → 기각 (1종 오류, α 오류) 3. 귀무가설이 거짓 → 채택 (2종 오류, β 오류) 4. 귀무가설이 거짓 → 기각 쉽게 이해하기 위해 아래와 같은 표를 만들어 봅시다. 통계적 가설검정은 확률이 개입되기 때문에 항상 옳은 결정을 내릴 수 없습니다. 실제로 귀무가설이 참인데 기각할 수도 있고, 귀무가설이 거짓인데 채택할 수도 있습니다. 이러한 잘못된 선택을 오류라고 합니다. 귀무가설이 참인데도 기각하는 오류를 1종오류 또는 α 오류라고 합니다. 귀무가설이 거짓인데도 기각을 하지 않는 오류를 .. 2018. 5. 21.
[손으로 푸는 통계] 24. 통계적 가설 검정 감잡기 4 (양측검정 vs 단측검정) 우리는 지난시간까지 아래 내용을 배운 상태입니다. - 귀무가설, 대립가설 - 가설검정 원리 - 유의수준 ($\alpha$) - 유의확률 (p-value) 이번시간에는 기각역, 양측검정, 단측검정을 배워봅시다. 지난시간에 사용한 예시를 가져옵시다. 모집단이 하나 있는데, 평균이 $\mu$라고 알려져 있습니다. 우리는 이 주장에 반대하는 상황입니다. Z검정을 하기 위해 귀무가설과 대립가설을 아래와 같이 세웠습니다. 귀무가설 : $E[\bar{X}]=\mu$ (기존의 주장) 대립가설 : $E[\bar{X}] \neq \mu$ (기존의 주장에 반대하는 우리의 주장) 이 모집단에서 표본을 하나 뽑아서 평균을 구했습니다. 우리가 뽑은 표본의 평균을 $\bar{X}_{1}$ 라고 합시다. $\bar{X}_{1}$ 보.. 2018. 5. 19.
[손으로 푸는 통계] 23. 통계적 가설 검정 감잡기 3 (유의수준 α, 유의확률 p-value) 오늘은 가설검정에서 사용되는 중요한 개념인 유의수준과 유의확률에 대해 배워볼 것입니다. 그 전에 지난 시간에 배운 내용을 간단히 복습하고 오늘 내용을 배워봅시다. 어떤 사람이 모집단의 평균이 $\mu$ 라고 주장하고 있습니다. 우리는 아니라고 생각합니다. 이를 밝혀내기 위해 두 가지 가설을 세웠습니다. 귀무가설 : $E[\bar{X}]=\mu$ (기존의 주장) 대립가설 : $E[\bar{X}] \neq \mu$ (기존의 주장에 반대하는 우리의 주장) 기존의 주장이 맞다고 가정하고 진행하겠습니다. 평균이 $\mu$인 모집단에서 크기가 n인 표본평균 분포함수를 정의했습니다. 표본을 뽑지 않아도 분포함수를 정의할 수 있다는 것을 이미 배웠습니다. 아래와 같습니다. $\bar{X} \sim N \left ( \.. 2018. 5. 16.
[손으로 푸는 통계] 22. 통계적 가설 검정 감잡기 2 (1표본 Z검정) 지난글에서 통계적 가설검정이 무엇인지 간단히 살펴봤습니다. 오늘은 통계적 가설검정의 절차를 자세히 공부할 것입니다. 통계적 가설검정은 귀무가설과 대립가설을 세우고 해당 가설이 참인지를 확률적으로 판단하는 방법입니다. 모집단의 평균이 $\mu$라고 알려진 상황이고 우리는 이러한 사실을 반박하고 싶습니다. 이때 귀무가설과 대립가설은 아래와 같이 세웁니다. 귀무가설 : $E[\bar{X}]=\mu$ (기존의 주장) 대립가설 : $E[\bar{X}] \neq \mu$ (기존의 주장에 반대하는 우리의 주장) 표본평균의 평균은 모평균과 같으므로 위 가설의 $E[\bar{X}]$ 는 '모집단의 평균' 을 다른 기호로 나타낸 것 뿐입니다. 우리는 귀무가설이 참인지 여부를 통계적으로 판단해야 합니다. 판단 방법의 핵심은.. 2018. 5. 12.
[손으로 푸는 통계] 21. 통계적 가설 검정 감잡기 1 (귀무가설, 대립가설) 지난시간까지 배운 내용은 아래와 같습니다. - 통계량 (평균,분산,표준편차) - 모집단의 통계량과 표본의 통계량 사이의 관계 - 중심극한정리 - 정규분포 유도 기본 내용에 대한 정리가 어느정도 끝났습니다. 이번시간부터는 통계적 가설검정에 대해 배워봅시다. t검정, 분산분석, 회귀분석 등 대부분의 통계분석 방법의 기본 원리는 '통계적 가설검정'입니다. 통계적 가설검정 가설검정은 어떤 가설을 세우고 그 가설이 맞는지 틀린지를 시험하는 것입니다. 통계적 가설검정에서는 통계 이론과 확률을 이용하여 가설을 검정합니다. 가설검정은 영어로 hypothesis test 입니다. 어떤 가설을 세울까 통계적 가설검정에서는 주로 어떤 가설을 세울까요? 통계량을 이용하여 가설을 세웁니다. 우리가 배운 통계량은 평균, 분산이 .. 2018. 5. 10.
[손으로 푸는 통계] 20. 정규분포를 유도하며 알게 된 것들 고등학교에서 정규분포를 처음 배울 때 함수의 수식부터 배웠떤 기억이 있습니다. 이어서 정규분포의 성질들을 배웠습니다. 정규분포의 모양ㅇ느 종을 엎어놓은 모양이고, 표준편차가 작아질 수록 얇고 높아진다 등을 배웠습니다. 그 당시 정규분포의 유도과정이 궁금했었는데 왜 선생님에게 질문을 하지 않았었는지는 기억이 안납니다. 나름대로 내렸던 결론은 유도과정이 없고 여러 현상에서 발견되는 분포들을 수학적으로 fitting 하여 찾아냈을 것이라 생각했었습니다. 졸업 후 한참이 지난 20대 후반에 취미로 통계공부를 시작했고, 정규분포의 유도과정이 있다는 것을 알았습니다. 제가 찾은 방법은 두 가지였고 지난시간까지 두 방법 모두 다뤘습니다. 두 방법은 아래와 같습니다. 방법1. 과녁 맞추기를 이용한 유도 방법2. 이항분.. 2018. 4. 14.
[손으로 푸는 통계] 19. 정규분포함수 유도하기 (방법2. 이항분포 이용 2/2) 이항분포를 이용하여 정규분포를 유도하고 있습니다. 지난시간에 유도한 내용을 간단히 요약합시다. 이항분포를 $f(r)$에서 $g(r)=\ln f(r)$ 로 놓고 $g(r)$을 구하였습니다. 이를 1번 식이라고 하였습니다. $\begin{align} g(r)&=n\ln n-r\ln r- (n-r)\ln (n-r) \\ &+\frac{1}{2}\ln( n)-\frac{1}{2}\ln(r)-\frac{1}{2}\ln(2\pi ) -\frac{1}{2}\ln((n-r)) \\ &+r\ln p +(n-r)\ln q \end{align}$ (1번식) $g(r)$의 미분을 구했습니다. 2번 식이라고 하였습니다. $\begin{align} g'(r)&=-\ln r+\ln (n-r) \\ &-\frac{1}{2r} -\f.. 2018. 4. 12.
[손으로 푸는 통계] 18. 정규분포함수 유도하기 (방법2. 이항분포 이용 1/2) 정규분포 함수를 유도하는 방법은 두가지가 있고 아래와 같습니다. 1) 과녁 맞추기를 이용한 유도 2) 이항분포를 이용한 유도 15,16강에서 1번 방법으로 정규분포를 유도하였습니다. 이번 강의부터 2번 방법으로 정규분포를 유도하겠습니다. 내용이 많아서 이번강의와 다음강의 둘로 나눠서 설명하겠습니다. 이항분포를 정규분포로 근사시키는 방법을 통해 정규분포를 유도하겠습니다. 이항분포 $B(n,p)$의 확률질량함수는 아래와 같습니다. $f(r)=_{n}C_{r}p^rq^{n-r}$ 확률변수를 r로 놓았습니다. 위 식에서 조합으로 표현된 부분을 팩토리얼 형태로 바꿔줍시다. $f(r)=\frac{n!}{r!(n-r)!}p^rq^{n-r}$ 양변에 자연로그를 취해줍니다. $\ln f(r)=\ln n!-\ln r! -.. 2018. 4. 12.
[손으로 푸는 통계] 17. 이항분포의 평균과 분산 정규분포의 두가지 유도방법을 공부하고 있습니다. 두가지 유도방법은 아래와 같습니다. 1) 과녁 맞추기를 이용한 유도 2) 이항분포를 이용한 유도 지난시간까지 1번인 과녁 맞추기를 이용한 유도를 공부해보았습니다. 이제 2번인 이항분포를 이용하여 정규분포를 유도할 차례입니다. 이항분포를 이용하여 정규분포를 유도할 때 이항분포의 평균과 분산이 사용됩니다. 이번시간에는 이항분포의 평균과 분산을 구해봅시다. 이항분포는 $B(n,p)$ 라고 나타냅니다. B는 binomial distribution 의 첫글자를 딴 것입니다. n은 시행횟수이고 p는 특정 사건이 발생할 확률입니다. 동전던지기를 동전을 100번 던질 때 앞면이 나오는 횟수의 확률분포는 $B(100,0.5)$ 입니다. 이항분포 $B(n,p)$ 를 식으로 .. 2018. 4. 12.
[손으로 푸는 통계] 16. 정규분포 함수 유도 (방법1. 과녁맞추기를 이용한 유도 2/2) 정규분포 함수 유도 (방법1. 과녁맞추기를 이용한 유도 2/2) 정규분포 함수 유도 두번째 시간입니다. 지난 시간에 정규분포 함수의 형태를 찾았고 아래와 같습니다. $f(x)=Ae^{\frac{C}{2}x^2}$ A의 부호 판별 오늘은 계수를 구해보겠습니다. 먼저 A의 부호를 판별해봅시다. $f(x)$는 확률밀도함수이기 때문에 음수값을 가질 수 없습니다. 따라서 항상 양수여야 합니다. $e^{\frac{C}{2}x^2}$ 는 항상 양수이므로, A도 항상 양수입니다. $A>0$ C의 부호 판별 $f(x)=Ae^{\frac{C}{2}x^2}$에서 만약 C가 양수라면 x가 커질 수록 $f(x)$는 한없이 커집니다. x가 커질 수록 전체 값은 작아지는 것이 초기에 설정한 조건이었습니다. x가 커질 수록 전체 값.. 2018. 3. 25.
[손으로 푸는 통계] 15. 정규분포 함수 유도 (방법1. 과녁맞추기를 이용한 유도 1/2) 정규분포 함수 유도 (방법1. 과녁맞추기를 이용한 유도 1/2) 지난 세 강에 걸쳐서 표본의 크기 n이 충분히 클 때 표본평균의 분포가 정규분포를 따른다는 것을 유도했습니다. 정규분포는 당연히 알고 있다는 듯 사용했지만, 우리는 정규분포가 어디에서 왔는지 모릅니다. 정규분포함수는 고등학교 확률과 통계시간에 처음 배웠던걸로 기억합니다. 고등학교 시절 정규분포를 접했을 때, 도데체 이 함수가 어디서 온 것인지 궁금했었습니다. 정규분포가 우리 주변에 여러곳에서 발견된다는 이야기를 듣고, 이와 비슷한 모양의 함수를 찾은 것인가 생각하기도 했습니다. 언젠가 꼭 이유를 밝혀보고 싶다는 생각을 갖고 있었는데요. 우연히 통계 유튜브와 블로그를 시작하게 됐고, 결국 궁금증을 해결할 수 있었습니다. 제가 찾은 정규분포 유.. 2018. 3. 25.
[손으로 푸는 통계] 14. 중심극한정리 증명 (#3. 표본평균의 적률생성함수) 중심극한정리 증명 (#3. 표본평균의 적률생성함수) 중심극한정리 증명의 마지막 시간입니다. 첫 시간에는 두 확률변수의 확률분포가 같을 조건을 배웠습니다. 두 확률변수의 적률생성함수가 같다면, 두 확률변수의 확률분포가 같았습니다. 두번째 시간에는 정규분포의 적률생성함수를 유도했습니다. 정규분포의 적률생성함수는 아래와 같습니다. $M_{X}(t)=E(e^{tx})=e^{ \mu t+\frac{+ \sigma^2 t^2 }{2} }$ 이번 시간에는 표본평균의 적률생성함수를 유도할 것입니다. 유도된 적률생성함수가 정규분포의 적률생성함수와 같다면, 표본평균의 분포와 정규분포가 같다고 할 수 있습니다. 표본평균의 분포가 정규분포를 따른다는 것을 보일 수 있는 것입니다. 목차 1. 표본평균의 적률생성함수 유도 2. .. 2018. 3. 24.
[손으로 푸는 통계] 13. 중심극한정리 증명 (#2. 정규분포의 적률생성함수) 중심극한정리 증명 (#2. 정규분포의 적률생성함수) 지난시간에 두 확률변수의 확률분포가 같을 조건을 배웠습니다. 두 확률변수의 적률생성함수가 같다면 두 확률변수의 확률분포가 같았습니다. 두 확률분포의 적률생성함수가 같음 → 두 확률변수의 확률분포가 같음. 이 원리를 이용하여 중심극한정리를 증명할 수 있습니다. 표본의 크기가 무한히 커질 때 표본평균의 적률생성함수를 구하고, 이를 정규분포의 적률생성함수와 비교합니다. 두 적률생성함수가 같다는 것을 보이면, 표본평균의 분포가 정규분포라는 것을 보일 수 있습니다. 이번글에서는 정규분포의 적률생성함수를 유도해보겠습니다. 다음 글에서 표본평균의 적률생성함수를 유도하고 둘을 비교할 것입니다. 정규분포의 적률생성함수 유도 정규분포를 따르는 확률변수 X가 있다고 합시다.. 2018. 3. 24.
[손으로 푸는 통계] 12. 중심극한정리 증명 (#1. 확률분포가 같을 조건) 중심극한정리 증명 (#1. 확률분포가 같을 조건) 지난시간까지 중심극한정리 유도에 사용되는 두가지 재료를 공부해봤습니다. 두 가지 재료는 아래와 같습니다. - 테일러 급수 - 적률생성함수 중심극한정리는 표본의 크기가 커짐에 따라 '표본 평균'들의 분포가 정규분포에 가까워져 간다는 정리입니다. 표본의 크기가 충분히 클 경우 표본평균의 분포를 정규분포로 가정하는데 사용되는 정리입니다. t검정을 비롯하여 모수적 통계방법들의 기반이 되는 정리입니다. 중심극한정리를 유도하는 절차는 아래와 같습니다. #1. 두 확률변수의 적률생성함수가 같다면, 두 확률변수의 분포가 동일함을 보임 #2. 정규분포를 따르는 확률변수의 적률생성함수를 유도함 #3. 표본평균의 적률생성함수를 유도함, 정규분포를 따르는 확률변수의 적률생서함.. 2018. 3. 24.
반응형