본문 바로가기
반응형

@선택과목115

[손으로 푸는 카이제곱검정] 1. 프롤로그 이 강의는 카이제곱검정에 대한 강의입니다. 카이제곱 검정의 원리를 수학적으로 자세하게 이해하는 것이 목적입니다. 카이제곱검정이 언제 사용되는지 알아볼건데요. 먼저 질문을 하나 던지겠습니다. 30대 남자와 여자의 흡연율에 차이가 있는지 알아보고 싶다면 어떻게 해야 할까요? 30대 남자 집단과 30대 여자 집단 전체를 조사하고 흡연율을 비교하는 것이 가장 정확한 방법일 것입니다. 하지만 아직까지 전수조사는 쉽지 않습니다. 기술적으로는 거의 가능해보이지만 시행하는 것은 또다른 문제 같습니다. 한달에 한번 의무적으로 조사에 참여하도록 하는 법이 생기면 가능할 수도 있겠습니다. 아무튼 전수조사는 어렵기 때문에 표본을 뽑습니다. 표본도 잘 뽑아야 됩니다. 남자 표본은 흡연실에서 뽑고, 여자 표본은 임산부 중에서 뽑.. 2023. 12. 14.
[손으로 푸는 t검정] 5. t분포 유도과정 요약 우리는 지난시간까지 t분포를 유도했습니다. 상당히 길고 복잡한 과정이었는데요. 오늘은 전체 과정을 간단히 요약하며 복습하겠습니다. Step1) t 통계량 정의 t통계량은 아래와 같이 정의됩니다. $t=\frac{\bar{X}-\mu}{\frac{s}{\sqrt{n}}}$ Z 통계량에서 모표준편차 $\sigma$를 표본표준편차 s로 바꾼 통계량입니다. T통계량이 따르는 분포가 T분포입니다. Step2) t통계량 변형 모집단이 정규분포를 따른다는 가정을 하고, t 통계량을 아래와 같이 변형하였습니다. $t=Z\frac{1}{\sqrt{V}}\sqrt{n}$ Z는 표준정규분포를 따르는 확률변수이고 V는 n자유도 카이제곱분포를 따르는 확률변수입니다. Step3) Z와 V의 결합확률밀도함수 Z와 V의 확률밀도함수.. 2023. 4. 7.
[손으로 푸는 t검정] 4. t분포 유도 (2) 유도 우리는 지난시간에 확률변수 T를 유도했습니다. T는 아래와 같습니다. $T=Z\frac{1}{\sqrt{V}}\sqrt{n}$ 위 식에서 Z는 표준정규분포를 따르는 확률변수이고 V는 n자유도 카이제곱분포를 따르는 확률변수입니다. 이어서 우리는 Z와 V의 결합확률분포를 유도했습니다. 아래와 같습니다. $f_{Z,V}(z,v)=\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}z^2}\frac{1}{\Gamma(\frac{n}{2}) 2^{\frac{n}{2}} }v^{\frac{n}{2}-1}e^{-\frac{v}{2}}$ 오늘은 위 분포를 이용해서 t분포를 유도할겁니다. 확률변수의 변수변환이라는 테크닉을 사용할 건데요. 먼저 유도 아이디어를 간단히 설명하겠습니다. 크게 두 단계로 구분됩니다.. 2023. 3. 29.
[손으로 푸는 t검정] 4. t분포 유도 (1) t통계량 변형 우리가 분포를 유도해야할 확률변수는 아래와 같습니다. $\frac{\bar{X}-\mu}{\frac{s}{\sqrt{n}}}$ 위 확률변수를 T라고 놓겠습니다. $T=\frac{\bar{X}-\mu}{\frac{s}{\sqrt{n}}}$ 아래와 같이 변형합시다. 분모를 모분산으로 곱하고 나눠주었습니다. $T=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}\frac{s}{\sigma} }$ 우변 분모를 아래와 같이 둘로 분리해 써줍니다. $T=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}} }\frac{1}{\frac{s}{\sigma} }$ 우변 두번째 항을 루트 안에 넣어줍니다. $T=\frac{\bar{X}-\mu}{\frac{\sigma}{\.. 2023. 2. 16.
[손으로 푸는 t검정] 3. t분포의 아이디어 Z검정에서 사용하는 Z통계량은 아래와 같습니다. $Z=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}$ Z검정의 한계는 Z통계량을 구할 때, 모분산 대신 표본분산을 사용한다는 것이었습니다. 우리가 뽑은 표본의 분산은 당연히 모분산과 다를 것입니다. 아주 우연히 같은 경우가 생길 수도 있겠지만, 대부분의 경우 다를 것입니다. 윌리엄 고셋은 이 문제를 해결하고 싶었습니다. 고민 끝에 이런 아이디어를 떠올리게 됩니다. "표본분산을 확률변수로 포함하는 분포를 만들면 되지 않을까" 다른 말로 하면 아래 확률변수의 분포를 구한다는 말입니다. $\frac{\bar{X}-\mu}{\frac{s}{\sqrt{n}}}$ 이 확률변수는 Z통계량의 모분산 자리에 표본분산을 대입한 것입니다. 아마.. 2022. 12. 24.
[손으로 푸는 t검정] 2. Z검정과 그 한계 t검정을 이해하려면 Z검정과 그 한계를 먼저 알아야 합니다. t검정이 고안되기 이전에는 Z검정을 사용하고 있었고, Z검정의 한계를 극복하는 과정에서 t검정이 등장했기 때문입니다. 1. Z검정 Z검정이 무엇인지는 「손으로 푸는 통계」에서 아주 자세히 설명했습니다. 여기서는 Z검정이 무엇인지 간단히 요약해보려고 합니다. 자세한 설명은 「손으로 푸는 통계」를 참고하시면 됩니다. Z검정은 두가지가 있습니다. 하나는 평균이 알려진 모집단에서 표본 하나를 뽑아서 모평균을 검정하는 일표본 Z검정입니다. 다른 하나는 두 모집단에서 각각 표본을 뽑고, 두 모집단의 평균을 비교하는 이표본 Z검정입니다. 일표본 Z검정을 기준으로 설명하겠습니다. 모집단 A의 평균이 $\mu$ 라고 알려져 있습니다. 모평균과 모분산이 얼마인지.. 2022. 12. 24.
[손으로 푸는 등분산 검정] 1. 소개 안녕하세요 통계의 본질입니다. 본 강의의 제목은 「손으로 푸는 등분산검정」 입니다. 등분산검정의 원리를 수학적으로 이해해보는 강의입니다. 등분산 검정의 모든 과정을 수식으로 써가며 이해하는 것이 목적입니다. 선수 과목은 「손으로 푸는 통계」입니다. 여러분이 통계검정의 원리를 이해하고 있다고 가정하고 진행합니다. 등분산검정은 집단의 분산을 비교할 때 사용됩니다. 대표적인 등분산 검정은 두 가지가 있습니다. F검정과 Levene's 검정입니다. F검정은 두 그룹의 분산 비교만 가능하고, Levene's 검정은 두 그룹 뿐 아니라 세 그룹 이상의 분산 비교도 가능합니다. t검정과 분산분석은 그룹들의 등분산성을 전제로 하기 때문에 사전 과정으로 등분산 검정을 해야 합니다. 이때 Levene's 검정을 주로 사용.. 2022. 12. 24.
[손으로 푸는 비율검정] 2. 일표본 비율검정의 수학적 원리 일표본 비율검정을 이해하기 위해 한가지 상황을 설정하겠습니다. 아래와 같습니다. "A시의 여성 비율이 p라고 알려져 있는데, 표본을 뽑아 정말 그러한지 확인해 봅시다." 표본을 뽑아서 가설검정을 할 것입니다. 귀무가설과 대립가설은 아래와 같습니다. 귀무가설 : A시의 여성비율이 p이다. 대립가설 : A시의 여성비율은 p가 아니다. A시에서 크기가 n인 표본을 뽑으려고 합니다. 이때 크기가 n인 표본에 속해 있는 여성의 수를 확률변수 X라고 놓겠습니다. 확률변수 X는 아래 이항분포를 따릅니다. $X \sim B(n,p)$ 왜 확률변수 X는 이항분포를 따를까요? A시에서 크기가 n인 표본을 뽑는다는 것은, 한번 시행을 했을 때 여성이 발생할 확률이 p인 사건을 n번 시행하는 것과 같습니다. 이는 이항분포와 .. 2022. 12. 2.
[손으로 푸는 비율검정] 1. 무엇을 배우는가 이 강의에서는 두 가지 종류의 비율검정을 배울 것입니다. 하나는 일표본 비율검정이고, 다른 하나는 이표본 비율검정입니다. - 일표본 비율검정 - 이표본 비율검정 일표본 비율검정은 모비율이 p 라고 알려져 있는 상황에서, 표본을 뽑아 모비율이 p가 맞는지 검정하는 것입니다. 예를 들어 A시 여성 비율이 0.3 이라고 알려져 있는 상황에서, 정말 0.3이 맞는지 표본을 뽑아 검정하는 것입니다. 이표본 비율검정은 두 집단의 비율이 같은지 다른지 검정합니다. 예를 들어 A시와 B시의 여성 비율이 같은지 다른지를 표본을 뽑아 검정하는 것입니다. R이나 SPSS 같은 통계 프로그램으로 비율검정을 따라하는 것은 어렵지 않습니다. 본 강의는 비율검정 결과를 단순히 얻는 방법을 설명하는 강의는 아닙니다. 본 강의는 비율.. 2022. 11. 26.
[손으로 푸는 t검정] 1. 강의 소개 안녕하세요 통계의 본질입니다. 본 강의의 제목은 「손으로 푸는 t검정」 입니다. t검정의 원리를 수학적으로 이해해보는 강의입니다. t검정의 모든 과정을 수식으로 써가며 이해하는 것이 목적입니다. 선수 과목은 「손으로 푸는 통계」입니다. 여러분이 통계검정의 원리를 이해하고 있다고 가정하고 진행합니다. t 검정은 두 집단의 평균을 비교할 때 사용하는 통계분석입니다. 쉽게 생각할 수 있는 예시는 두 반의 수학점수 평균비교입니다. 이 예시의 독립변수와 종속변수를 알아봅시다. 독립변수는 반의 종류입니다. 반의 종류는 범주형 변수 입니다. 종속변수는 수학 점수이고 수치형 변수 입니다. 아래와 같이 정리할 수 있습니다. 독립변수 개수 종속변수 개수 독립변수 종류 종속변수 종류 t검정 1개 1개 범주형 수치형 t검정은.. 2022. 7. 31.
[손으로 푸는 베이즈통계] 8. 베이즈정리 심화형 유도 (5) 유도하기 손으로 푸는 베이즈통계8. 베이즈정리 심화형 유도 (5) 유도하기 우리는 3,4,5강에서 아래 세가지 내용을 배웠습니다. 조건부확률 확률의 곱셈정리 전체확률의 법칙 표본공간 S가 n개로 분할되어 있고, 표본공간의 임의의 사건을 A라고 하면 아래 등식이 성립한다. 이 재료들로 베이즈정리를 유도해보겠습니다. 아래 그림과 같이 표본공간 S가 n개로 분할되어 있다고 해봅시다. 조건부확률을 정의해봅시다. 사건 A가 발생했을 때, 사건 B가 발생할 확률입니다. 분자를 "확률의 곱셈정리" 이용하여 변형하면 아래와 같습니다. 분모를 "전체확률의 법칙"을 이용하여 변형하면 아래와 같습니다. 위 수식이 베이즈정리입니다. 이렇게만 봐서는 어떤 의미인지 와닿지 않을겁니다. 위 수식이 어떤 의미를 갖는지 그 직관적 이해에 관하.. 2019. 10. 18.
[손으로 푸는 베이즈통계] 7. 베이즈정리 심화형 유도 (1) 재료 : 전체확률의 법칙(law of total probability) 손으로 푸는 베이즈통계7. 베이즈정리 심화형 유도 (1) 재료 : 전체확률의 법칙(law of total probability) 표본공간을 S라고 합시다. 표본공간은 사건이 일어날 수 있는 전체 집합입니다. 주사위를 던지는 사건을 예로 들면 표본공간 S는 {1,2,3,4,5,6}입니다. 표본공간 S가 n개로 분할되어 있다고 해봅시다. 그림으로 표현하면 아래와 같습니다. 이렇게 n개로 분할되어 있는 표본공간 위에 어떤 사건 A가 있다고 해봅시다 . 사건 A의 개수는 아래와 같이 나타낼 수 있습니다. (A와 겹치는 부분을 다 더하면 A가 되겠죠?) 혹시 아래처럼 A가 어떤 분할영역과 겹치치 않더라도 위 식은 여전히 성립합니다. 겹치지 않는 부분은 교집합의 원소 수가 0이 될 것이기 때문입니다. 따라서 어떤 .. 2019. 10. 18.
[손으로 푸는 베이즈통계] 4. 베이즈정리 기본형 유도 (3) 재료2 : 확률의 곱셈정리(Rule of Multiplication) 손으로 푸는 베이즈통계4. 베이즈정리 기본형 유도 (3) 재료2 : 확률의 곱셈정리(Rule of Multiplication) 지난시간에 배운 조건부확률은 아래와 같습니다 . 사건 B가 발생했을 때, 사건A가 발생할 확률입니다. 위 식의 양변에 P(B)를 곱하면 아래와 같습니다. ......① 이번에는 사건 A와 B를 반대로 써봅시다. 사건 A가 발생했을 때, 사건B가 발생할 확률입니다. 위 식의 양변에 P(A)를 곱하면 아래와 같습니다. ......② 위 식 1과 2를 확률의 곱셉정리라고 부릅니다. 교집합을 '곱'으로 표현했기 때문입니다. (합집합을 합으로 표현한 정리는 확률의 덧셈정리입니다.) 2019. 9. 18.
[베이즈통계] 3. 베이즈정리 기본형 유도 (2) 재료1 : 조건부확률(Conditional probability) 손으로 푸는 베이즈통계3. 베이즈정리 기본형 유도 (2) 재료1 : 조건부확률(Conditional probability) 조건부확률은 어떤 사건이 일어난 상황에서, 다른 확률이 일어날 확률입니다. 두 사건 A와 B가 있습니다. (전사건은 S라고 합시다.) 사건 B가 일어났을 때 사건 A가 일어날 확률이 조건부확률입니다. 기호로는 아래와 같이 표현합니다. 이 확률을 유도해봅시다. 사건 B가 일어난 상황이므로, 전체사건이 사건 B로 축소됩니다. 이런 상황에서 사건 A는 사건 A와 B의 교집합입니다. 그림으로 표현하면 아래와 같습니다. 따라서 확률은 아래와 같이 계산됩니다. 이번에는 우변의 분자와 분모를 전사건의 수로 나눠봅시다. 따라서 아래와 같은 결론을 얻습니다. 사건 B가 일어났을 때, 사건 A가 일어.. 2019. 9. 18.
[베이즈통계] 2. 베이즈정리 기본형 유도 (1) 유도을 위한 재료 손으로 푸는 베이즈통계2. 베이즈정리 기본형 유도 (1) 유도을 위한 재료 이번 강의부터는 베이즈 정리를 유도할 것입니다. 베이즈정리를 유도하기 위해서는 아래와 같은 선행지식이 필요합니다. - 조건부확률(Conditional probability)- 확률의 곱셈정리(Rule of Multiplication)- 전체확률의 법칙(Law of total probability) 조건부확률과 확률의 곱셈정리는 고등학교 '확률과 통계'과목에서 배웠습니다. 3,4,5강에서 위 내용을 설명하고 6강에서 베이즈정리를 유도하겠습니다. 2019. 9. 18.
반응형