본문 바로가기
반응형

@ 필수과목/손으로 푸는 통계101

[손으로 푸는 통계 ver1.0] 101. 종강 및 이후계획 이로써 손으로 푸는 통계 강의가 완료되었습니다. 통계 기초부터 Z검정까지의 내용을 다뤘습니다. 제가 통계 공부를 시작하게 된 이유는 호기심 때문이었습니다. 회사에 와서 t검정을 갑자기 사용하게 되었고 어느 순간 t검정 사용에 익숙해져 있었습니다. 하지만 정작 t검정이 어떤 절차로 진행되는지 그 원리는 전혀 모른채 사용했습니다. 엑셀이나 SPSS에서 버튼 몇개를 클릭하거나 R이나 파이썬에서 간단한 코드를 입력하면 결과를 쉽게 출력할 수 있었습니다. 결과에서는 p값만 보면 됐습니다. 0.05보다 작으면 '유의차가 있다'고 판단했고 제 지식은 거기까지였습니다. 그러다 문득 t검정이 어떤 원리로 수행되는지 궁금했습니다. 그렇게 손으로푸는 통계라는 강의를 시작하게 되었습니다. 제가 궁금한 내용을 공부하기 위해 시.. 2022. 7. 22.
[손으로 푸는 통계 ver1.0] 100. 전체내용 요약 손으로 푸는 통계라는 강의를 한마디로 요약하면 '통계검정에 필요한 기초 이론들과 Z검정의 수학적이해' 라고 할 수 있습니다. 지금까지 다뤘던 전체 내용을 표로 정리해보았습니다. Z검정을 이해하는 과정에서 기초적이면서 중요한 내용들이 자연스럽게 등장했는데요. 1강에서는 평균, 편차, 분산 표준편차를 다뤘구요. 표본의 분산을 구하는 과정에서 자연스럽게 불편추정량이 등장합니다. 그래서 2강에서는 불편추정량이 무엇인지를 다뤘습니다. 3강부터 7강까지는 표본통계량과 모수의 관계를 다뤘습니다. 우리가 가설검정을 하려면 표본평균의 분포를 가정해야하기 때문에 표본평균의 분포를 정규분포로 가정하게 해주는 중심극한 정리를 9강 부터 14강까지 다뤘습니다. 이어서 정규분포를 15강 부터 20강에 걸쳐서 유도를 했습니다. 2.. 2022. 7. 22.
[손으로 푸는 통계 ver1.0] 99. t 분포의 등장배경 (고셋과 스튜던트) 96~98강에서 Z검정에 모분산 대신 표본분산을 사용할 수 있는지 시뮬레이션을 통해 알아보았습니다. 표본의 크기가 30 이상인 경우 아래의 Z통계량에서 모표준편차 $\sigma$대신 표본표준편차 $s$를 사용해도 된다고 알려져 있는데, 정말 그런지 확인해본 것입니다. $Z=\frac{\bar{X}- mu}{\frac{\sigma}{\sqrt{n}}}$ 모집단의 분포는 정규분포와 균등분포 두 가지로 설정하였습니다. 모분산을 사용하여 계산한 p값과 표본분산을 사용하여 계산한 p값의 차이가 10% 이하가 되게 하는 표본크기를 구했습니다. 정규분포 모집단의 경우는 638, 균등분포 모집단의 경우는 1279 이었습니다. 95% 신뢰구간에서 계산된 것이고 99%로 신뢰도를 높이면 표본크기는 더 커질 것입니다. 현실.. 2022. 7. 22.
[손으로 푸는 통계 ver1.0] 98. 표본분산을 모분산 대신 사용할 수 있는가 (3) 균등분포를 따르는 모집단에서 p값 비교 Z검정에서 표본의 크기가 충분히 크면 모표준편차 대신 표본표준편차를 사용할 수 있는지 알아보고 있습니다. 지난시간까지 정규분포를 따르는 모집단에서 모분산을 사용한 경우와 표본분산을 사용한 경우의 p값을 비교하였습니다. 표본의 크기가 수천 이상인 경우에 납득할 만한 차이가 발생했습니다. 통상적으로 사용하는 표본크기인 30개에서는 모분산 대신 표본분산을 사용하는 것이 어렵다고 결론내렸습니다. 이번 시간에는 모집단의 분포를 균등분포로 바꿔봅시다. 방법론은 지난 두 강의에서 자세히 다뤘으니 이번 시간에는 p값을 바로 비교해봅시다. 모집단이 균등분포를 따를 경우 표본분산은 아래 분포를 따릅니다. $2.5n \frac{s^2}{\sigma^2} \sim \chi ^2_{2.5n}$ 확률 95%로 표본분산이 뽑힐 범.. 2022. 7. 21.
[손으로 푸는 통계 ver1.0] 97. 표본분산을 모분산 대신 사용할 수 있는가 (2) 정규분포를 따르는 모집단에서 p값 비교 Z검정에서 모분산 대신 표본분산을 사용할 경우 p값이 얼마나 달라질 수 있는지 알아봅시다. Z검정에서 p값은 우리가 뽑은 표본으로 구한 Z값보다 극단적인 영역의 넓이로 정의됩니다. 이 넓이는 표준정규분포에서 구합니다. 우리가 뽑은 표본의 Z값은 아래와 같이 구합니다. $Z_{1}=\frac{ \bar{X}_{1}-\mu }{ \frac{\sigma}{\sqrt{n}} }$ $\bar{X}_{1}$은 우리가 뽑은 표본의 평균입니다. $\sigma$가 모분산인데요. 모분산을 표본분산으로 바꾸면 $Z_{1}$ 가 변하므로 p값도 바뀌게 됩니다. 모분산을 표본분산으로 바꿨을 때 p값이 얼마나 변하는지 확인해보려는 것입니다. 지난시간에 유도한 부등식을 가져옵시다. $\frac{ qchisq(0.05,n-1)}{n.. 2022. 7. 21.
[손으로 푸는 통계 ver1.0] 96. 표본분산을 모분산 대신 사용할 수 있는가 (1) 정규분포를 따르는 모집단에서 모분산과 표본분산 비교 모집단의 평균이 얼마라고 알려져 있는 상황에서 표본을 뽑아서 알려진 모집단의 평균이 맞는지 확인하는 검정을 일표본 Z검정이라고 합니다. 이러한 일표본 Z검정 과정에서 모분산이 사용되는데요. 대부분의 경우 모분산은 알려져 있지 않습니다. 모분산을 모르면 Z검정을 할 수 없기 때문에 표본분산을 모분산 대신 사용합니다. 표본의 크기가 충분히 크면 모분산과 표본분산의 차이가 크지 않을 것이라는 생각 때문입니다. 과연 그래도 되는 것인지를 오늘 확인하려고 합니다. 모집단은 두가지로 설정하였습니다. 정규분포를 따르는 모집단과 균등분포를 따르는 모집단입니다. 이번 글에서는 정규분포를 따르는 모집단의 경우를 알아봅시다. 표본크기 n이 100이라고 가정해봅시다. 정규분포를 따르는 모집단이라고 가정했기 때문에 표본분산은 .. 2022. 7. 21.
[손으로 푸는 통계 ver1.0] 95. 표본분산의 분포 요약 36강 부터 94강까지 표본분산의 분포에 대한 내용을 다뤘습니다. 표본분산의 분포를 유도한 이유는 Z검정 때문이었습니다. Z검정은 표본평균의 분포를 이용해서 하는 검정입니다. n이 충분히 클 때 표본 평균의 분포가 아래와 같은 분포를 따르게 됩니다. $\bar{X} \sim N\left ( \mu,\frac{\sigma^2}{n} \right )$ 그런데 모집단의 분산인 $\sigma^2$ 은 알 수 없으므로 모집단의 분산 대신 표본분산을 사용했습니다. 그래도 되는 것인지 확인하고 싶었습니다. 표본분산의 분포를 알아야 정량적인 확인이 가능해서 표본분산의 분포를 유도한 것입니다. 표본분산의 분포를 유도할 때 모집단이 정규분포를 따른다는 가정이 필요했습니다. 크기가 n인 표본분산의 분포는 아래와 같이 유도되.. 2022. 7. 20.
[손으로 푸는 통계 ver1.0] 94. 표본분산의 분포에서 모집단 정규분포 조건제거 증명 (3) 유도한 식 검증 지난 글에서 아래 식을 유도했습니다. 1번 식이라고 하겠습니다. $DF\frac{s^2}{\sigma^2} \sim \chi ^2_{DF} \ \left ( DF=\frac{2n}{\kappa-1} \right )$ (1) 모집단의 정규성을 가정하고 유도했던 표본분산의 분포 식과 비슷하지만 어딘가 다른 식입니다. 모집단의 정규성을 가정하고 유도한 표본분산의 분포 식은 아래와 같습니다. 2번 식이라고 합시다. $\frac{n-1}{\sigma^2}s^2 \sim \chi ^2_{n-1}$ (2) 2번 식은 두가지 조건을 가정하고 유도했습니다. 1. 표본평균의 분포가 정규분포를 따를 만큼 표본의 크기가 크다. 2. 모집단이 정규분포를 따른다. 사실 두번째 조건이 만족되면 첫번째 조건을 필요 없습니다. 모집단.. 2022. 7. 18.
[손으로 푸는 통계 ver1.0] 93. 표본분산의 분포에서 모집단 정규분포 조건제거 증명 (2) 정규분포를 카이제곱분포로 근사 모집단에서 표본을 뽑을 때 표본의 크기 n이 충분히 크다면, 모집단의 분포와 상관 없이 표본분산의 분포는 카이제곱분포를 따른다는 것을 증명하고 있습니다. 아래와 같이 두 단계로 나눠서 증명하고 있습니다. Step 1. $\frac{s^{2}}{\sigma^2}$ 의 분포 유도 Step 2. 정규분포를 카이제곱분포로 근사 지난시간에 Step1 내용을 유도했고 결과는 아래와 같습니다. $\frac{s^{2}}{\sigma^2} \sim N\left ( 1,\frac{\kappa-1}{n} \right )$ 오늘은 정규분포를 카이제곱분포로 근사시킨 뒤, 위 식을 변형할 것입니다. 자유도가 k인 카이제곱분포를 따르는 확률변수는 아래와 같이 놓을 수 있습니다. $\chi ^{2}_{k}=\sum_{i=1}^{k}.. 2022. 7. 17.
[손으로 푸는 통계 ver1.0] 92. 표본분산의 분포에서 모집단 정규분포 조건제거 증명 (1) $\frac{s^{2}}{\sigma^2}$ 의 분포 유도 표본분산의 분포가 카이제곱분포를 따르려면 모집단이 정규분포를 따른다는 조건이 필요했습니다. 87강에서 논문을 소개하며 n이 충분히 크면 모집단이 정규분포를 따르지 않아도 표본분산이 카이제곱분포를 따른다는 것을 보여드렸는데요. 증명은 하지 않고 넘어갔습니다. 증명이 너무 길어서 넘어갔다고 말씀드렸었는데, 논문을 다시 보니 생각보다 길지는 않았습니다. 또한 시뮬레이션을 통해 위 성질이 성립하는지 시험에보았지만 성립하지 않았습니다. 위 조건을 직접 증명하며 이유를 알아봅시다. 논문의 증명을 더 쉽게 이해할 수 있도록 약간 수정하였습니다. 증명은 두 단계로 나뉩니다. Step 1. $\frac{s^{2}}{\sigma^2}$ 의 분포 유도 Step 2. 정규분포를 카이제곱분포로 근사 이번 글에서는 Step1 을.. 2022. 7. 16.
[손으로 푸는 통계 ver1.0] 91. 표본분산의 분포 시뮬레이션 (4) p값 비교 표본분산의 분포와 카이제곱분포를 비교하고 있습니다. $\frac{n-1}{\sigma^{2}}s^{2} \sim \chi^{2}_{n-1}$ 지난시간에는 누적분포함수를 비교했습니다. 모집단이 균등분포를 따르는 경우 표본을 아무리 크게 해도 표본분산의 분포와 카이제곱분포가 일치하지 않았습니다. 이번 글에서는 p값을 비교해봅시다. 정량적인 비교입니다. 비교 방법을 설명하겠습니다. 카이제곱분포의 좌측꼬리 p값이 0.05가 나오는 확률변수 값을 히스토그램에 적용하여 p값을 구합니다. 0.05와 구해진 p값을 비교하면 됩니다. 우측꼬리에서도 같은 방법으로 p값을 구합니다. 모집단의 종류, 표본의 크기를 바꿔가며 구했습니다. 히스토그램은 표본 10000개를 뽑아서 그렸습니다. 히스토그램을 그리고 해당 히스토그램에서.. 2022. 6. 13.
[손으로 푸는 통계 ver1.0] 90. 표본분산의 분포 시뮬레이션 (3) 누적분포함수 비교 지난 글에서 표본분산의 분포를 히스토그램으로 그려보았습니다. 모집단을 설정하고 실제 표본을 뽑아서 그린 히스토그램과 표본크기에서 1을 뺀 자유도를 갖는 카이제곱분포 함수를 그렸다. 모집단이 균등분포를 따르는 경우 표본분산의 분포와 카이제곱분포는 잘 일치하지 않았습니다. 위에 그린 함수는 확률밀도함수인데요. 표본분산의 분포를 그릴 때 히스토그램 형태로 그려야 하기 때문에 구간 간격에 따라 모양이 조금씩 달라집니다. 누적분포함수로 그릴 경우 이러한 문제가 없어지기 때문에 누적분포함수로도 그려보려고 합니다. 실험 방법은 앞의 글과 동일합니다. 모집단은 네 가지 종류로 설정했습니다. 모집단1 : 1~10 의 자연수. 1:10으로 표기 모집단2 : 1~1000 의 자연수. 1:1000으로 표기 모집단3 : 표준정.. 2022. 6. 8.
[손으로 푸는 통계 ver1.0] 89. 표본분산의 분포 시뮬레이션 (2) 뭔가 이상하다 아래는 지난시간에 그렸던 그래프입니다. 1~10의 자연수를 갖는 모집단에서 크기가 30인 표본을 뽑고, 표본분산의 분포를 그래프로 그린 것입니다. 더 정확히 말하면 아래 확률변수의 분포입니다. $\frac{n-1}{\sigma^{2}}s^{2}$ 오른쪽 그림은 29자유도의 카이제곱분포입니다. n이 커지면 표본분산의 그래프는 n-1 자유도 카이제곱분포를 따른다고 알려져 있습니다. 나란히 그려진 상태에서 보니 비슷해 보였는데요. 그래프를 겹쳐서 그려보니 이야기가 달라졌습니다. 많이 다릅니다. 겹쳐 그린 그래프로 다시 시뮬레이션을 해보려고 합니다. 모집단을 더 다양화했고 절차도 가다듬었습니다. 1. 배경 우리가 표본분산의 분포를 유도할 때 설정했던 두 가지 조건은 아래와 같습니다. 1) 표본평균의 분포가 정규.. 2022. 6. 6.
[손으로 푸는 통계 ver1.0] 88. 표본분산의 분포 시뮬레이션 (1) 확률밀도함수 비교 우리가 표본분산의 분포를 유도할 때 설정했던 두가지 조건입니다. 1) 표본평균의 분포가 정규분포를 따를 만큼 표본의 크기 n이 크다. 2) 모집단의 분포는 정규분포를 따른다. 1번은 표본의 크기를 충분히 크게 하면 되는거구요. 두번째 조건도 표본의 크기가 충분히 크면 무시할 수 있다는 것을 지난시간에 다뤘습니다. 증명하진 않고 증명이 되어 있는 논문만 보여드렸습니다. 오늘은 통계 프로그램인 R을 이용해서 정말 표본의 크기가 충분히 크면 모집단이 정규분포를 따르지 않아도 표본분산이 카이제곱분포를 따르는지 확인해보려고 합니다. 모집단은 1부터 10까지의 자연수로 설정했습니다. 전혀 정규분포가 아닙니다. 모집단 = {1,2,3,4,5,6,7,8,9,10} 크기가 2인 표본 크기가 2인 표본을 10000개 뽑아.. 2022. 5. 12.
[손으로 푸는 통계 ver1.0] 87. 표본분산의 분포에서 모집단이 정규분포를 따라야 한다는 조건 제거하기 우리는 지금까지 표본분산의 분포를 유도했는데요. $\frac{n-1}{\sigma^{2}}s^{2} \sim \chi^{2}_{n-1}$ 한가지 잊고 있었던 사실이 있습니다. 우리가 표본분산의 분포를 유도할 때 두가지 조건을 설정했었다는 것입니다. (36강) 1) 표본평균의 분포가 정규분포를 따를 만큼 표본의 크기 n이 크다. 2) 모집단의 분포는 정규분포를 따른다. 첫번째 조건을 만족시키는 것은 어렵지 않습니다. 문제는 두번째 조건입니다. 표본분산에 어떤 상수를 곱한 분포가 카이제곱분포를 따른다는 명제를 유도하려면 모집단이 정규분포를 따른다는 조건이 필요합니다. '표본분산에 어떤 상수를 곱한 분포가 카이제곱분포를 따른다'는 조건은 t분포를 유도할 때도 사용됩니다. t분포를 사용할 때도 모집단이 정규분포.. 2022. 3. 28.
[손으로 푸는 통계 ver1.0] 86. R로 카이제곱분포 그래프 그려보기 지난시간까지 미분을 이용하여 카이제곱분포의 그래프 형태를 예측해보았습니다. 우리가 예측한 1,2,3 자유도 카이제곱분포 그래프는 아래와 같습니다. 4자유도 카이제곱분포 그래프는 아래와 같습니다. 5자유도 이상인 카이제곱분포 그래프는 아래와 같습니다. 2자유도의 c를 구해봅시다. $f(x)=\frac{1}{2^{\frac{n}{2}} \Gamma \left ( \frac{n}{2} \right ) } e^{-\frac{x}{2}} x^{\frac{n}{2}-1}$ 위 식 계수에 2를 넣으면 되구요. 감마 1은 1이니까. 0.5가 나옵니다. R을 이용하여 우리가 예측한 그래프 형태가 맞는지 알아봅시다. R의 dchisq 라는 함수를 이용하면 카이제곱분포의 함수 값을 알 수 있습니다. 코드는 아래와 같습니다... 2022. 3. 25.
[손으로 푸는 통계 ver1.0] 85. 카이제곱분포 형태 예측 (자유도 4자유도 이상 ) 지난시간에 1,2,3 자유도 카이제곱분포의 개형을 예측했습니다. 우리가 예측한 형태는 아래와 같습니다. 왼쪽부터 1,2,3 자유도 입니다. 오늘은 4자유도 이상의 카이제곱분포의 개형을 예측해봅시다. n자유도 카이제곱분포의 분포함수 $f(x)$와 도함수 $f'(x)$는 아래와 같습니다. $f(x)=c \cdot e^{-\frac{x}{2}}\cdot x^{\frac{n}{2}-1}$ $f'(x)=-\frac{1}{2} c \cdot e^{-\frac{x}{2}}\cdot x^{\frac{n}{2}-2}\left(x-(n-2) \right)$ n=4 n이 4인 경우의 $f(x)$와 $f'(x)$ 는 아래와 같습니다. $f(x)=c\cdot \frac{x}{e^{\frac{x}{2}}}$ $f'(x)=-\fr.. 2022. 3. 23.
[손으로 푸는 통계 ver1.0] 84. 카이제곱분포 형태 예측 (자유도 1~3) 우리는 아래 수식을 유도했습니다. $\frac{n-1}{\sigma^{2}}s^{2} \sim \chi^{2}_{n-1}$ 카이제곱분포의 평균과 분산도 유도한 상태입니다. 이제 카이제곱분포의 분포함수를 그리고 넓이를 구해보면서 모분산 대신 표본분산을 사용하는 것이 가능한지 알아봐야 하는데요. 카이제곱분포를 손으로 정확히 것은 거의 불가능합니다. R이나 파이썬등의 소프트웨어를 이용해서 그려야 하는데요. 미분을 이용하면 어느정도의 형태는 예상해볼 수 있습니다. 오늘은 미분을 이용해서 카이제곱분포의 대략적인 형태를 알아봅시다. n자유도 카이제곱분포 함수는 아래와 같습니다. $f(x)=\frac{1}{2^{\frac{n}{2}}\Gamma\left( \frac{n}{2} \right)} \cdot e^{-\fr.. 2022. 3. 11.
[손으로 푸는 통계 ver1.0] 83. 카이제곱분포의 분산 유도 n자유도 카이제곱분포를 따르는 확률변수의 분산을 유도해봅시다. n자유도 카이제곱분포 함수는 아래와 같습니다. $f(x)=\frac{1}{2^{\frac{n}{2}} \Gamma \left ( \frac{n}{2} \right ) } e^{-\frac{x}{2}} x^{\frac{n}{2}-1}$ 분산은 아래 수식을 이용해서 구하겠습니다. $V[X]=E[X^{2}]-E[X]^{2}$ E[X] 는 n이라는 것을 지난시간에 유도했습니다. 우변의 첫항만 계산하면 됩니다. 우변의 첫항은 아래와 같이 계산됩니다. $E[X^{2}]=\int_{0}^{\infty}x^{2}f(x)dx=\int_{0}^{\infty}x^{2}\frac{1}{2^{\frac{n}{2}} \Gamma \left ( \frac{n}{2} \.. 2022. 3. 7.
[손으로 푸는 통계 ver1.0] 82. 카이제곱분포의 평균 쉬운 유도 지난 시간에 n자유도 카이제곱분포를 따르는 확률변수 X의 평균이 n 이라는 것을 유도했습니다. 오늘은 카이제곱분포의 평균을 더 쉽게 유도해봅시다. 아래 식에서 출발합니다. $\frac{n-1}{\sigma^{2}}s^{2} \sim \chi^{2}_{n-1}$ 좌변은 n-1 자유도인 카이제곱분포를 따르는 확률변수입니다. 기댓값을 구해봅시다. $E\left [ \frac{n-1}{\sigma^{2}}s^{2} \right ]$ 괄호와 무관한 문자들은 밖으로 꺼냅시다. $\frac{n-1}{\sigma^{2}}E\left [ s^{2} \right ]$ 표본분산의 평균은 모분산입니다. 4강에서 유도했습니다. $\frac{n-1}{\sigma^{2}}\sigma^{2}$ 약분하면 n-1만 남습니다. n-1자유.. 2022. 3. 7.
[손으로 푸는 통계 ver1.0] 81. 카이제곱분포의 평균 유도 우리는 아래 수식을 유도했습니다. $\frac{n-1}{\sigma^{2}}s^{2} \sim \chi^{2}_{n-1}$ 표본분산에 상수가 곱해진 확률변수가 n-1 자유도인 카이제곱분포를 따른다는 의미입니다. n-1 자유도의 카이제곱분포 함수는 아래와 같습니다. $f(x)=\frac{1}{2^{\frac{n-1}{2}} \Gamma \left ( \frac{n-1}{2} \right ) } e^{-\frac{x}{2}} x^{\frac{n-1}{2}-1}$ 오늘은 카이제곱분포의 평균을 유도해보겠습니다. 유도해놓으면 분명 뒤에서 써먹을 일이 있을것 같아요. 수식을 편하게 다루기 위해 n자유도의 카이제곱분포에서 평균을 유도하겠습니다. $f(x)=\frac{1}{2^{\frac{n}{2}} \Gamma \l.. 2022. 3. 5.
[손으로 푸는 통계 ver1.0] 80. aX가 카이제곱분포를 따를 때, X도 그럴까 정규 분포에서는 아래 성질이 성립했습니다. 변수 aX가 평균이 $\mu$이고, 분산이 $\sigma^{2}$인 정규분포를 따를 경우, 확률변수 X는 평균이 $\frac{\mu}{a}$이고, 표준편차가 $\left| \frac{\sigma}{a} \right| $인 정규분포를 따릅니다. 카이제곱분포에서는 어떨까요? 변수 aX가 자유도가 n-1인 카이제곱분포를 따른다고 합시다. 기호로는 아래와 같이 나타냅니다. $aX \sim \chi^{2}_{n-1}$ aX의 확률밀도함수를 f(ax), 누적분포함수를 F(ax)라고 놓겠습니다. F(ax) 는 아래와 같이 정의됩니다. $P\left[ aX \leq ax \right]$ 우리가 궁금한 것은 X의 분포입니다. X의 확률밀도함수를 g(x), 누적분포함수를 G(x).. 2021. 12. 17.
[손으로 푸는 통계 ver1.0] 79. aX가 정규분포를 다를 때, X도 정규분포를 따를까 변수 aX가 평균이 $\mu$이고, 분산이 $\sigma^{2}$인 정규분포를 따른다고 합시다. 기호로는 아래와 같이 나타냅니다. $aX \sim N \left( \mu,\sigma^{2} \right)$ aX의 확률밀도함수를 f(ax), 누적분포함수를 F(ax)라고 놓겠습니다. F(ax) 는 아래와 같이 정의됩니다. P[aX 2021. 11. 22.
[손으로 푸는 통계 ver1.0] 78. 표본분산이 정말 카이제곱분포 따르는거 맞아? 우리는 아래와 같이 좌변이 n-1 자유도 카이제곱분포를 따른다는 것을 유도했습니다. $\frac{n-1}{\sigma^{2}}s^{2} \sim \chi^{2}_{n-1}$ 그러고는 "표본분산이 카이제곱분포를 따른다"고 이야기했습니다. 어딘가 이상합니다. 좌변은 표본분산이 아니라 표본분산에 무언가 곱해진 변수입니다. 마치 3X가 정규분포를 따르는 것을 보고, X가 정규분포를 따른다고 하는 것과 같습니다. 일반화하면 아래 문제가 됩니다. "aX가 정규분포를 다를 때, X도 정규분포를 따를까?" 위 문제를 해결하고 나서 아래 문제를 해결하면 우리 의문은 해결됩니다. "aX가 카이제곱분포를 다를 때, X도 카이제곱분포를 따를까" 이어지는 강의에서 해결해봅시다. 2021. 9. 29.
[손으로 푸는 통계 ver1.0] 77. 표본분산의 분포를 왜 유도했나? 우리는 표본분산의 분포를 유도했습니다. n-1 카이제곱분포입니다. $\frac{n-1}{\sigma^{2}}s^{2} \sim \chi^{2}_{n-1}$ 표본분산의 분포를 유도하기 시작한게 35강입니다. 71강에 완료했으니 37강에 걸쳐 유도한 것입니다. 너무 오랜시간 유도하다 보니 유도 자체가 목적이 되어서 왜 유도한 것인지 잊어버리셨을 것 같습니다. 오늘은 유도한 이유를 다시 설명하며 강의의 방향성을 재정립하려고 합니다. z검정을 배우고 있었습니다. z검정은 표본평균의 분포가 평균을 모평균으로 하고 분산이 모분산/표본크기인 정규분포를 따른다는 성질을 기반으로 합니다. $\bar{X} \sim N\left ( \mu, \frac{\sigma^{2}}{n} \right )$ 문제는 모분산을 모른다는데 .. 2021. 9. 22.
[손으로 푸는 통계 ver1.0] 76. 표본분산의 분포 유도과정 요약 우리는 지난시간까지 표본분산의 분포를 유도했습니다. 크기가 n인 표본분산의 분포는 n-1 자유도 카이제곱분포입니다. $\frac{n-1}{\sigma^{2}}s^{2} \sim \chi^{2}_{n-1}$ 오늘은 유도과정을 간단히 요약해봅시다. 표본분산의 정의에서 출발합니다. $s^{2}=\frac{\sum_{i=1}^{n}\left ( X_{i}-\bar{X} \right )^{2}}{n-1}$ 아래와 같이 변형했습니다. $\frac{n-1}{\sigma^{2}}s^{2}= \left (\frac{X_{1}-\mu}{\sigma} \right )^{2}+ \cdots + \left (\frac{X_{n}-\mu}{\sigma} \right )^{2}- \left (\frac{\bar{X}-\mu}{\f.. 2021. 9. 22.
[손으로 푸는 통계 ver1.0] 75. 표본분산의 분포 유도 (40) 표본분산의 분포 유도 완성 및 오류 수정 우리는 n자유도 카이제곱분포와 적률생성함수를 유도한 상태입니다. $f_{n}(x)=\frac{1}{2^{\frac{n}{2}} \Gamma \left ( \frac{n}{2} \right ) } e^{-\frac{x}{2}} x^{\frac{n}{2}-1}$ $M_{X}(t)= \left ( 1-2t \right )^{-\frac{n}{2}} \quad \left ( t 2021. 9. 22.
[손으로 푸는 통계 ver1.0] 74. 표본분산의 분포 유도 (39) 카이제곱분포의 적률생성함수 카이제곱분포를 유도한 김에 적률생성함수도 구해봅시다. 이어지는 강의에서 사용될 예정입니다. 카이제곱분포는 아래와 같습니다. $f_{n}(x)=\frac{1}{2^{\frac{n}{2}} \Gamma \left ( \frac{n}{2} \right ) } e^{-\frac{x}{2}} x^{\frac{n}{2}-1}$ 적률생성함수의 정의는 아래와 같습니다. $M_{X}(t)=\int_{-\infty}^{\infty}e^{tx}f(x)dx$ 카이제곱분포에 적용하면 아래와 같습니다. 카이제곱분포의 확률변수는 정규분포를 따르는 확률변수의 제곱이므로 항상 양수입니다. 따라서 적분구간은 0부터 시작합니다. $M_{X}(t)=\int_{0}^{\infty}e^{tx}\frac{1}{2^{\frac{n}{2}} \Ga.. 2021. 9. 22.
[손으로 푸는 통계 ver1.0] 73. 표본분산의 분포 유도 (38) 카이제곱분포 유도과정 요약 [통계 기초] 73. 표본분산의 분포 유도 (38) 카이제곱분포 유도과정 요약 표본분산의 분포를 유도하기 위해 카이제곱분포를 지난시간까지 유도했습니다. 표본분산의 분포가 카이제곱분포를 따르기 때문입니다. 카이제곱분포를 아주 여러 강의에 걸쳐 유도했기 때문에 유도 과정을 요약할 필요가 있을 것 같습니다. 오늘은 카이제곱분포 유도 과정을 요약해보갰습니다. 먼저 누적분포함수의 정의를 이용하여 1자유도 카이제곱분포를 유도했습니다. (38강) $f_{1}(x_{1})=\frac{1}{\sqrt{2\pi}}e^{-\frac{x_{1}}{2}}x_{1}^{-\frac{1}{2}}$ 컨볼루션 적분을 이용하여 2~5자유도 카이제곱분포를 유도했지만 규칙을 찾을수는 없었습니다. 컨볼루션적분을 이용한 점화식은 찾아냈습니다. .. 2021. 9. 22.
[손으로 푸는 통계 ver1.0] 72. 표본분산의 분포 유도 (37) 카이제곱분포 완성 우리는 표본분산의 분포를 유도하고 있었습니다. 표본분산의 분포를 유도하는 과정에서 카이제곱분포가 등장했고, 카이제곱분포를 유도하는 과정에서 감마함수가 등장했습니다. 감마함수를 유도하느라 너무 많은 시간이 흘러서 뭘 하고 있었는지 가물가물하네요. 카이제곱분포부터 완성시켜봅시다. 우리가 46강에서 유도했던 카이제곱분포의 형태는 아래와 같습니다. $f_{n}(x)=\frac{1}{2^{\frac{n}{2}}\left ( \frac{n}{2}-1 \right )!} e^{-\frac{x}{2}}x^{\frac{n}{2}-1}$ $f_{n}(x)=\frac{1}{2^{\frac{n}{2}} \left \{ \left ( \frac{n}{2}-1 \right ) \left ( \frac{n}{2}-2 \right .. 2021. 9. 22.
반응형