본문 바로가기
반응형

전체 글628

[손으로 푸는 통계] 13. 중심극한정리 증명 (#2. 정규분포의 적률생성함수) 중심극한정리 증명 (#2. 정규분포의 적률생성함수) 지난시간에 두 확률변수의 확률분포가 같을 조건을 배웠습니다. 두 확률변수의 적률생성함수가 같다면 두 확률변수의 확률분포가 같았습니다. 두 확률분포의 적률생성함수가 같음 → 두 확률변수의 확률분포가 같음. 이 원리를 이용하여 중심극한정리를 증명할 수 있습니다. 표본의 크기가 무한히 커질 때 표본평균의 적률생성함수를 구하고, 이를 정규분포의 적률생성함수와 비교합니다. 두 적률생성함수가 같다는 것을 보이면, 표본평균의 분포가 정규분포라는 것을 보일 수 있습니다. 이번글에서는 정규분포의 적률생성함수를 유도해보겠습니다. 다음 글에서 표본평균의 적률생성함수를 유도하고 둘을 비교할 것입니다. 정규분포의 적률생성함수 유도 정규분포를 따르는 확률변수 X가 있다고 합시다.. 2018. 3. 24.
[손으로 푸는 통계] 12. 중심극한정리 증명 (#1. 확률분포가 같을 조건) 중심극한정리 증명 (#1. 확률분포가 같을 조건) 지난시간까지 중심극한정리 유도에 사용되는 두가지 재료를 공부해봤습니다. 두 가지 재료는 아래와 같습니다. - 테일러 급수 - 적률생성함수 중심극한정리는 표본의 크기가 커짐에 따라 '표본 평균'들의 분포가 정규분포에 가까워져 간다는 정리입니다. 표본의 크기가 충분히 클 경우 표본평균의 분포를 정규분포로 가정하는데 사용되는 정리입니다. t검정을 비롯하여 모수적 통계방법들의 기반이 되는 정리입니다. 중심극한정리를 유도하는 절차는 아래와 같습니다. #1. 두 확률변수의 적률생성함수가 같다면, 두 확률변수의 분포가 동일함을 보임 #2. 정규분포를 따르는 확률변수의 적률생성함수를 유도함 #3. 표본평균의 적률생성함수를 유도함, 정규분포를 따르는 확률변수의 적률생서함.. 2018. 3. 24.
[손으로 푸는 통계] 11. 적률생성함수 (중심극한정리를 위한 재료 #2) 우리는 중심극한정리를 증명하기 위해 필요한 사전지식들을 공부하고 있습니다. 지난시간에는 테일러급수가 무엇인지 배웠구요. 이번시간에는 적률생성함수가 무엇인지 배워보겠습니다. 적률생성함수는 말 그대로 '적률'을 생성하는 함수입니다. 적률이 무엇인지 부터 알아야 합니다. 적률(Moment) 수학에서 적률은 아래와 같이 정의됩니다. n차적률이라고 부릅니다. $\mu_{n}=\int_{-\infty }^{\infty }\left ( x-c \right )^nf(x)dx$ 수학에서 정의된 적률이라는 개념을 통계학에 적용해 봅시다. 먼저 상수 c에 0을 넣습니다. $\mu_{n}=\int_{-\infty }^{\infty } x^{n} f(x)dx$ 이제 x를 확률변수, f(x)를 확률밀도함수로 해석하면 됩니다. $.. 2018. 3. 24.
[손으로 푸는 통계] 10. 테일러 급수 유도하기 (중심극한정리 재료 #1) 중심극한정리를 증명하는 과정에서 테일러급수가 사용됩니다. 오늘은 테일러급수를 유도해보도록 하겠습니다. 테일러급수 설명 테일러급수는 브룩 테일러(Brook Taylor)가 1715년에 처음 소개했습니다. 테일러급수는 무한급수입니다. 어떤 함수를 다항함수로 만들어진 무한급수로 바꿔줍니다. 어떤 함수 $f(x)$에 테일러급수를 적용하면 아래와 같습니다. $f(x)=f(a)+\frac{f'(a)}{1!}(x-a)+\frac{f''(a)}{2!}(x-a)^{2}+\frac{f'''(a)}{3!}(x-a)^{3}+...$ 임의의 점 a에서의 미분값을 이용해서 함수 값을 계산할 수 있게 해줍니다. a근처에서의 함수값을 구할 경우 고차항(H.O.T)들의 크기가 아주 작아지기 때문에, 고차항들을 날려버리고 함수의 근사값.. 2018. 3. 24.
[손으로 푸는 통계] 9. 중심극한정리 설명 중심극한정리란 무엇인가 이번 강의에서는 중심극한정리가 무엇인지 설명드리도록 하겠습니다. 수학적인 증명은 이후에 할거구요. 오늘은 개념만 설명드리는 것입니다. 모집단에서 크기가 n인 표본을 뽑았습니다. 이런 표본을 무수히 많이 뽑으면 표본평균들의 평균은 모평균과 같아지고, 표본평균들의 분산은 모분산/n과 같아집니다. 여기까지는 앞에서 증명한 내용입니다. $E(\bar{X})=\mu$ $V(\bar{X})=\frac{\sigma^2}{n}$ 우리는 표본을 무수히 많이 뽑았기 때문에 표본평균들을 가지고 확률분포 그래프를 그릴 수가 있습니다. 이때 표본의 크기 n을 키우면, 표본평균들의 분포가 정규분포에 가까워져 갑니다. 표본 평균의 분포 → 표본의 크기 n 증가 → 정규분포 이러한 사실이 '중심극한 정리' 입.. 2018. 3. 24.
[손으로 푸는 통계] 8. 1~7강 요약(세로영상) 1~7강까지 내용을 요약해봅시다. 먼저 1강에서는 대표적인 통계량인 평균, 분산, 표준편차에 대해 배웠습니다. 2강에서는 표본분산을 계산할 때 왜 n-1로 나누는 것인지를 배웠는데요. 이는 표본분산을 불편추정량으로 만들기 위함이었습니다. 불편추정량이 무엇을 의미하는지, 자유도는 무엇인지 공부했습니다. 3강에서는 표본평균의 평균이 모평균과 같다는 것을 유도했습니다. 표본평균의 평균이 모평균과 같기 때문에 표본평균은 불편추정량입니다. 4강에서는 표본분산의 평균이 모분산과 같다는 것을 유도했습니다. 따라서 표본분산도 불편추정량입니다. 5강에서는 표본평균의 분산이 모분산을 n으로 나눈 것과 같음을 유도했습니다. 이 내용은 고등학교에서도 배운 내용이지만, 유도하지는 않았었습니다. 6강에서는 두 변수가 독립인 경우.. 2018. 3. 24.
[손으로 푸는 통계] 7. 크기가 1인 표본평균의 평균과 분산이 모집단과 같은 이유 증명 3강에서 표본평균의 평균을 계산했던 수식을 가져와봅시다. $E(\bar{X})=E\left ( \frac{\sum_{i=1}^{n}x_{i}}{n}\right )$ $\frac{1}{n}$ 은 상수이므로 밖으로 꺼냅시다. $E(\bar{X})=\frac{1}{n} E\left ( \sum_{i=1}^{n}x_{i} \right )$ 우변의 괄호 안 수식을 풀어서 쓰면 아래와 같습니다. $E(\bar{X})=\frac{1}{n} E\left ( x_{1}+x_{2}+...+x_{n} \right )$ 여기서 우변의 각 항들이 표본들의 n번째 원소를 나타내는 변수입니다. 각 항을 크기가 1인 표본으로 생각할 수 있습니다. 크기가 1인 표본에서는 표본과 표본평균이 같기 때문에, 크기가 1인 표본평균이라는 변수.. 2018. 3. 24.
[손으로 푸는 통계] 6. E(XY)=E(X)E(Y) 의 성립조건과 증명 5강(표본평균의 분산이 모분산/n 인 이유)에서 수식을 유도할 때, 아래 등식을 사용했습니다. $E(XY)=E(X)E(Y)$ 두 변수 X,Y가 독립일 경우 등식이 성립합니다. 두 변수가 독립이라는 것은 한 변수의 발생 여부가 다른 변수에 영향을 주지 않는 것을 의미합니다. 오늘은 두 변수가 독립인 경우 왜 위 등식이 성립하는지 증명해보도록 하겠습니다. 먼저 간단한 예시로 성립한다는 것을 보여드리고, 일반화하도록 하겠습니다. 예시 서로 독립인 변수 X,Y가 있다고 합시다. X와 Y의 원소는 아래와 같습니다. $X=\left [ 1,2,3 \right ]$ $Y=\left [ 5,6 \right ]$ 이때 XY가 가질 수 있는 원소는 아래의 6가지입니다. $XY=\left [ 1\times5,2\times .. 2018. 3. 23.
[손으로 푸는 통계] 5. 표본평균의 분산이 모분산/n 인 이유(고등학생들 꼭 보세요) 우리는 지난 두개의 글에서 표본평균의 평균이 모평균과 같다는 것과, 표본분산의 평균이 모분산과 같다는 것을 보였습니다. $E(\bar{X})=\mu$ $E(S^{2})=\sigma^{2}$ 표본분산의 평균이 모분산과 같다는 것을 보일 때, 아래 성질을 사용했습니다. $V(\bar{X})=\frac{\sigma^2}{n}$ 이 성질은 고등학교에서 확률과 통계 시간에도 배우는 내용입니다. 증명은 하지 않았던 것으로 기억합니다. 주사위 던지기나, 동전 던지기 등의 간단한 예시로 위 등식이 성립하는 한가지 사례를 보였을겁니다. 오늘은 위 등식이 성립한다는 것을 증명해봅시다. 증명 방법1 표본평균의 분산은 아래와 같이 계산됩니다. 분산이 편차의 제곱의 평균이기 때문입니다. $V(\bar{X})=E\left [ \.. 2018. 3. 23.
[손으로 푸는 통계] 4. 표본분산의 기댓값이 모분산과 같은 이유 지난 글에서 표본평균의 기댓값은 모평균과 같다는 것을 보였습니다. 오늘은 표본분산의 평균이 모분산과 같다는 것을 증명해봅시다. 표본에서 구한 어떤 통계량의 기댓값이 모수와 같을 때 이 통계량을 불편추정량이라고 합시다. 표본평균은 불편추정량이구요. 표본분산은 n으로 나눠서 계산하면 모분산과 달라고, 모분산과 같게 해주려고 n-1 로 나눠서 계산합니다. 이 내용은 2강에서 설명했습니다. 표본분산의 평균이란? 모집단이 하나 있다고 가정합시다. 모집단의 평균을 $\mu$, 분산을 $\sigma^2$이라고 놓겠습니다. 이 모집단에서 크기가 n인 표본을 뽑아서 분산을 구했습니다. 표본을 또 뽑고 분산을 구합니다. 표본을 또 뽑고 분산을 구합니다. 이렇게 무수히 많은 표본을 뽑아 분산을 구합니다. 이제 우리에게는 무.. 2018. 3. 23.
[손으로 푸는 통계] 3. 표본평균의 평균이 모평균과 같은 이유 고등학교 '확률과 통계'시간에 표본평균의 평균을 모평균과 같다는 것을 배웠는데 증명을 하지는 않습니다. '알려져있다' 라고만 배우는데요. 고등학교 수준의 수학으로 증명 가능합니다. 한번 증명해봅시다 표본평균의 평균이란? 모집단에서 표본을 뽑고 평균을 구합니다. 표본을 또 뽑고 평균을 구합니다. 표본을 또 뽑고 평균을 구합니다. 이걸 무한히 반복합니다. 무한히 많은 표본평균이 생깁니다. 얘내들을 가지고 다시 평균을 구합니다. 짧지만 여러운 증명 모집단이 하나 있습니다. 이 모집단의 평균은 $\mu$ 이고 분산은 $\sigma ^{2}$ 라고 놓겠습니다. 이 모집단에서 크기가 n인 표본을 뽑아봅시다. 첫번째 표본은 표본1, 두번째 표본은 표본2 이렇게 무수히 많은 표본을 뽑을 수 있습니다. 복원추출을 가정합.. 2018. 3. 23.
[손으로 푸는 통계] 2. 자유도와 불편추정량 (왜 n-1로 나누나요?) 불편추정량 지난시간에 배운 분산 수식은 아래와 같습니다. $\begin{align}V(X)&=E\left [ \left ( X-\mu \right )^2 \right ]\\&=\frac{\sum_{i=1}^{n}\left ( x_{i}-\mu \right )^{2}}{n} \end{align}$ 분산은 변량의 제곱의 합을 집단의 크기로 나눠서 구합니다. 하지만 표본의 경우는 그렇지 않습니다. 표본은 집단의 크기가 아니라 (집단의 크기-1)로 나눠서 구합니다. 이유는 뒤에서 설명하겠습니다. 모집단에서 표본을 뽑았고 $X_{1}$이라고 부릅시다. 표본의 크기는 n이고 원소는 아래와 같습니다. $X_{1}=\left \{ x_{1}^{1},x_{1}^{2},...,x_{1}^{n} \right \}$ 이 표본.. 2018. 3. 23.
[손으로 푸는 통계] 1. 평균, 편차, 분산, 표준편차 평균, 편차, 분산, 표준편차 통계학은 데이터를 다루는 학문입니다. 데이터를 모으고, 정리하고, 분석하고, 추측하고, 어떤 결론을 도출하는 것이 통계학의 역할입니다. 데이터를 요약해주는 특징들을 알 수 있다면 데이터를 파악하는데 도움이 됩니다. 데이터의 특징을 수치화한 값을 통계량이라고 합니다. 대표적인 통계량에는 '평균(mean)', '분산(variance)', '표준편차(standard deviation)' 등이 있습니다. 어떤 집단이 궁금한 상황을 가정해봅시다. 우리는 그 집단 전체가 궁금합니다. 전체집단을 모집단(Population)이라고 부릅니다. 이 모집단의 평균,편차,분산,표준편차와 같은 모집단의 특성을 모수(Parameter)라고 합니다. 하지만 전체집단을 모두 조사할 수는 없습니다. 그래.. 2018. 3. 23.
반응형