고등학교 '확률과 통계'시간에 표본평균의 평균을 모평균과 같다는 것을 배웠는데 증명을 하지는 않습니다. '알려져있다' 라고만 배우는데요. 고등학교 수준의 수학으로 증명 가능합니다. 한번 증명해봅시다
표본평균의 평균이란?
모집단에서 표본을 뽑고 평균을 구합니다. 표본을 또 뽑고 평균을 구합니다. 표본을 또 뽑고 평균을 구합니다. 이걸 무한히 반복합니다. 무한히 많은 표본평균이 생깁니다. 얘내들을 가지고 다시 평균을 구합니다.
짧지만 여러운 증명
모집단이 하나 있습니다. 이 모집단의 평균은 $\mu$ 이고 분산은 $\sigma ^{2}$ 라고 놓겠습니다. 이 모집단에서 크기가 n인 표본을 뽑아봅시다. 첫번째 표본은 표본1, 두번째 표본은 표본2 이렇게 무수히 많은 표본을 뽑을 수 있습니다. 복원추출을 가정합니다. 따라서 표본 안에 있는 원소들은 중복이 가능하고, 원소들이 뽑히는 사건은 서로 '독립'이 됩니다.
표본평균은 아래와 같이 정의됩니다.
$\bar{X}=\frac{\sum_{i=1}^{n}x_{i}}{n}$
표본평균의 기댓값은 아래와 같이 구합니다.
$E(\bar{X})=E\left ( \frac{\sum_{i=1}^{n}x_{i}}{n}\right )$
$\frac{1}{n}$ 은 상수이므로 밖으로 꺼냅시다.
$E(\bar{X})=\frac{1}{n} E\left ( \sum_{i=1}^{n}x_{i} \right )$
우변의 괄호 안 수식을 풀어서 쓰면 아래와 같습니다.
$E(\bar{X})=\frac{1}{n} E\left ( x_{1}+x_{2}+...+x_{n} \right )$
아래와 같이 분리할 수 있습니다.
$E(\bar{X})=\frac{1}{n} \left[ E\left ( x_{1}\right )+E\left ( x_{2}\right )+...+E\left ( x_{n}\right ) \right]$
각각은 모집단의 평균과 같습니다.
$E(\bar{X})=\frac{1}{n} \left[ n\mu \right]$
아래 등식이 유도됩니다.
$E(\bar{X})=\mu$
증명 끝입니다. 일반적으로 알려져 있는 증명방법이구요. 직관적으로 잘 이해가 안되시는 분들을 위해서, 아주 쉽게 풀어서 설명해보겠습니다.
변수 개념잡기
위 증명이 이해되지 않는다면 아마도 변수개념이 없기 때문일 것입니다. X라는 변수가 있다고 합시다. X는 12,3,4,5를 가질 수 있습니다. 집합으로 나타내면 X={1,2,3,4,5}입니다. 각 원소가 발생할 확률이 같다고 가정합시다. X의 평균을 구한다고 해봅시다.
$E(X)$
위 수식에서 X는 어느 한 원소를 의미하지 않습니다. X에 올 수 있는 모든 원소를 의미합니다. X에 올 수 있는 모든 원소의 평균을 구한다.
이번에는 아래 수식을 봅시다.
$E(\bar{X})$
표본평균의 평균입니다. 어느 하나의 표본평균을 의미하는게 아니라, 모든 표본평균을 의미합니다.
아래 수식은 어떨까요.
$E(\bar{X})=\frac{1}{n} E\left ( x_{1}+x_{2}+...+x_{n} \right )$
$x_{1}$는 특정 표본의 첫번째 원소를 의미하지 않습니다. 뽑힐 수 있는 모든 표본의 첫번째 원소입니다. 어느 표본이 뽑히느냐에 따라 달라질 수 있고, 모집단의 모든 원소가 올 수 있습니다. 따라서 모집단의 원소와 같습니다.
길지만 쉬운 증명
모집단이 하나 있습니다. 이 모집단의 평균은 $\mu$ 이고 분산은 $\sigma ^{2}$ 라고 놓겠습니다. 이 모집단에서 크기가 n인 표본을 뽑아봅시다. 첫번째 표본은 표본1, 두번째 표본은 표본2 이렇게 무수히 많은 표본을 뽑을 수 있습니다. 복원추출을 가정합니다. 따라서 표본 안에 있는 원소들은 중복이 가능하고, 원소들이 뽑히는 사건은 서로 '독립'이 됩니다.
표본 1을 아래와 같이 놓을 수 있습니다. 아래첨자는 원소번호, 위첨자는 어느 표본에 속한지를 나타냅니다.
$X_{1}=\left \{ x_{1}^{(1)},x_{2}^{(1)},...,x_{n}^{(1)} \right \}$
표본 2는 아래와 같이 놓을 수 있습니다.
$X_{2}=\left \{ x_{1}^{(2)},x_{2}^{(2)},...,x_{n}^{(2)} \right \}$
표본 k는 아래와 같이 놓을 수 있습니다.
$X_{k}=\left \{ x_{1}^{(k)},x_{2}^{(k)},...,x_{n}^{(k)} \right \}$
표본은 무수히 많이 뽑을 수 있으므로, K는 무한대로 갑니다.
각 표본의 평균은 아래와 같이 나타낼 수 있습니다.
$\bar{X}_{1}=\frac{\sum_{i=1}^{n}x_{i}^{(1)}}{n}$
$\bar{X}_{2}=\frac{\sum_{i=1}^{n}x_{i}^{(2)}}{n}$
$...$
$\bar{X}_{k}=\frac{\sum_{i=1}^{n}x_{i}^{(k)}}{n}$
$...$
표본평균을 변수로 나타내면 아래와 같습니다.
$\bar{X}=\left \{ \bar{X}_1,\bar{X}_2,...,\bar{X}_n \right \}$
이번에는 원소들을 변수로 놓아봅시다. 각 표본의 첫번째 원소를 대표하는 변수를 $x_{1}$이라고 합시다. $x_{1}$ 은 아래 표본들의 첫번째 원소에 대한 변수입니다.
$X_{1}=\left \{ x_{1}^{(1)},x_{2}^{(1)},...,x_{n}^{(1)} \right \}$
$X_{2}=\left \{ x_{1}^{(2)},x_{2}^{(2)},...,x_{n}^{(2)} \right \}$
$...$
$X_{k}=\left \{ x_{1}^{(k)},x_{2}^{(k)},...,x_{n}^{(k)} \right \}$
$...$
표본평균의 평균을 계산해봅시다.
$E(\bar{X})=E\left ( \frac{\sum_{i=1}^{n}x_{i}}{n}\right )$
$\frac{1}{n}$ 은 상수이므로 밖으로 꺼냅시다.
$E(\bar{X})=\frac{1}{n} E\left ( \sum_{i=1}^{n}x_{i} \right )$
우변의 괄호 안 수식을 풀어서 쓰면 아래와 같습니다.
$E(\bar{X})=\frac{1}{n} E\left ( x_{1}+x_{2}+...+x_{n} \right )$
여기서 우변의 각 항들은 표본들의 n번째 원소를 나타내는 변수입니다. 각 변수의 집합은 모집단의 집합과 동일합니다. 모집단의 모든 원소가 올 수 있고 모집단과 구성비도 같다는 말입니다. 따라서 각 변수와 모집단의 확률변수가 같습니다.
(또는 이 변수를 크기가 1인 표본으로 해석할 수도 있습니다. 크기가 1인 표본의 평균은 모집단의 평균과 같습니다. 이 내용은 7강에서 설명합니다.)
위 수식의 우변을 아래와 같이 분리할 수 있습니다.
$E(\bar{X})=\frac{1}{n} \left[ E\left ( x_{1}\right )+E\left ( x_{2}\right )+...+E\left ( x_{n}\right ) \right]$
위 수식 우변의 각각의 항들은 모집단의 평균과 같습니다.
$E(\bar{X})=\frac{1}{n} \left[ n\mu \right]$
아래 등식이 유도됩니다.
$E(\bar{X})=\mu$
#강의 영상
'@ 필수과목 > 손으로 푸는 통계' 카테고리의 다른 글
[손으로 푸는 통계] 9. 중심극한정리 설명 (6) | 2018.03.24 |
---|---|
[손으로 푸는 통계] 8. 1~7강 요약(세로영상) (3) | 2018.03.24 |
[손으로 푸는 통계] 7. 크기가 1인 표본평균의 평균과 분산이 모집단과 같은 이유 증명 (4) | 2018.03.24 |
[손으로 푸는 통계] 6. E(XY)=E(X)E(Y) 의 성립조건과 증명 (12) | 2018.03.23 |
[손으로 푸는 통계] 5. 표본평균의 분산이 모분산/n 인 이유(고등학생들 꼭 보세요) (18) | 2018.03.23 |
[손으로 푸는 통계] 4. 표본분산의 기댓값이 모분산과 같은 이유 (6) | 2018.03.23 |
[손으로 푸는 통계] 2. 자유도와 불편추정량 (왜 n-1로 나누나요?) (10) | 2018.03.23 |
[손으로 푸는 통계] 1. 평균, 편차, 분산, 표준편차 (7) | 2018.03.23 |
댓글