본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계] 3. 표본평균의 평균이 모평균과 같은 이유

by bigpicture 2018. 3. 23.
반응형

고등학교 '확률과 통계'시간에 표본평균의 평균을 모평균과 같다는 것을 배웠는데 증명을 하지는 않습니다. '알려져있다' 라고만 배우는데요. 고등학교 수준의 수학으로 증명 가능합니다. 한번 증명해봅시다


표본평균의 평균이란?

모집단에서 표본을 뽑고 평균을 구합니다. 표본을 또 뽑고 평균을 구합니다. 표본을 또 뽑고 평균을 구합니다. 이걸 무한히 반복합니다. 무한히 많은 표본평균이 생깁니다. 얘내들을 가지고 다시 평균을 구합니다. 


짧지만 여러운 증명

모집단이 하나 있습니다. 이 모집단의 평균은 $\mu$ 이고 분산은 $\sigma ^{2}$ 라고 놓겠습니다. 이 모집단에서 크기가 n인 표본을 뽑아봅시다. 첫번째 표본은 표본1, 두번째 표본은 표본2 이렇게 무수히 많은 표본을 뽑을 수 있습니다. 복원추출을 가정합니다. 따라서 표본 안에 있는 원소들은 중복이 가능하고, 원소들이 뽑히는 사건은 서로 '독립'이 됩니다.

 

표본평균은 아래와 같이 정의됩니다. 

$\bar{X}=\frac{\sum_{i=1}^{n}x_{i}}{n}$

표본평균의 기댓값은 아래와 같이 구합니다.

$E(\bar{X})=E\left (  \frac{\sum_{i=1}^{n}x_{i}}{n}\right )$

 

$\frac{1}{n}$ 은 상수이므로 밖으로 꺼냅시다. 

 

$E(\bar{X})=\frac{1}{n} E\left ( \sum_{i=1}^{n}x_{i} \right )$

 

우변의 괄호 안 수식을 풀어서 쓰면 아래와 같습니다. 

$E(\bar{X})=\frac{1}{n} E\left ( x_{1}+x_{2}+...+x_{n} \right )$

아래와 같이 분리할 수 있습니다. 

$E(\bar{X})=\frac{1}{n} \left[ E\left ( x_{1}\right )+E\left ( x_{2}\right )+...+E\left ( x_{n}\right ) \right]$

각각은 모집단의 평균과 같습니다. 

$E(\bar{X})=\frac{1}{n} \left[ n\mu \right]$

아래 등식이 유도됩니다.

$E(\bar{X})=\mu$

 

증명 끝입니다. 일반적으로 알려져 있는 증명방법이구요. 직관적으로 잘 이해가 안되시는 분들을 위해서, 아주 쉽게 풀어서 설명해보겠습니다. 


변수 개념잡기

위 증명이 이해되지 않는다면 아마도 변수개념이 없기 때문일 것입니다. X라는 변수가 있다고 합시다. X는 12,3,4,5를 가질 수 있습니다. 집합으로 나타내면 X={1,2,3,4,5}입니다. 각 원소가 발생할 확률이 같다고 가정합시다. X의 평균을 구한다고 해봅시다. 

 

$E(X)$

 

위 수식에서 X는 어느 한 원소를 의미하지 않습니다. X에 올 수 있는 모든 원소를 의미합니다. X에 올 수 있는 모든 원소의 평균을 구한다. 

 

이번에는 아래 수식을 봅시다.

 

$E(\bar{X})$

 

표본평균의 평균입니다. 어느 하나의 표본평균을 의미하는게 아니라, 모든 표본평균을 의미합니다. 

 

아래 수식은 어떨까요. 

 

$E(\bar{X})=\frac{1}{n} E\left ( x_{1}+x_{2}+...+x_{n} \right )$

 

$x_{1}$는 특정 표본의 첫번째 원소를 의미하지 않습니다. 뽑힐 수 있는 모든 표본의 첫번째 원소입니다. 어느 표본이 뽑히느냐에 따라 달라질 수 있고, 모집단의 모든 원소가 올 수 있습니다. 따라서 모집단의 원소와 같습니다. 


길지만 쉬운 증명

모집단이 하나 있습니다. 이 모집단의 평균은 $\mu$ 이고 분산은 $\sigma ^{2}$ 라고 놓겠습니다. 이 모집단에서 크기가 n인 표본을 뽑아봅시다. 첫번째 표본은 표본1, 두번째 표본은 표본2 이렇게 무수히 많은 표본을 뽑을 수 있습니다. 복원추출을 가정합니다. 따라서 표본 안에 있는 원소들은 중복이 가능하고, 원소들이 뽑히는 사건은 서로 '독립'이 됩니다.

 

표본 1을 아래와 같이 놓을 수 있습니다. 아래첨자는 원소번호, 위첨자는 어느 표본에 속한지를 나타냅니다. 

$X_{1}=\left \{ x_{1}^{(1)},x_{2}^{(1)},...,x_{n}^{(1)} \right \}$

표본 2는 아래와 같이 놓을 수 있습니다.

$X_{2}=\left \{ x_{1}^{(2)},x_{2}^{(2)},...,x_{n}^{(2)} \right \}$

표본 k는 아래와 같이 놓을 수 있습니다. 

$X_{k}=\left \{ x_{1}^{(k)},x_{2}^{(k)},...,x_{n}^{(k)} \right \}$

표본은 무수히 많이 뽑을 수 있으므로, K는 무한대로 갑니다. 

각 표본의 평균은 아래와 같이 나타낼 수 있습니다. 

$\bar{X}_{1}=\frac{\sum_{i=1}^{n}x_{i}^{(1)}}{n}$
$\bar{X}_{2}=\frac{\sum_{i=1}^{n}x_{i}^{(2)}}{n}$
$...$
$\bar{X}_{k}=\frac{\sum_{i=1}^{n}x_{i}^{(k)}}{n}$
$...$

 

표본평균을 변수로 나타내면 아래와 같습니다.

 

$\bar{X}=\left \{ \bar{X}_1,\bar{X}_2,...,\bar{X}_n \right \}$

 

이번에는 원소들을 변수로 놓아봅시다. 각 표본의 첫번째 원소를 대표하는 변수를 $x_{1}$이라고 합시다. $x_{1}$ 은 아래 표본들의 첫번째 원소에 대한 변수입니다. 

 

$X_{1}=\left \{ x_{1}^{(1)},x_{2}^{(1)},...,x_{n}^{(1)} \right \}$
$X_{2}=\left \{ x_{1}^{(2)},x_{2}^{(2)},...,x_{n}^{(2)} \right \}$

$...$

$X_{k}=\left \{ x_{1}^{(k)},x_{2}^{(k)},...,x_{n}^{(k)} \right \}$

$...$

 

표본평균의 평균을 계산해봅시다. 

 

$E(\bar{X})=E\left (  \frac{\sum_{i=1}^{n}x_{i}}{n}\right )$

 

$\frac{1}{n}$ 은 상수이므로 밖으로 꺼냅시다.

 

$E(\bar{X})=\frac{1}{n} E\left ( \sum_{i=1}^{n}x_{i} \right )$

 

우변의 괄호 안 수식을 풀어서 쓰면 아래와 같습니다. 

$E(\bar{X})=\frac{1}{n} E\left ( x_{1}+x_{2}+...+x_{n} \right )$

 

여기서 우변의 각 항들은 표본들의 n번째 원소를 나타내는 변수입니다. 각 변수의 집합은 모집단의 집합과 동일합니다. 모집단의 모든 원소가 올 수 있고 모집단과 구성비도 같다는 말입니다. 따라서 각 변수와 모집단의 확률변수가 같습니다. 

 

(또는 이 변수를 크기가 1인 표본으로 해석할 수도 있습니다. 크기가 1인 표본의 평균은 모집단의 평균과 같습니다. 이 내용은 7강에서 설명합니다.)

 

위 수식의 우변을 아래와 같이 분리할 수 있습니다. 

$E(\bar{X})=\frac{1}{n} \left[ E\left ( x_{1}\right )+E\left ( x_{2}\right )+...+E\left ( x_{n}\right ) \right]$

 

위 수식 우변의 각각의 항들은 모집단의 평균과 같습니다. 

$E(\bar{X})=\frac{1}{n} \left[ n\mu \right]$

아래 등식이 유도됩니다.

$E(\bar{X})=\mu$

 

#강의 영상

반응형

댓글