본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계] 7. 크기가 1인 표본평균의 평균과 분산이 모집단과 같은 이유 증명

by bigpicture 2018. 3. 24.
반응형

3강에서 표본평균의 평균을 계산했던 수식을 가져와봅시다. 

 

$E(\bar{X})=E\left (  \frac{\sum_{i=1}^{n}x_{i}}{n}\right )$

 

$\frac{1}{n}$ 은 상수이므로 밖으로 꺼냅시다.

 

$E(\bar{X})=\frac{1}{n} E\left ( \sum_{i=1}^{n}x_{i} \right )$

 

우변의 괄호 안 수식을 풀어서 쓰면 아래와 같습니다. 

$E(\bar{X})=\frac{1}{n} E\left ( x_{1}+x_{2}+...+x_{n} \right )$

 

여기서 우변의 각 항들이 표본들의 n번째 원소를 나타내는 변수입니다. 각 항을 크기가 1인 표본으로 생각할 수 있습니다. 크기가 1인 표본에서는 표본과 표본평균이 같기 때문에, 크기가 1인 표본평균이라는 변수로 생각할 수 있습니다.

 

각 항 = 크기가 1인 표본이라는 변수 = 크기가 1인 표본의 평균이라는 변수

 

각 항의 기댓값을 구하는 것은 크기가 1인 표본평균의 평균을 구하는 것과 같습니다. 크기가 1인 표본평균의 평균과 분산을 구해봅시다. 


예시

먼저 간단한 예시를 통해서 계산해봅시다. 사람 7명의 키로 구성된 모집단을 생각해봅시다.

 

$Population=\left\{ 180, 180, 170, 170, 170, 160, 160 \right\}$

 

모집단의 평균은 아래와 같습니다. 

 

$ \mu=180 \times \frac{2}{7} + 170 \times \frac{3}{7} + 160 \times \frac{2}{7}$

 

모집단의 분산은 아래와 같습니다. 

 

$\sigma^2=180^2 \times \frac{2}{7} + 170^2 \times \frac{3}{7} + 160^2 \times \frac{2}{7} - \mu^2$

 

이 모집단에서 크기가 1인 표본을 뽑겠습니다. 크기가 1인 표본의 경우 표본의 값이 곧 표본평균입니다. 크기가 1인 표본을 무수히 많이 뽑았고, 표본평균들의 집합을 $\bar{X}$ 라고 하겠습니다. 이 집합에는 180, 170, 160이 무수히 많이 들어있을 것입니다. 집합의 크기를 N이라고 놓겠습니다. 그리고 180인 표본평균의 개수를 A개, 170인 표본의 개수를 B개, 160인 표본평균의 개수를 C개라고 놓겠습니다. 표본평균의 평균은 아래와 같이 정의됩니다.

 

$E(\bar{X})=180 \times \frac{A}{N} + 170 \times \frac{B}{N} + 180 \times \frac{C}{N}$

 

N을 무한대로 보내면 대수의 법칙(큰수의 법칙)에 의해 아래 값으로 수렴합니다. 

 

$\lim_{N\rightarrow \infty}\frac{A}{N}=\frac{2}{7}$

$\lim_{N\rightarrow \infty}\frac{B}{N}=\frac{3}{7}$

$\lim_{N\rightarrow \infty}\frac{C}{N}=\frac{2}{7}$

 

N이 무한대로 갈 때 표본평균의 평균은 아래 값으로 수렴합니다.

 

$E(\bar{X})=180 \times \frac{2}{7} + 170 \times \frac{3}{7} + 180 \times \frac{2}{7}$

 

결과는 평균과 같습니다. 표본평균의 분산도 같은 이유로 모분산과 같습니다.


일반화

아래와 같이 n개 종류의 원소를 가진 모집단을 하나 가정합시다. 

 

$\left\{ x_{1}, ,x_{1}, ,x_{1} , x_{2},...,x_{n} \right\}$

 

각 원소의 개수는 아래와 같다고 합시다.

 

$\left\{ N_{1}, N_{2},...,N_{n} \right\}$

 

모집단 원소의 총 개수는 $N_{T}$개 라고 합시다. $N_{T}=N_{1}+N_{2}+...+N_{n}$ 입니다. 모집단의 평균과 분산은 아래와 같습니다. 

 

$\mu=x_{1}\frac{N_{1}}{N_{T}}+x_{2}\frac{N_{2}}{N_{T}}+...+x_{n}\frac{N_{n}}{N_{T}}$

 

$\sigma^2={x_{1}}^{2}\frac{N_{1}}{N_{T}}+{x_{2}}^{2}\frac{N_{2}}{N_{T}}+...+{x_{n}}^{2}\frac{N_{n}}{N_{T}}  $

 

모집단에서 크기가 1인 표본을 추출하고 평균을 구합시다. 무수히 많은 표본을 추출하고 평균을 구합니다. 표본평균들도 아래와 같은 종류의 원소를 갖고 있습니다. 

 

$ \left \{ x_{1}, x_{2},...,x_{n} \right \} $

 

각 원소의 개수는 아래와 같다고 합시다.

 

$\left\{ A_{1}, A_{2},...,A_{n} \right\}$

 

표본평균들의 총 개수는 $A_{T}$개 라고 합시다. $A_{T}=A_{1}+A_{2}+...+A_{n}$ 입니다. 모집단의 평균과 분산은 아래와 같습니다. 

 

$\mu=x_{1}\frac{A_{1}}{A_{T}}+x_{2}\frac{A_{2}}{A_{T}}+...+x_{n}\frac{A_{n}}{A_{T}}$

 

$\sigma^2={x_{1}}^{2}\frac{A_{1}}{A_{T}}+{x_{2}}^{2}\frac{A_{2}}{A_{T}}+...+{x_{n}}^{2}\frac{A_{n}}{A_{T}}  $

 

$A_{T}$를 무한대로 보내면 대수의 법칙(큰수의 법칙)에 의해 아래 값으로 수렴합니다. 

 

$\lim_{N\rightarrow \infty}\frac{A_{1}}{A_{T}}=\frac{N_{1}}{N_{T}}$
$\lim_{N\rightarrow \infty}\frac{A_{2}}{A_{T}}=\frac{N_{2}}{N_{T}}$
...
$\lim_{N\rightarrow \infty}\frac{A_{n}}{A_{T}}=\frac{N_{n}}{N_{T}}$

 

따라서 표본평균의 평균이 모평균과 같아지고, 표본평균의 분산이 모분산과 같아집니다. 

 

#강의 영상

 

 

반응형

댓글