모집단이 있습니다. 모집단의 평균을 $\mu$(뮤), 표준편차를 $\sigma$ (시그마)라고 합시다.
모집단의 평균이 궁금한데 모집단이 너무 커서 구할 수가 없었습니다. 모집단의 평균을 추정하기 위해 모집단에서 크기가 n인 표본을 추출했습니다. 이 표본을 표본1이라고 합시다. 표본 1의 평균을 구했고 $\bar{X}_{1}$ 이라고 놓겠습니다.
이렇게 표본을 계속 뽑았습니다. 표본 평균들이 많이 구해지겠죠.
이 표본평균에는 아래와 같은 성질이 성립합니다.
$E\left [ \bar{X} \right ]$
$V\left [ \bar{X} \right ]=\frac{\sigma^2}{n}$
표본 평균의 평균이 모평균과 같다는 것과, 표본 평균의 분산이 모분산을 n으로 나눈 것과 같다는 성질입니다. 이유가 궁금하신 분들은 아래 링크에 유도과정이 있습니다.
표본평균의 평균이 모평균과 같은 이유 → https://hsm-edu.tistory.com/14
표본평균의 분산이 모분산/n인 이유 → https://hsm-edu.tistory.com/16
이때 표본평균의 표준편차를 '표준오차'라고 합니다.
$\sigma \left [ \bar{X} \right ]=standard \ error=\frac{\sigma}{\sqrt{n}}$
왜 표준오차라는 말이 붙었을까요. 수식의 의미를 이해하면 왜 표준오차인지를 알 수 있습니다.
표본평균의 표준편차 아래와 같이 구합니다.
$\sigma \left [ \bar{X} \right ]=\sqrt{E\left [ \left ( \bar{X}-\mu \right )^2 \right ]}$
표준편차는 편차의 제곱의 평균에 루트를 씌운 값입니다. 편차는 변량에서 평균을 뺀 값입니다.
편차 = 변량-평균
표준편차는 변량들이 평균에서 얼마나 떨어져 있는지를 나타내주는 값입니다. 표본평균의 표준편차를 구하는 상황에서 변량은 표본평균입니다. 표본평균은 모평균에 대한 추정값입니다. 이때 모평균을 참값이라고 부릅니다. 따라서 (변량-평균)이, (추정값-참값)을 의미하게 됩니다. (추정값-참값)은 '오차'입니다.
편차(변량-평균)의 제곱의 평균에 루트를 씌운 값이 '표준편차' 인 것처럼
오차(추정값-참값)의 제곱의 평균에 루트를 씌운 것이 '표준오차' 가 된 것입니다.
표준오차는 '추정값인 표본평균들과 참값인 모평균과의 표준적인 차이' 정도로 이해할 수 있습니다.
수식에서 n이 커지면 표준오차가 줄어듭니다. 실제로 표본을 뽑는 상황을 생각해봅시다. 모집단에서 크기가 큰 표본을 뽑을 수록 모집단과 가까워지겠죠? 따라서 오차는 줄어들 것입니다. 직관적으로도 성립합니다.
#영상 강의
'@ 통계 교양 > 통계 Tips (영상)' 카테고리의 다른 글
복원추출과 비복원추출에 대한 오해 (8) | 2020.04.15 |
---|---|
상관분석을 할 때 주의할 점(이질적 하위표본 효과) (0) | 2020.02.01 |
양측검정 결과로 나온 유의확률을 단측검정으로 쓰려면 2를 곱해야할까 나눠야할까 (4) | 2019.12.13 |
통계 분야 논문 수, 한국은 몇위일까? (0) | 2019.11.05 |
통계 용어 검색하는 방법 (한국통계학회 통계용어집) (0) | 2019.10.19 |
데이터를 입력하는 두가지 방법 비교 (엑셀과 SPSS의 데이터 입력방식 비교) (0) | 2019.08.26 |
통계검정에서 1종오류가 2종오류보다 중요한 이유 (10) | 2019.08.26 |
중심극한정리 시뮬레이션해볼 수 있는 사이트 (0) | 2019.08.25 |
댓글