모집단이 있습니다. 모집단의 평균을 (뮤), 표준편차를 (시그마)라고 합시다.

모집단의 평균이 궁금한데 모집단이 너무 커서 구할 수가 없었습니다. 모집단의 평균을 추정하기 위해 모집단에서 크기가 n인 표본을 추출했습니다. 이 표본을 표본1이라고 합시다. 표본 1의 평균을 구했고 이라고 놓겠습니다.

이렇게 표본을 계속 뽑았습니다. 표본 평균들이 많이 구해지겠죠.

이 표본평균에는 아래와 같은 성질이 성립합니다.
표본 평균의 평균이 모평균과 같다는 것과, 표본 평균의 분산이 모분산을 n으로 나눈 것과 같다는 성질입니다. 이유가 궁금하신 분들은 아래 링크에 유도과정이 있습니다.
표본평균의 평균이 모평균과 같은 이유 → https://hsm-edu.tistory.com/14
표본평균의 분산이 모분산/n인 이유 → https://hsm-edu.tistory.com/16
이때 표본평균의 표준편차를 '표준오차'라고 합니다.
왜 표준오차라는 말이 붙었을까요. 수식의 의미를 이해하면 왜 표준오차인지를 알 수 있습니다.
표본평균의 표준편차 아래와 같이 구합니다.
표준편차는 편차의 제곱의 평균에 루트를 씌운 값입니다. 편차는 변량에서 평균을 뺀 값입니다.
편차 = 변량-평균
표준편차는 변량들이 평균에서 얼마나 떨어져 있는지를 나타내주는 값입니다. 표본평균의 표준편차를 구하는 상황에서 변량은 표본평균입니다. 표본평균은 모평균에 대한 추정값입니다. 이때 모평균을 참값이라고 부릅니다. 따라서 (변량-평균)이, (추정값-참값)을 의미하게 됩니다. (추정값-참값)은 '오차'입니다.
편차(변량-평균)의 제곱의 평균에 루트를 씌운 값이 '표준편차' 인 것처럼
오차(추정값-참값)의 제곱의 평균에 루트를 씌운 것이 '표준오차' 가 된 것입니다.
표준오차는 '추정값인 표본평균들과 참값인 모평균과의 표준적인 차이' 정도로 이해할 수 있습니다.
수식에서 n이 커지면 표준오차가 줄어듭니다. 실제로 표본을 뽑는 상황을 생각해봅시다. 모집단에서 크기가 큰 표본을 뽑을 수록 모집단과 가까워지겠죠? 따라서 오차는 줄어들 것입니다. 직관적으로도 성립합니다.
#영상 강의
'@ 통계 교양 > 통계 Tips (영상)' 카테고리의 다른 글
복원추출과 비복원추출에 대한 오해 (8) | 2020.04.15 |
---|---|
상관분석을 할 때 주의할 점(이질적 하위표본 효과) (0) | 2020.02.01 |
양측검정 결과로 나온 유의확률을 단측검정으로 쓰려면 2를 곱해야할까 나눠야할까 (4) | 2019.12.13 |
통계 분야 논문 수, 한국은 몇위일까? (0) | 2019.11.05 |
통계 용어 검색하는 방법 (한국통계학회 통계용어집) (0) | 2019.10.19 |
데이터를 입력하는 두가지 방법 비교 (엑셀과 SPSS의 데이터 입력방식 비교) (0) | 2019.08.26 |
통계검정에서 1종오류가 2종오류보다 중요한 이유 (10) | 2019.08.26 |
중심극한정리 시뮬레이션해볼 수 있는 사이트 (0) | 2019.08.25 |
댓글
bigpicture님의
글이 좋았다면 응원을 보내주세요!
이 글이 도움이 됐다면, 응원 댓글을 써보세요. 블로거에게 지급되는 응원금은 새로운 창작의 큰 힘이 됩니다.
응원 댓글은 만 14세 이상 카카오계정 이용자라면 누구나 편하게 작성, 결제할 수 있습니다.
글 본문, 댓글 목록 등을 통해 응원한 팬과 응원 댓글, 응원금을 강조해 보여줍니다.
응원금은 앱에서는 인앱결제, 웹에서는 카카오페이 및 신용카드로 결제할 수 있습니다.