지난 글에서 표본평균의 기댓값은 모평균과 같다는 것을 보였습니다. 오늘은 표본분산의 평균이 모분산과 같다는 것을 증명해봅시다.
표본에서 구한 어떤 통계량의 기댓값이 모수와 같을 때 이 통계량을 불편추정량이라고 합시다. 표본평균은 불편추정량이구요. 표본분산은 n으로 나눠서 계산하면 모분산과 달라고, 모분산과 같게 해주려고 n-1 로 나눠서 계산합니다. 이 내용은 2강에서 설명했습니다.
표본분산의 평균이란?
모집단이 하나 있다고 가정합시다. 모집단의 평균을 μμ, 분산을 σ2σ2이라고 놓겠습니다. 이 모집단에서 크기가 n인 표본을 뽑아서 분산을 구했습니다. 표본을 또 뽑고 분산을 구합니다. 표본을 또 뽑고 분산을 구합니다. 이렇게 무수히 많은 표본을 뽑아 분산을 구합니다. 이제 우리에게는 무수히 많은 표본분산들이 있습니다. 이 표본분산의 평균을 구합니다.
표본분산의 평균=모분산 증명
표본분산은 아래와 같이 계산됩니다. 편차의 제곱의 평균입니다.
S2=∑ni=1(xi−ˉX)2n−1S2=∑ni=1(xi−¯X)2n−1
표본분산의 기댓값은 아래와 같습니다.
E(S2)=E(∑ni=1(xi−ˉX)2n−1)E(S2)=E(∑ni=1(xi−¯X)2n−1)
n-1은 상수이므로, 밖으로 꺼낼 수 있습니다.
E(S2)=1n−1E(∑ni=1(xi−ˉX)2)E(S2)=1n−1E(∑ni=1(xi−¯X)2)
한가지 수학적 처리를 하겠습니다. 아래와 같이 모집단의 평균 μμ를 빼고 더해줍니다. 0을 더한 것 과 같기 때문에 등호에 영향을 주지 않습니다.
E(S2)=1n−1E(∑ni=1(xi−μ+μ−ˉX)2)E(S2)=1n−1E(∑ni=1(xi−μ+μ−¯X)2)
아래와 같이 전개합니다.
E(S2)=1n−1E(∑ni=1[(xi−μ)2+2(xi−μ)(μ−ˉX)+(μ−ˉX)2])E(S2)=1n−1E(∑ni=1[(xi−μ)2+2(xi−μ)(μ−¯X)+(μ−¯X)2])
시그마로 묶여있는 각 항을 분리합니다.
E(S2)=1n−1E(∑ni=1[(xi−μ)2]+∑ni=1[2(xi−μ)(μ−ˉX)]+∑ni=1[(μ−ˉX)2])E(S2)=1n−1E(∑ni=1[(xi−μ)2]+∑ni=1[2(xi−μ)(μ−¯X)]+∑ni=1[(μ−¯X)2])
둘째항에서 시그마와 무관항 항을 밖으로 꺼냅니다.
E(S2)=1n−1E(∑ni=1[(xi−μ)2]+2(μ−ˉX)∑ni=1[(xi−μ)]+∑ni=1[(μ−ˉX)2])E(S2)=1n−1E(∑ni=1[(xi−μ)2]+2(μ−¯X)∑ni=1[(xi−μ)]+∑ni=1[(μ−¯X)2])
마지막 항은 아래와 같이 바꿀 수 있습니다. n번 더한 것입니다.
E(S2)=1n−1E(∑ni=1[(xi−μ)2]+2(μ−ˉX)∑ni=1[(xi−μ)]+n[(μ−ˉX)2])E(S2)=1n−1E(∑ni=1[(xi−μ)2]+2(μ−¯X)∑ni=1[(xi−μ)]+n[(μ−¯X)2])
두번째 항도 아래와 같이 변형합니다. μμ를 n번 더하여 시그마를 벗겨준 것입니다.
E(S2)=1n−1E(∑ni=1[(xi−μ)2]+2(μ−ˉX)[∑ni=1(xi)−nμ]+n[(μ−ˉX)2])E(S2)=1n−1E(∑ni=1[(xi−μ)2]+2(μ−¯X)[∑ni=1(xi)−nμ]+n[(μ−¯X)2])
표본평균의 정의를 이용하면 아래와 같은 변형이 가능합니다.
ˉX=∑ni1xinnˉX=∑ni1xi¯X=∑ni1xinn¯X=∑ni1xi
따라서 우리가 유도하던 수식을 아래와 같이 바꿀 수 있습니다.
E(S2)=1n−1E(∑ni=1[(xi−μ)2]+2(μ−ˉX)[nˉX−nμ]+n[(μ−ˉX)2])E(S2)=1n−1E(∑ni=1[(xi−μ)2]+2(μ−¯X)[n¯X−nμ]+n[(μ−¯X)2])
둘째항을 n으로 묶어줍니다.
E(S2)=1n−1E(∑ni=1[(xi−μ)2]+2n(μ−ˉX)(ˉX−μ)+n[(μ−ˉX)2])E(S2)=1n−1E(∑ni=1[(xi−μ)2]+2n(μ−¯X)(¯X−μ)+n[(μ−¯X)2])
-1을 꺼내고 완전제곱식으로 만들어줍니다.
E(S2)=1n−1E(∑ni=1[(xi−μ)2]−2n(μ−ˉX)2+n[(μ−ˉX)2])E(S2)=1n−1E(∑ni=1[(xi−μ)2]−2n(μ−¯X)2+n[(μ−¯X)2])
둘째항과 셋째항을 계산합니다.
E(S2)=1n−1E(∑ni=1[(xi−μ)2]−n(μ−ˉX)2)E(S2)=1n−1E(∑ni=1[(xi−μ)2]−n(μ−¯X)2)
둘째항을 아래와 같이 써줍니다. 자리를 바꿔써도 무관합니다.
E(S2)=1n−1E(∑ni=1[(xi−μ)2]−n(ˉX−μ)2)E(S2)=1n−1E(∑ni=1[(xi−μ)2]−n(¯X−μ)2)
기댓값을 아래와 같이 둘로 분리합시다.
E(S2)=1n−1{E(∑ni=1[(xi−μ)2])+E(−n(ˉX−μ)2)}E(S2)=1n−1{E(∑ni=1[(xi−μ)2])+E(−n(¯X−μ)2)}
-n을 밖으로 꺼내줍니다.
E(S2)=1n−1{E(∑ni=1[(xi−μ)2])−nE((ˉX−μ)2)}E(S2)=1n−1{E(∑ni=1[(xi−μ)2])−nE((¯X−μ)2)}
두변의 두번째 항은 표본평균의 분산입니다. 표본평균의 분산은 모분산/n 이라는 성질을 사용하겠습니다. 다음강의에서 증명할 내용입니다.
E(S2)=1n−1{E(∑ni=1[(xi−μ)2])−nσ2n}E(S2)=1n−1{E(∑ni=1[(xi−μ)2])−nσ2n}
n을 약분합시다.
E(S2)=1n−1{E(∑ni=1[(xi−μ)2])−σ2}E(S2)=1n−1{E(∑ni=1[(xi−μ)2])−σ2}
괄호 안의 시그마를 풀어서 쓰면 아래와 같습니다.
E(S2)=1n−1{E[(x1−μ)2+(x2−μ)2+...++(xn−μ)2]−σ2}E(S2)=1n−1{E[(x1−μ)2+(x2−μ)2+...++(xn−μ)2]−σ2}
기댓값들을 아래와 같이 나눠서 쓰겠습니다.
E(S2)=1n−1{E[(x1−μ)2]+E[(x2−μ)2]+...+E[(xn−μ)2]−σ2}E(S2)=1n−1{E[(x1−μ)2]+E[(x2−μ)2]+...+E[(xn−μ)2]−σ2}
각 기댓값들은 모분산과 같습니다. 이유는 3강에서 설명했습니다. 따라서 아래와 같이 변형됩니다.
E(S2)=1n−1{nσ2−σ2}
시그마 제곱으로 묶어줍시다.
E(S2)=1n−1{n−1}σ2
약분합시다.
E(S2)=σ2
표본분산의 기댓값이 모분산과 같다는 것을 보였습니다.
#강의 영상
'@ 필수과목 > 손으로 푸는 통계' 카테고리의 다른 글
[손으로 푸는 통계] 9. 중심극한정리 설명 (6) | 2018.03.24 |
---|---|
[손으로 푸는 통계] 8. 1~7강 요약(세로영상) (3) | 2018.03.24 |
[손으로 푸는 통계] 7. 크기가 1인 표본평균의 평균과 분산이 모집단과 같은 이유 증명 (4) | 2018.03.24 |
[손으로 푸는 통계] 6. E(XY)=E(X)E(Y) 의 성립조건과 증명 (12) | 2018.03.23 |
[손으로 푸는 통계] 5. 표본평균의 분산이 모분산/n 인 이유(고등학생들 꼭 보세요) (18) | 2018.03.23 |
[손으로 푸는 통계] 3. 표본평균의 평균이 모평균과 같은 이유 (22) | 2018.03.23 |
[손으로 푸는 통계] 2. 자유도와 불편추정량 (왜 n-1로 나누나요?) (10) | 2018.03.23 |
[손으로 푸는 통계] 1. 평균, 편차, 분산, 표준편차 (7) | 2018.03.23 |
댓글
bigpicture님의
글이 좋았다면 응원을 보내주세요!
이 글이 도움이 됐다면, 응원 댓글을 써보세요. 블로거에게 지급되는 응원금은 새로운 창작의 큰 힘이 됩니다.
응원 댓글은 만 14세 이상 카카오계정 이용자라면 누구나 편하게 작성, 결제할 수 있습니다.
글 본문, 댓글 목록 등을 통해 응원한 팬과 응원 댓글, 응원금을 강조해 보여줍니다.
응원금은 앱에서는 인앱결제, 웹에서는 카카오페이 및 신용카드로 결제할 수 있습니다.