분산을 구하는 변형공식을 유도하는 과정은 아래와 같습니다.
$V(X)=E\left ( (X-\mu)^{2} \right )=\frac{\sum_{i=1}^{n}(X_{i}-\mu)^{2}}{n}$
$V(X)=E\left ( (X-\mu)^{2} \right )=\frac{\sum_{i=1}^{n}X_{i}^{2}-2X_{i}\mu+\mu^{2}}{n}$
$V(X)=E\left ( (X-\mu)^{2} \right )=\frac{
\sum_{i=1}^{n}X_{i}^{2}
-2\mu\sum_{i=1}^{n}X_{i}+
\sum_{i=1}^{n}\mu^{2}
}{n}$
$V(X)=E\left ( (X-\mu)^{2} \right )=\frac{
\sum_{i=1}^{n}X_{i}^{2}
}{n}
+
\frac{
-2\mu\sum_{i=1}^{n}X_{i}
}{n}
+
\frac{
\sum_{i=1}^{n}\mu^{2}
}{n}$
$V(X)=E\left ( (X-\mu)^{2} \right )=\frac{
\sum_{i=1}^{n}X_{i}^{2}
}{n}
+
-2\mu^{2}
+
\mu^{2}$
$V(X)=E\left ( (X-\mu)^{2} \right )=\frac{
\sum_{i=1}^{n}X_{i}^{2}
}{n}
-\mu^{2}
$
만약 표본이라면 분모가 n-1일 것입니다.
$V(X)=E\left ( (X-\mu)^{2} \right )=\frac{
\sum_{i=1}^{n}X_{i}^{2}
-2\mu\sum_{i=1}^{n}X_{i}+
\sum_{i=1}^{n}\mu^{2}
}{n-1}$
아래와 같이 변형합시다.
$V(X)=E\left ( (X-\mu)^{2} \right )=\frac{
\sum_{i=1}^{n}X_{i}^{2}
-2n\mu^{2}+
n\mu^{2}
}{n-1}$
분자를 계산합시다.
$V(X)=E\left ( (X-\mu)^{2} \right )=\frac{
\sum_{i=1}^{n}X_{i}^{2}
-n\mu^{2}
}{n-1}$
아래와 같이 변형합시다.
$V(X)=E\left ( (X-\mu)^{2} \right )=
\frac{
\sum_{i=1}^{n}X_{i}^{2}
}{n-1}
-
\frac{n}{n-1} \mu^{2}$
분산을 구할 때 제곱의 평균 빼기 평균의 제곱이라는 식을 표본에 적용하면 안된다는 것을 알 수 있습니다. 하지만 n이 충분히 크다면 결과가 별 차이 없을 테니 근사적으로 사용해도 문제는 없겠네요.
'@ 통계 교양 > 통계 Tips' 카테고리의 다른 글
p값의 분포는 왜 균등분포일까 (distribution of p-value) (0) | 2021.10.21 |
---|---|
p값에 대한 미국통계협회의 입장발표 (이거 계속 써도 되는겨?) (0) | 2021.10.20 |
평균과 중앙값의 비교와 그래프의 치우침 (0) | 2021.10.19 |
표준편차 vs 평균절대편차 vs 중앙값절대편차 (극단값 민감성 비교) (0) | 2021.10.19 |
카이제곱검정의 대응표본버전 (맥니마, 맥니마 보우커,코크란 Q) (0) | 2021.10.12 |
로그스케일 그래프는 언제 쓰는걸까? (로그-로그 그래프) (0) | 2021.09.24 |
중심극한정리 유도하기 (요약버전) (0) | 2021.09.15 |
상관분석에서 독립변수와 종속변수를 서로 바꿔도 결과가 같을까 (0) | 2021.09.08 |
댓글