본문 바로가기
@기초과목/확률과통계 기초

[확률과 통계 기초] 3-24. 자료의 분산 vs 확률변수의 분산

by bigpicture 2024. 7. 29.
반응형

우리는 두가지 분산을 배웠습니다. 

자료의 분산과 확률변수의 분산입니다. 오늘은 두 분산을 비교해보겠습니다. 

자료의 분산은 중학교 수학에서 처음 등장합니다. 우리는 3-21강에서 다뤘습니다.

자료를 예를 들면 아래와 같습니다.

{174,177,183,165,157}

다섯 사람의 키 입니다. 다섯사람 키의 평균은 171.4입니다. 분산은 아래와 같이 구할 수 있습니다. 

$\frac{(174-171.4)^2+(177-171.4)^2+(183-171.4)^2+(165-171.4)^2+(157-171.4)^2}{5}$

일반화 시켜봅시다. 아래와 같이 원소 개수가 n개인 자료가 있습니다. 

$\left \{ x_{1},x_{2},...,x_{n} \right \}$

이 자료의 평균을 m이라고 놓으면 분산은 아래와 같이 정의됩니다. 

$\sum_{i=1}^{n}\frac{\left ( x_{i}-m \right )^2}{n}$

이번에는 확률변수의 분산입니다. 확률변수를 예로 들면 아래와 같습니다. 

“어떤 바구니에 1이 적힌 공이 3개, 2가 적힌 공이 2개, 3이 적힌 공이 5개 들어있습니다. 바구니에서 공 하나를 꺼낼 때 나오는 값”

이 확률변수를 X라고 놓고 표로 나타내면 아래와 같습니다. 

 

 

기댓값은 2.2 입니다. 분산은 아래와 같이 정의됩니다. 

$V[X]=(1-2.2)\times 0.3+(2-2.2)\times 0.2+(3-2.2)\times 0.5$

일반화시켜봅시다. 아래와 같이 원소 개수가 n인 확률변수가 있습니다. 

 

 

이 자료의 기댓값을 m이라고 놓으면분산은 아래와 같이 정의됩니다. 

$V[X]=\sum_{i=1}^{n}(x_{i}-m)^2 p_{i}$

배운 내용을 표로 정리하면 아래와 같습니다 .

 

 

 

https://www.youtube.com/watch?v=yMWntwwAd08

 

반응형

댓글