본문 바로가기
@Q&A/통계 Q&A

[통계 Q&A] 평균과 기댓값이 헷갈립니다.

by bigpicture 2021. 3. 30.
반응형

Question)

평균을 구할 때 어떨 땐 총량으로 나누는 방식으로 하고, 어떨땐 확률이랑 변수를 곱하는데. 두개가 같은건지. xp(x)는 왜 평균을 의미하는지 궁금합니다.

 

 

Answer) 

평균은 원소의 전체합 나누기 원소의 개수로 정의되고 이건 받아들이기 쉬울겁니다. 문제는 기댓값인데요. 확률변수의 기댓값이라는게 등장하고 나서 이해하기가 어려워집니다. 우리가 흔히 알고 있는 산술평균에서 확률변수의 기댓값으로 개념이 확장되어야 합니다. 기댓값을 이해하고 나서 평균과 연결하시면 됩니다. 평균도 기댓값으로 해석할 수 있습니다. 

 

기댓값

확률변수는 값과 확률을 모두 갖습니다. 예를 들어봅시다. 

동전을 한개 던지는 실험에서 앞면이 나오면 500원, 뒷면이 나오면 1000원을 받는다고 합시다. 동전 한번 던진 결과로 받는 돈을 확률 변수 X로 정의합시다. X가 500원일 확률은 0.5이고 X가 1000원일 확률도 0.5입니다. 표로 나타내면 아래와 같습니다. 

 

X P(X)
500 0.5
1000 0.5


우리가 X에게 기대할 수 있는 값이 얼마일까요? 500*0.5+1000*0.5로 750원입니다.

이번에는 동전을 두개 던지는 실험을 가정해봅시다. 앞면 하나당 1000원을 받을 수 있습니다. 받는 돈을 확률변수 X로 정의합시다. 

 

앞면이 나온 횟수 X P(X)
0 0 1/4
1 1000 1/2
2 2000 1/4

 

얼마를 기대할 수 있을까요? 

 

0*0.25+1000*0.5+2000*0.25 입니다. 

 

일반화 시키면 아래와 같습니다. 

 

$E(X)=\sum_{i=1}^{n} x_{i} p(x_{i})$

 

'얼마를 기대할 수 있냐' 라는 질문을 '평균적으로 얼마 받을 수 있나' 로 바꿔볼 수 있습니다. 기댓값과 평균은 의미상 같습니다. 

 

평균과 기댓값 연결하기

산술평균을 구하는 상황을 봅시다. 다섯 과목의 평균점수를 구하고 싶습니다. 과목은 수학,영어,국어,과학,사회 입니다. 각 점수가 100,90,80,70,60 이라면 평균은 아래와 같이 계산됩니다.

 

$Mean=\frac{100+90+80+70+60}{5}$

 

이를 기댓값으로 해석하려면 확률을 부여해야합니다. 현재는 변수의 값만 있는 상황입니다. 

 

X P(X)
100  
90  
80  
70  
60  

 

평균과 같은 결과가 나오려면 각각 1/5 의 확률을 부여하면 됩니다. 

 

X P(X)
100 1/5
90 1/5
80 1/5
70 1/5
60 1/5

 

어떤 의미일까요? '각각의 과목이 발생할 확률'인데, 의미가 어색합니다. 여기서는 확률을 '가중치'로 이해해야합니다. 각각의 중요도를 가중치라고 합니다. 5과목을 똑같이 중요하다고 해석하고 계산한 결과가 평균입니다. 

만약 어느 대학에서 수학에 2배의 가중치를 준다면 아래와 같이 가중치가 바뀔 겁니다. 

X P(X)
100 2/6
90 1/6
80 1/6
70 1/6
60 1/6

 

아래와 같이 정리됩니다. 

확률변수가 아닐 때는 우리가 아는 산술평균으로 구하고, 확률변수일 때는 기댓값으로 구한다. 기댓값은 평균과 의미가 같다. 

확률변수가 아닌 변수의 평균을 기댓값 계산식처럼 해석할 경우 확률을 '가중치'로 이해해야 자연스럽다. 

 

기댓값과 평균의 차이

기댓값과 평균의 의미는 비슷합니다. 얼마나 기대할 수 있냐, 평균이 얼마냐. 혼용해서 써도 큰 문제는 없다고 생각합니다. 하지만 굳이 구분하자면 구분이 불가능한 것은 아닙니다.

 

기댓값은 확률변수에서 구합니다. 각 변수가 값과 확률을 동시에 갖고 있는 경우에 기댓값을 구할 수 있습니다. 반면 평균(산술평균)은 확률변수가 아닌 변수에서 구합니다. 

반응형

댓글