본문 바로가기
@ 통계 교양/통계 Tips

mean vs average vs expected value (구분 가능?)

by bigpicture 2020. 9. 24.
반응형

mean vs average vs expected value (구분 가능?)

 

 

1. mean 

 

아마 mean이 무엇이냐고 누군가 물어보면, 전체 합을 개수로 나눈 값이라고 답하실 것입니다. 그런데 mean 에는 세가지가 종류가 있습니다. Arithmetic mean, Geometric mean, Harmonic mean 입니다. 각각 산술평균, 기하평균, 조화평균이라고 부릅니다. 우리가 mean이라고 이야기할 때는 보통 '산술'평균의 의미로 사용합니다. 

 

 

2. average

 

average는 정의하기가 어려운 개념입니다. 위키피디아에 보면, average는 구어적으로 일련의 숫자들을 대표하는 하나의 숫자라고 되어있습니다. 우리는 average를 무엇으로 알고 있나요? 일련의 숫자들을 다 더한 뒤, 개수로 나눈 값으로 알고 있습니다. 이와 같이 average도 '산술 평균'이라는 의미로 주로 사용됩니다. 

 

여기까지 내용을 도표로 나타내보면 아래와 같습니다. 

 

 

 

3. expected value

 

마지막으로 expected value를 봅시다. 위에서 mean와 average 는 평균이라고 부를 수가 없었습니다. 평균이라고 말하면 둘 중 무엇을 가리키는지 구분이 안가기 때문입니다. 기댓값은 하나라서 기댓값이라고 부를 수 있겠네요. 

 

기댓값이 사용되는 상황을 하나 예로 들어봅시다. 상자에 공이 3개 들어있습니다. 빨간공에는 3, 검정 공에는 6, 흰 공에는 9가 적혀 있습니다. 이 상자에서 공 두개를 꺼내서 평균값이 높에 나오는 사람이 이기는 놀이를 한다고 합시다. 자, 여기서 평균값이라는 말을 '기댓값'으로 바꿔도 괜찮을까요? 아래와 같이 말입니다. 

 

이 공 중에서 두개를 꺼내서 기댓값이 높에 나오는 사람이 이기는 놀이를 한다고 합시다. 

 

문장이 어색해집니다. 두개를 꺼낸 사건이 발생한 뒤에는 무언가를 기대할 수 있는 상황이 아닙니다. 이미 발생한 사건이기 때문입니다. 이미 발생한 사건에는 '평균'이라는 말이 더 알맞습니다. 

 

이건 어떨까요. 

 

위와 같은 상자에서 공을 두개 꺼낼 때, 기댓값은 얼마인가?

 

이 문장은 말이됩니다. 우리가 기대할 수 있는 값은 아래와 같이 계산할 수 있습니다. 

 

빨강, 검정이 꺼내지는 경우의 평균값 : 9x(1/3)

빨강, 흰색이 꺼내지는 경우의 평균값 : 12x(1/3)

흰, 검정이 꺼내지는 경우의 평균값 : 15x(1/3)

 

기댓값 = 9x(1/3)+12x(1/3)+15x(1/3)=12

 

이와 같이 기댓값이라는 말은 전체 사건의 평균 값을 지칭할 때 사용할 수 있습니다. 실제로 사건이 발생한 것은 아니지만, 확률적으로 구할 수 있는 값입니다. 

 

표본평균과 표본평균의평균을 예로 들면, 표본평균은 기댓값이라고 할 수 없습니다. 표본의 평균은 이미 뽑은 표본에서 계산되는 평균값이기 때문입니다. 그러나 표본평균의 평균은 표본평균의 기댓값이라고도 말할 수 있습니다. 

 

지금까지의 전개에 비춰볼 때, 기댓값은 평균에 포함되는 개념이라고 할 수 있습니다. 평균이 더 큰 개념이고, 평균 중에서 아직 발생하지는 않았지만 계산할 수 있는 전체 사건의 평균을 기댓값이라고 부를 수 있는 것입니다. 

 

하지만, mean, average, expected value 모두 산술평균의 의미로 사용해도 대부분의 상황에서 의미를 전달하는데 큰 문제는 없다고 생각합니다. 

 

 

 

p.s) 제가 정리한 하나의 관점이므로 갑론을박이 있을 수 있습니다. 논리적 오류나 무지에 의한 오류에 대한 지적은 언제든 환영합니다. 

반응형

댓글