본문 바로가기
@ 통계학 석박사 진학관련/수리통계학 요약

[수리통계학] #20. 진정한 베이즈정리 (사전확률의 갱신)

by bigpicture 2021. 3. 1.
반응형

진정한 베이즈정리란 제목을 붙인 이유는, 베이즈정리의 실제 응용에 가까운 설명이기 때문입니다.

우리는 앞에서 베이즈정리의 공식을 아래와 같이 유도했습니다. 

$P(A|B)=\frac{P(A)P(B|A)}{P(B)}$

 

앞에서 살펴본 두 예시에서는 사전확률인 P(A)를 알고 있다고 가정했습니다. 하지만 사전확률인 P(A)를 알고 있는 경우에는 베이즈정리라는 거창한 이름을 붙일 것도 없이, 조건부확률과 확률의 기본적인 계산방법만 알면 P(A|B)를 구할 수가 있습니다. 

 

베이즈정리의 진정한 의미는 사전확률을 모르는 상황에서 사전확률을 가정하고, 발생한 사건을 토대로 사전확률을 '갱신'하는데 있습니다. 이번 글에서는 그 이야기를 해보려고 합니다. 

 

그사람이 날 좋아할까 예시

베이즈정리에서 사전확률갱신을 설명하는데 자주 사용되는 예시가 '그 사람이 날 좋아할까?' 예시입니다. 상대가 나를 좋아하는지 궁금한 상황입니다. 여기서 사전확률은 그녀가 날 좋아할 확률입니다. 앞에서 살펴본 예시처럼 기계 $M_{1}$에서 생산된 제품일 확률 이나, 암에 걸린 사람이 확률 처럼 조사를 통해 알 수 있는 확률이 아닙니다. 이런 상황을 베이즈정리가 어떻게 다룰 수 있는지 살펴봅시다. 

 

그 사람은 직장동료라고 합시다. 그 사람이 나를 좋아하는지 아닌지 알 수 없는데, 좋아하는 것 같지도 않고 싫어하지도 않는 것 같다는 주관적 느낌을 기반으로 확률을 '반반'이라고 가정합시다. 따라서 사전확률은 0.5로 놓았습니다. 상대가 나를 좋아하는 사건을 LV 좋아하지 않는 사건을 LV' 이라고 놓겠습니다. 

 

$P(LV)=0.5$

 

이제 상대의 행동을 기반으로 사전확률을 갱신해나갈 것입니다. 갱신이 무엇인지 지금은 모르실텐데 이후 과정을 따라가시면 베이즈갱신이라는 것이 무엇인지 이해하게 되실겁니다. 

 

내 생일이 되었는데, 그 사람이 나에게 생일선물을 주었습니다. 생일선물을 준 사건을 G라고 놓고 베이즈정리를 적용하면 아래와 같습니다. 그 사람이 나에게 생일선물을 주었을 때, 그 사람이 나를 좋아할 확률입니다. 

 

$P(LV|G)=\frac{ P(LV)P(G|LV) }{ P(LV)P(G|LV)+P(LV')P(G|LV') }$

 

위 수식을 계산하기 위해 알아야 할 확률은 아래 두 확률입니다. 

 

$P(G|LV)$ : 직장종료가 나를 좋아하는데 선물을 줄 확률

$P(G|LV')$ : 직장종료가 나를 좋아하지 않는데 선물을 줄 확률

 

위 확률을 구하는 것은 불가능하지는 않습니다. 예시라서 약간 비현실적이긴 한데요. 직장동료에게 선물을 준 사람을 모아서 좋아하는 사람에게 줬는지 조사를 했고 60%는 좋아하는 사람에게 줬다고 합시다. 직장동료에게 선물을 주지 않은 사람을 모아서 좋아하는데 안준건지 조사를 했고 30%는 좋아하는데 안줬다고 합시다. 따라서 위 확률은 아래와 같습니다. 

 

$P(G|LV)=0.6$

$P(G|LV)=0.3$  

 

베이즈정리 식에 대입해봅시다. 

 

$P(LV|G)=\frac{ (0.5)(0.6) }{ (0.5)(0.6)+(0.5)(0.3) }=0.677....$

 

그 사람이 날 좋아할 확률이 0.68 로 업데이트 되었습니다. 이걸 베이즈갱신이라고 합시다. 갱신된 확률을 '사후확률'이라고 합니다. 사후확률은 다시 다음 갱신에서 사전확률이 됩니다. 

 

나를 0.68 확률로 좋아한다고 생각되는 직장동료가 크리스마스에 케잌 기프티콘을 보냈습니다. 크리스마스 케잌을 보낸 사건을 C라고 합시다. 베이즈정리를 적용하면 아래와 같습니다. 그 사람이 나에게 크리스마스선물을 주었을 때, 그 사람이 나를 좋아할 확률입니다. $P(LV)$에는 갱신된 확률인 0.68입니다. 

 

$P(LV|G)=\frac{ P(LV)P(C|LV) }{ P(LV)P(C|LV)+P(LV')P(C|LV') }$

 

위 수식을 계산하기 위해 알아야 할 확률은 아래 두 확률입니다.

 

$P(C|LV)$ : 직장동료가 크리스마스 케잌 기프티콘을 줬을 때, 좋아하는 사람일 확률

$P(C|LV')$ : 직장동료가 크리스마스 케잌 기프티콘을 주지 않았을 때, 좋아하는 사람일 확률

 

나머지는 같은 작업의 반복이라 이쯤 하겠습니다. 

반응형

댓글