본문 바로가기
@ OO의 이해/가설검정의 이해

[가설검정의 이해] #1. 통계적 가설검정을 이해하는데 좋은 아주 쉬운 예시

by bigpicture 2021. 12. 30.
반응형

통계적 가설검정이 무엇인지 쉽게 감을 잡을 수 있는 아주아주 쉬운 예시입니다. 

 

여기 동전이 하나 있습니다.

 

 

이 동전은 앞면과 뒷면이 나올 확률이 동일한 동전이라고 알려져 있습니다. 

 

여러분에게 내기를 하나 제안하겠습니다. 이 동전을 던져서 앞면이 나오면 제가 여러분에게 10만원을 드리고, 뒷면가 나오면 여러분이 저에게 10만원을 주시는 겁니다. 여러분 입장에서는 뒷면이 나오면 -10만원이 되는겁니다. 

 

동전 던지기를 20번 했고, 뒷면이 19번 나왔습니다. 여러분은 180만원을 잃으셨어요. 

 

화가난 여러분은 집으로 돌아가서 컴퓨터를 켭니다. 동전을 20번 던져서 앞면이 19번 나올 확률을 계산합니다. 

 

$\binom{20}{19}\left ( \frac{1}{2} \right )^{20}$

 

계산해보니 0.000019(0.0019%)입니다. 100,000번에 두 번 정도 발생할 확률입니다. 여러분은 어떤 생각이 드실 것 같나요? 우연히 이런 일이 벌어졌나 보다 하실건가요. 아니면 동전을 의심해 보실건가요?

 

아마도 "말이 돼? 이건 사기야! 동전 내놔봐!" 라고 절 찾아오실 겁니다. 

 

이 원리가 통계적 가설검정과 비슷합니다. 위 상황에서 귀무가설은 아래와 같습니다. 

 

귀무가설 : 동전의 앞면이 나올 확률과 뒷면이 나올 확률이 같다.

대립가설 : 동전의 앞면이 나올 확률과 뒷면이 나올 확률이 다르다. (양측검정)

 

여기서는 대립가설을 아래와 같이 세우는게 더 맞을 것 같네요. 

 

대립가설 : 동전의 뒷면이 나올 확률이 앞면이 나올 확률보다 크다. (단측검정)

 

뒷면이 많이 나와서 의심을 하는 상황이니까요. 우리는 뒷면이 나올 확률이 높을 것이라 의심합니다. 

 

동전 던지기라는 '시행'을 했고 사건이 발생했습니다. 귀무가설이 참이라는 가정 하에 이 사건이 발생할 확률은 0.0019%입니다. 말도 안되게 낮은 확률의 사건이 발생했기 때문에 귀무가설이 틀렸다고 의심하는 것입니다. 

 

위 예시에서는 동전을 가져가서 직접 확인해볼 수가 있습니다. 하지만 우리가 통계적 가설검정을 하는 상황에서는 모집단 전체를 확인해볼 수가 없습니다. 선택을 해야합니다. 말도안되는 확률의 사건이 발생했다고 볼 것인가, 아니면 귀무가설을 기각하고 대립가설을 채택할 것인가. 통계적 가설검정에서는 귀무가설을 기각합니다. 

 

이야기를 이어서 하도록 하죠. 여러분이 저에게 사기라고 항의하시면 저는 이렇게 반박할겁니다.

 

"낮은 확률의 사건이 발생하면 무조건 사기입니까? 로또 당첨될 확률은 더 낮은데 발생 하잖아요. 로또는 괜찮고 이건 안되요? 무슨 말도 안되는 소리를 하세요" 

 

뭐라고 답하실 건가요?  

반응형

댓글