본문 바로가기
@ 통계 교양/통계 Tips

통계적 가설검정과 귀류법 (통계적 가설검정 쉽게 이해하기)

by bigpicture 2021. 2. 27.
반응형

통계적 가설검정은 알고 나면 쉬운 내용이지만, 익숙해지는데는 생각보다 시간이 걸립니다. 귀무가설, 대립가설, 기각 등의 말이 생소하기 때문이고 우리가 원하는 가설을 입증하는 방식이 직접적이지 않기 때문입니다. 

 

사실 우리는 통계적 가설검정의 원리를 고등학교 혹은 중학교 때부터 사용해왔습니다. 바로 귀류법입니다. 귀류법은 어떤 가설을 사실이라고 가정한 뒤, 이렇게 가정할 경우 모순이 발생한다는 것을 보여서 어떤 가설이 거짓임을 증명하는 방법입니다. 단계로 정리하면 이렇습니다. 

 

- 어떤 가설 A가 참이다.

- A가 참일 경우, 모순이 발생한다. 

- 따라서 A는 거짓이다.

 

아마 많은 분들이 기억하고 있을 대표적인 귀류법으로는 $\sqrt{2}$가 무리수임을 증명하는 사례가 있습니다. $\sqrt{2}$ 를 유리수라고 놓고 수식을 전개한 뒤, 모순이 발생함을 보입니다. 

 

통계적 가설검정도 귀류법과 원리라 같습니다. 모순 대신 '희박한 사건이 발생'을 사용합니다. 

 

- 어떤 가설 H가 참이다. (이를 귀무가설이라고함, H가 거짓이라는 가설은 대립가설)

- H가 참일 경우, 사건 A가 발생할 확률은 희박해진다.

- 그런데 사건 A가 발생했다. 

- 따라서 가설 H는 거짓이다.

 

어느정도 확률을 희박하다고 할지에 대한 정답은 없습니다. 일반적으로 5%로 놓습니다.

 

사건 A가 이미 발생한 상황입니다. 가설H를 참이라고 가정합시다. 이때, 사건 A와 같거나 더 극단적인 사건이 발생할 확률이 5% 미만이라면 가정이 잘못되었다고 결론을 내리는 것입니다. 여기서 왜 사건 A가 발생할 확률로 계산하지 않고, A와 같거나 더 극단적인 사건이 발생할 확률을 계산하는지 의문이 드시는 분들은 아래 글을 참고하시면 됩니다. 

 

p값은 왜 ~보다 큰 쪽의 확률을 보고 판단하는 건가요??

 

하지만 가설검정과 귀류법에는 넘을 수 없는 차이가 존재합니다. 귀류법을 통해 증명된 가설에는 오류가 발생할 여지가 없습니다. 귀류법을 통해 증명된 가설은 참입니다. 하지만 가설검정은 다릅니다. 가설검정은 희박하다고 정한 확률 만큼의 오류를 가집니다. 유의수준 5%로 가설검정을 했고 귀무가설이 기각되었다면, 귀무가설이 참임에도 기각했을 확률이 5%가 됩니다. 이를 1종오류라고 합니다. 

 

 

반응형

댓글