본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계] 23. 통계적 가설 검정 감잡기 3 (유의수준 α, 유의확률 p-value)

by bigpicture 2018. 5. 16.
반응형

오늘은 가설검정에서 사용되는 중요한 개념인 유의수준과 유의확률에 대해 배워볼 것입니다. 그 전에 지난 시간에 배운 내용을 간단히 복습하고 오늘 내용을 배워봅시다.

 

어떤 사람이 모집단의 평균이  $\mu$ 라고 주장하고 있습니다. 우리는 아니라고 생각합니다. 이를 밝혀내기 위해 두 가지 가설을 세웠습니다. 

 

귀무가설 : $E[\bar{X}]=\mu$ (기존의 주장)

대립가설 : $E[\bar{X}] \neq \mu$ (기존의 주장에 반대하는 우리의 주장)

 

기존의 주장이 맞다고 가정하고 진행하겠습니다. 평균이 $\mu$인 모집단에서 크기가 n인 표본평균 분포함수를 정의했습니다. 표본을 뽑지 않아도 분포함수를 정의할 수 있다는 것을 이미 배웠습니다. 아래와 같습니다. 

 

$\bar{X} \sim N \left ( \mu , \frac{\sigma^2}{n} \right )$

 

그래프로 나타내면 아래와 같습니다. 

 

 

이 모집단에서 표본을 하나 뽑아서 평균을 구했습니다. 우리가 뽑은 표본의 평균을 $\bar{X}_{1}$ 라고 합시다. 그래프에 나타내면 아래와 같습니다. 

 

 

이 표본보다 극단적인 값이 뽑힐 확률을 구했더니 0.1%가 나왔습니다. 그래프로 나타내면 아래와 같습니다. 

 

이렇게 구한 0.1%가 유의확률입니다. p-value 라고도 부릅니다. 

 

유의확률(p-value) : 우리가 뽑은 표본평균보다 극단적인 값이 뽑힐 확률

 

귀무가설이 참이라고 가정하고 진행한 결과입니다. 우리에게는 두가지 선택권이 있습니다. 

 

1. 0.1%라는 낮은 확률을 뚫고 표본이 뽑혔다.
2. 애초에 가설이 틀렸다. 

 

2번을 선택하고 싶지만, '기준이 뭔데?' 라는 질문을 받게되면 할 말이 없습니다. 얼마 이하의 확률이 뽑혀야 '희박한' 것일까요? 우리의 선배들은 5% 를 기준으로 정했습니다. 이 5%가 유의수준입니다. 유의수준은 영어로 sigmificant level 이고 기호 $\alpha$를 사용합니다.

 

유의수준($\alpha$) : 귀무가설을 기각시킬 기준이 되는 확률

 

사실 유의수준은 각자 마음대로 정해도 됩니다. 나는 더 타이트한 기준을 적용하고 싶다는 분들은 유의수준을 1%로 놓아도 됩니다. 

 

오늘 배운 유의확률과 유의수준을 요약하면 아래와 같습니다. 

 

유의확률(p-value) : 우리가 뽑은 표본평균보다 극단적인 값이 뽑힐 확률

유의수준($\alpha$) : 귀무가설을 기각시킬 기준이 되는 확률

 

쉽게 이해하면 아래와 같습니다. 

 

유의확률은 우리가 받은 점수이고, 유의수준은 커트라인이다. 

 

커트라인보다 낮아야 우리의 주장인 '대립가설'이 채택됩니다.

 

한가지만 더 짚고 넘어가겠습니다. 위 상황에서 우리는 유의수준을 5%로 놓았습니다. 하지만 귀무가설이 기각되는 조건은 아래와 같습니다. 

 

p-value < 0.025

 

5%가 아니라 2.5%보다 작을 경우 기각됩니다. 왜 그런걸까요? 이유는 다음 시간에 알아봅시다. 

 

 

#영상 강의 

 

 

반응형

댓글