본문 바로가기
@ 필수과목/손으로 푸는 통계

[손으로 푸는 통계] 25. 통계적 가설검정 감잡기 5 (1종오류 vs 2종오류)

by bigpicture 2018. 5. 21.
반응형

통계적 가설검정은 귀무가설과 대립가설을 세우고 p값에 따라 기각 여부를 결정하는 것을 말합니다. 통계적 가설검정에는 아래와 같은 네 가지 상황이 발생할 수 있습니다.

1. 귀무가설이 참 → 채택
2. 귀무가설이 참 → 기각 (1종 오류, α 오류)
3. 귀무가설이 거짓 → 채택 (2종 오류, β 오류) 
4. 귀무가설이 거짓 → 기각

쉽게 이해하기 위해 아래와 같은 표를 만들어 봅시다. 

 

 

통계적 가설검정은 확률이 개입되기 때문에 항상 옳은 결정을 내릴 수 없습니다. 실제로 귀무가설이 참인데 기각할 수도 있고, 귀무가설이 거짓인데 채택할 수도 있습니다. 이러한 잘못된 선택을 오류라고 합니다. 귀무가설이 참인데도 기각하는 오류를 1종오류 또는 α 오류라고 합니다. 귀무가설이 거짓인데도 기각을 하지 않는 오류를 2종오류 또는 β 라고 합니다. 각 오류를 하나씩 자세히 알아봅시다. 

 

1종 오류

1종 오류는 귀무가설이 참인 상황에서, 우리가 뽑은 표본이 실제로 기각역에서 뽑힐 때 발생합니다. 낮은 확률의 사건이 발생한 것입니다. 그럴리 없다고 생각해서 기각했는데 그런 일이 벌어진 것이죠.

 

기각역의 넓이는 유의수준과 같으므로, 1종 오류가 발생할 확률은 유의수준 α 와 같습니다. 1종 오류를 α오류라고 부르는 이유입니다. 

 

귀무가설이 참일 때, 1종 오류가 발생하지 않을 확률은 1-α 입니다. 만약 유의수준이 5% 라면, 귀무가설이 참일 때 옳은 결정을 할 확률은 95%가 됩니다. 

 

2종오류

2종오류는 귀무가설이 거짓인 상황에서 발생합니다. 누군가 귀무가설의 평균이 $\mu$ 라고 주장하는데, 실제는 A가 아닌 $\mu_{2}$ 라고 해봅시다. 이 상황을 확률분포로 표현하면 아래와 같습니다. 표본평균의 분포인데요. 귀무가설이 주장하는 분포는 표본평균의 평균이 A인 분포입니다. 실제의 분포는 A와는 다른 평균을 갖는 분포이죠. 서로 다른 두개의 분포를 그리면 됩니다. 단측검정을 예로 들면 아래와 같이 기각역을 표시할 수 있습니다. 

.우리가 표본을 뽑는 모집단의 실제 분포는 오른쪽 분포이므로, 귀무가설이 거짓임에도 채택할 확률은 β입니다. 따라서 2종오류의 확률은 β입니다. 2종오류는 β오류라고도 부릅니다.

 

귀무가설이 거짓일 때, 2종오류가 발생하지 않을 확률은 1-β입니다. 귀무가설이 거짓인 상황에서 옳은 결정을 할 확률입니다. 

 

1종오류와 2종오류는 trade-off 관계를 갖습니다. 위 기각역을 오른쪽으로 이동시키면 1종오류인 α는 줄어들지만 2종오류인 β는 늘어나게 됩니다. 기각역을 왼쪽으로 이동시키면 반대의 결과가 나타납니다. 

 

 

#영상 강의

 

반응형

댓글