1종오류, 2종오류, 유의수준, 표준편차, 표본크기 사이의 관계를 알아봅시다.
한가지 예시를 통해 이들의 관계를 이해해보도록 하겠습니다. 과자 무게 예시입니다.
감자과자를 파는 A회사에서는 과자의 무게 평균이 70g, 표준편차가 5g이라고 주장합니다. 우리는 분명 70g보다 조금 넣었을 것이라 의심하는 상황입니다.
귀무가설과 대립가설을 세워봅시다.
귀무가설 : 모집단 과자무게평균=70
대립가설 : 모집단 과제무게평균<70
크기가 30인 표본을 뽑았다고 가정합시다. 우리는 두가지 분포함수를 그릴 수 있습니다. 귀무가설이 참일 때의 표본평균의 분포와, 대립가설이 참일 때의 표본평균의 분포입니다.
<귀무가설이 참일 때의 표본평균의 분포>
X_bar=N(70,25/30)
<귀무가설이 참일 때의 표본평균의 분포>
X_bar=N(70보다 작은 값,25/30)
그래프로 그려보면 아래와 같습니다. 대립가설이 참일 때의 모집단평균이 얼마인지 알수는 없으므로, 70보다 작은 임의 값으로 넣었습니다. 관계를 확인하는 것이므로 상관없습니다.
유의수준을 정해봅시다. 일반적으로 0.05(5%)로 놓습니다. 유의수준 만큼 그래프에 색칠한 것이 기각역입니다. 유의수준과 기각역의 넓이는 값이 같습니다. 이 기각역의 넓이가 1종오류입니다. 따라서 유의수준, 기각역, 1종오류는 값이 같습니다.
2종오류는 귀무가설이 거짓임에도 기각하지 않는 것이므로, 귀무가설이 거짓인 분포에서 기각역 반대쪽의 넓이입니다.
1종오류와 2종오류의 관계
유의수준이 작아지면, 위 그래프에서 주황 선이 왼쪽으로 이동합니다. 기계적으로 왼쪽으로 이동한다고 외우시면 안되는게, 유의수준이 오른쪽 꼬리에 있다면 유의수준이 작아졌을 때 주황선은 오른쪽으로 이동합니다.
그림에서 주황 선을 오른쪽으로 옮겨보면 쉽게 알 수 있듯, 유의수준과 2종오류의 관계는 반비례관계 입니다.
(유의수준=기각역=1종오류) vs 2종오류 → 반비례 관계
모집단의 표준편차와 표본의 크기가 1종오류에 주는 영향
이번에는 모집단의 표준편차와 표본의 크기를 조절해봅시다. 먼저 한가지를 확인해봅시다.
모집단의 표준편차와 표본의 크기가 유의수준(또는 기각역,1종오류)에 영향을 줄까요?
유의수준은 0.05, 0.01 과 같이 우리가 정하는 상수입니다. 따라서 영향을 주지 않습니다.
(유의수준=기각역=1종오류) vs 모집단의 표준편차 → 관계 없음
(유의수준=기각역=1종오류) vs 표본의 크기 → 관계 없음
모집단의 표준편차가 2종오류에 주는 영향
모집단의 표준편차와 표본의 크기는 표본평균의 표준편차에 영향을 줍니다.
표본평균의 표준편차 = (모집단의 표준편차)/(표본의 크기의 제곱근)
따라서 아래 관계를 갖습니다.
모집단 표준편차 vs 표본평균의 표준편차 → 비례관계
표본의 크기 vs 표본평균의 표준편차 → 반비례관계
위 그림에서 표본평균의 표준편차를 줄여봅시다. 모집단의 표준편차를 5에서 4로 줄였습니다.
표본평균의 표준편차가 줄어들면 2종오류도 줄어들게 됩니다.
모집단 표준편차 ↓ → 표본평균의 표준편차 ↓ → 2종오류 ↓
따라서 모집단의 표준편차와 2종오류의 관계는 아래와 같습니다.
모집단의 표준편차 vs 2종오류 → 비례관계
표본의 크기가 2종오류에 주는 영향
위 그림에서 표본의 크기를 줄여봅시다. 모집단의 표준편차는 4로 두고, 표본크기를 10개로 줄였습니다. 바로 위 그림과 비교하시면 됩니다.
표본의 크기가 줄어들면 2종오류는 늘어나게 됩니다.
표본의 크기 ↓ → 표본평균의 표준편차 ↑ → 2종오류 ↑
따라서 모집단의 표준편차와 2종오류의 관계는 아래와 같습니다.
표본의 크기 vs 2종오류 → 반비례관계
요약
(유의수준=기각역=1종오류) vs 2종오류 → 반비례 관계
(유의수준=기각역=1종오류) vs 모집단의 표준편차 → 관계 없음
(유의수준=기각역=1종오류) vs 표본의 크기 → 관계 없음
모집단의 표준편차 vs 2종오류 → 비례관계
표본의 크기 vs 2종오류 → 반비례관계
'@ 통계 교양 > 통계 Tips (영상)' 카테고리의 다른 글
Welch two sample t-test 가 뭔가요? (0) | 2022.07.10 |
---|---|
통계에서 interobeserver, intraobserver 차이 (0) | 2021.08.10 |
무료 엑셀 통계분석 강의 추천 (직접 끝까지 다들어봄) (0) | 2021.04.24 |
순서도 그려주는 무료 프로그램 (diagrams) (0) | 2021.03.18 |
표본의 크기 vs 표본의 개수 (1) | 2020.11.08 |
확률에 왜 질량과 밀도라는 말이 붙어있나 (확률밀도함수, 확률질량함수) (3) | 2020.09.27 |
책을 읽다 그래프에 등장하는 * ** 별표는 어떤 의미일까?? (0) | 2020.07.11 |
p값은 왜 ~보다 큰 쪽의 확률을 보고 판단하는 건가요??" (0) | 2020.04.25 |
댓글