카이제곱검정은 분할표에서 빈도를 비교하는 것으로 검정을 수행합니다. 빈도를 비교한다는 원리는 동일하지만, 카이제곱분포는 그 목적에 따라 몇가지로 분류됩니다.
- 적합도검정 (Goodness of fit)
- 독립성검정 (Test of Independence)
- 동질성검정 (Test of Homogeneity)
1. 적합도검정 (Goodness of fit)
적합도검정은 범주형인 하나의 변수에 대해, 이 변수가 우리가 기대하는 어떤 분포를 따르는지 여부를 검정합니다. 실제로 관측된 값과 일어날 것으로 기대하고 있는 값을 비교하는 검정입니다. 예제를 통해 이해해봅시다.
상자 안에 흰공, 검은공, 빨간공이 같은 비율로 들어있다고 알려져 있습니다. 공을 90개 뽑았고 각 색의 비율은 아래와 같습니다.
흰공 | 검은공 | 빨간공 | 합계 | |
관찰 | 20 | 10 | 60 | 90 |
만약 공이 정말 같은 비율로 들어있다면 기대되는 빈도는 아래와 같을 것입니다.
흰공 | 검은공 | 빨간공 | 합계 | |
관찰 | 20 | 10 | 60 | 90 |
기대 | 30 | 30 | 30 | 90 |
합계 | 50 | 40 | 90 | 180 |
이제 관찰빈도와 기대빈도를 비교하는 카이제곱검정을 하면 됩니다. 변수의 개수는 몇개인지 생각해봅시다. 변수는 '공의 색' 하나입니다.
여기서 우리는 관찰빈도와 기대빈도를 각각 확률분포로 이해할 수도 있습니다. 확률을 계산하면 아래와 같습니다.
흰공 | 검은공 | 빨간공 | 합계 | |
관찰 | $\frac{2}{9}$ | $\frac{1}{9}$ | $\frac{6}{9}$ | 1 |
기대 | $\frac{3}{9}$ | $\frac{3}{9}$ | $\frac{3}{9}$ | 1 |
변수의 관찰치에 대한 확률분포가 변수의 기대치에 대한 확률분포와 적합한지를 검정하는 것입니다. '적합도 검정'이라는 말이 붙은 이유입니다.
카이제곱 적합도검정의 귀무가설과 대립가설은 아래와 같습니다.
귀무가설 : 변수 X의 관측분포와 기대(이론)분포가 동일하다
대립가설 : 변수 X의 관측분포와 기대(이론)분포가 다르다
2. 독립성검정 (Test of independence)
독립성검정은 범주형인 두 변수가 서로 연관되어 있는지 여부를 검정합니다. 연속형 변수들 사이의 관계를 알아보는 상관분석이 있다면, 범주형 변수에는 독립성검정이 있습니다.
예를 들어봅시다. 성별과 흡연여부의 관계를 알고 싶어서 임의로 200명을 추출하여 성별 및 흡연여부를 조사하였습니다.
흡연 | 비흡연 | 합계 | |
남성 | 46 | 33 | 79 |
여성 | 25 | 96 | 121 |
합계 | 71 | 129 | 200 |
카이제곱 독립성검정의 귀무가설과 대립가설은 아래와 같습니다.
귀무가설 : 변수 X와 Y는 서로 독립이다.
대립가설 : 변수 X와 Y는 서로 독립이 아니다.
3. 동질성 검정 (Test of Homogeneity)
동질성검정은 독립성검정처럼 변수가 2개입니다. 독립성검정이 두 변수의 관계를 알기 위해 하는 검정이지만, 동질성검정은 두 변수의 관계를 알기 위해 하는 검정은 아닙니다. 동질성검정은 한 변수의 요인들에 관심이 있습니다. 요인 보다는 그룹이라고 하는 것이 이해하기 쉽습니다. 각 그룹들이 동질한지 알고 싶은 것입니다. 여기서 동질하다는 것은 확률분포가 같다는 것입니다.
예를 들어봅시다. 남자와 여자의 흡연율 차이가 있는지 알고 싶어서 남자 100명과 여자100명을 대상으로 흡연율을 조사하였습니다.
흡연 | 비흡연 | 합계 | |
남성 | 50 | 50 | 100 |
여성 | 30 | 70 | 100 |
합계 | 80 | 120 | 200 |
이제 남자 그룹과 여자 그룹의 흡연율이 같은지 여부를 알아보기 위한 카이제곱검정을 하면 됩니다.
카이제곱 동질성검정의 귀무가설과 대립가설은 아래와 같습니다.
귀무가설 : 각 그룹의 확률분포가 동일하다.
대립가설 : 각 그룹의 확률분포가 동일하지 않다.
'@ 통계 교양 > 통계 Tips' 카테고리의 다른 글
공분산이란 무엇인가 (정의와 의미) (2) | 2021.04.27 |
---|---|
통계분석 공부순서(t검정,F검정,분산분석,상관분석,회귀분석) (0) | 2021.04.26 |
비율검정과 카이제곱검정은 같은가 다른가 (0) | 2021.03.21 |
독립성검정과 동질성검정의 차이(feat.카이제곱검정) (4) | 2021.03.20 |
평균이 무의미한 경우 (평균값이 크다고 꼭 좋은걸까?) (0) | 2021.03.20 |
모평균의 추정에서 흔히 하는 오해 (0) | 2021.03.17 |
상관계수가 0이라고 관계가 없는게 아니다 (0) | 2021.03.17 |
변수 A,B,C 의 상관관계 (0) | 2021.03.17 |
댓글