본문 바로가기
@ 통계 교양/통계 Tips

독립성검정과 동질성검정의 차이(feat.카이제곱검정)

by bigpicture 2021. 3. 20.
반응형

카이제곱검정이 목적에 따라 세가지 종류로 나뉩니다. 아래와 같은 세 종류입니다.

 

- 적합도 검정

- 독립성 검정

- 동질성 검정

 

각각에 대한 설명은 링크를 참고하세요. 

 

적합도 검정은 변수가 하나인 경우이므로 구분이 쉽게 되는데, 독립성검정과 동질성검정이 헷갈리실 수 있습니다. 이 번 글에서는 동립성검정과 동질성검정을 구분해보도록 하겠습니다. 

 

지난시간의 예제를 가져옵시다. 

 

아래는 독립성검정의 예시입니다. 

 

  흡연 비흡연 합계
남성 46 33 79
여성 25 96 121
합계 71 129 200

 

아래는 동질성검정의 예시입니다. 

 

  흡연 비흡연 합계
남성 50 50 100
여성 30 70 100
합계 80 120 200

 

일부러 같은 변수로 두 예제를 만들었습니다. 예제를 다르게 하면, 마치 어떤 변수의 조합은 동립성 검정에 알맞고 어떤 변수 조합은 동질성 검정에 알맞다고 오해할 수 있기 때문입니다. 동립성검정과 동질성검정은 변수에 종류에 의해 결정되지 않습니다. 우리의 '관점'과 '표본 추출 방법'에 의해 결정됩니다. 

 

'성별'과 '흡연여부'를 두개의 변수로 취급할지 아니면 '흡연 여부' 만을 변수로 보고, 성별은 비교 대상이 되는 '그룹'으로 해석할지는 우리가 결정하는 것입니다. 

 

만약 '성별'과 '흡연여부'를 두개의 변수로 보고 독립성검정을 하겠다고 결정했다면, 표본추출은 전체집단 하나만 추출합니다. 위 예시에서는 일반인 200명을 임의로 추출하고, 성별과 흡연여부를 조사하였습니다. 

 

만약 '흡연 여부'만을 변수로 보고 남/녀 그룹의 동질성을 비교하고 싶다면, 남자 그룹과 여자그룹의 표본을 각각 추출합니다. 각 표본에서 흡연 여부를 조사합니다. 위 예시에서는 남자 100명, 여자 100명을 각각 임의로 추출하고 흡연여부를 조사하였습니다. 

 

반응형

댓글