본문 바로가기
반응형

카이제곱검정9

[손으로 푸는 카이제곱검정] 1. 프롤로그 이 강의는 카이제곱검정에 대한 강의입니다. 카이제곱 검정의 원리를 수학적으로 자세하게 이해하는 것이 목적입니다. 카이제곱검정이 언제 사용되는지 알아볼건데요. 먼저 질문을 하나 던지겠습니다. 30대 남자와 여자의 흡연율에 차이가 있는지 알아보고 싶다면 어떻게 해야 할까요? 30대 남자 집단과 30대 여자 집단 전체를 조사하고 흡연율을 비교하는 것이 가장 정확한 방법일 것입니다. 하지만 아직까지 전수조사는 쉽지 않습니다. 기술적으로는 거의 가능해보이지만 시행하는 것은 또다른 문제 같습니다. 한달에 한번 의무적으로 조사에 참여하도록 하는 법이 생기면 가능할 수도 있겠습니다. 아무튼 전수조사는 어렵기 때문에 표본을 뽑습니다. 표본도 잘 뽑아야 됩니다. 남자 표본은 흡연실에서 뽑고, 여자 표본은 임산부 중에서 뽑.. 2023. 12. 14.
카이제곱검정도 양측검정이 있을까? 이론적으로는 가능하나 쓸 일은 거의 없습니다. 카이제곱검정은 단측 검정만 사용합니다. 카이제곱검정은 관측빈도와 기대빈도가 다른지 여부를 판단할 때 사용하는 검정입니다. 예를 들어 20대와 30대의 핸드폰 선호 비율을 비교할 때 사용합니다. 우측 꼬리 검정이 사용됩니다. 카이제곱분포의 우측으로 갈 수록 기대빈도와 관측빈도가 달라지고, 좌측을 갈 수록 같아집니다. 기대빈도와 관측빈도가 완전히 같으면 확률변수가 0이 됩니다. 만약 좌측 꼬리검정을 한다면 의미가 이상해집니다. 관측빈도와 기대빈도가 너무 같아서 기각해버리는 상황이 됩니다. 이런 검정을 쓸 일은 없을 것으로 생각됩니다. 정규분포 그래프를 보면 양쪽 꼬리로 갈 수록 귀무가설의 모평균과 달라지게 됩니다. 따라서 단측 검정이 의미가 있습니다. 그러나 카.. 2022. 4. 1.
카이제곱검정의 대응표본버전 (맥니마, 맥니마 보우커,코크란 Q) t검정에 '독립표본 t검정'과 '대응표본 t검정'이 있듯 카이제곱검정에도 대응표본에 사용되는 검정이 있습니다. 아래의 세 검정입니다. - 맥니마 검정 (2그룹비교, 종속변수도 2level) - 맥니바 보우커 검정 (2그룹비교, 종속변수가 3level 이상) - 코크란 Q검정 (3그룹 이상 비교 가능) 맥니마검정 먼저 맥니마 검정이 사용되는 경우를 살펴봅시다. 피험자 100명을 모집하여 무서운 영화 선호 여부를 조사했습니다. 100명 중 10명이 무서운영화를 선호했습니다. 100명에게 A라는 약을 먹인 뒤 다시 조사해보니 50명이 무서운 영화를 선호했습니다. 표로 나타내면 아래와 같을 것 같지만 아닙니다. 아래 표에는 누가 어떻게 바뀌었는지가 반영되어 있지 않습니다. 약먹기 전 약 먹은 후 합계 무서운영화.. 2021. 10. 12.
카이제곱검정 예시 모음 (2수준) 카이제곱검정은 집단들의 비율을 비교하는 검정입니다. 일반적으로 두 집단의 비율 비교에 주로 사용하며 세 집단 이상 비교할 경우 사후검정을 해야 어느 집단 사이에 차이가 있는지 알 수 있습니다. 독립변수와 종속변수 모두 범주형입니다. 예시1) 20대와 30대의 A사와 B사 제품 선호 비율 A사 B사 Total 20대 30 70 100 30대 40 60 100 Total 70 130 200 독립변수 : 나이 (2수준) 종속변수 : 선호회사 (2수준) 귀무가설 : 비율 차이가 없다. 2021. 9. 6.
카이제곱검정의 검정통계량과 자유도 아래와 같은 교차표가 있다고 합시다. Oij 는 i행j 열의 값입니다. O는 Observed value(관측값)을 의미합니다. 1열 2열 ... n열 Total 1행 O11 O12 ... O1n R1 2행 O21 O22 ... O2n R2 Total C1 C2 ... Cn N 아래는 기대빈도입니다. 1열 2열 ... n열 Total 1행 C1*(R1/N) C2*(R1/N) ... Cn*(R1/N) R1 2행 C2*(R2/N) C2*(R2/N) ... Cn*(R2/N) R2 Total C1 C2 ... Cn N 기대빈도는 Expected Value의 첫글자를 따서 Eij로 표현합시다. 1열 2열 ... n열 Total 1행 E11 = C1*(R1/N) E12 = C2*(R1/N) ... E1n = Cn*(.. 2021. 8. 30.
[통계분석의 분류] 5. 카이제곱검정의 분류 1. 설명 카이제곱검정은 집단들의 비율을 비교하는 검정입니다. 일반적으로 두 집단의 비율 비교에 주로 사용하며 세 집단 이상 비교할 경우 사후검정을 해야 어느 집단 사이에 차이가 있는지 알 수 있습니다. 2. 변수 카이제곱검정에 사용되는 독립변수와 종속변수를 이해해 봅시다. 한가지 예시를 통해 설명하겠습니다. 남녀 각 100명의 혈액형을 조사하였고 결과는 아래와 같습니다. A B O AB Total 남 10 30 25 35 100 여 15 20 30 35 100 Total 25 50 55 70 200 독립변수와 종속변수를 찾아봅시다. 독립변수는 성별입니다. 성별은 둘로 나눠지므로 2수준(level)인 범주형변수입니다. 종속변수는 혈액형이고 넷으로 나뉘므로 4수준인 범주형 변수입니다. 독립변수 : 성별 (.. 2021. 8. 30.
비율검정과 카이제곱검정은 같은가 다른가 비율검정과 카이제곱검정을 두고 헷갈려 하시는 분들이 계실거라 생각됩니다. 뭔가 비슷한 것 같기도 한데 막상 구분해서 설명하자니 어려운 그런 혼란을 저도 겪었습니다. 오늘은 그 애매함을 해결해보도록 하겠습니다. 여기서 말하는 비율검정이란 일표본 비율검정과 이표본 비율검정을 말합니다. 일표본 비율검정 : 모비율과 표본 비율을 비교 이표본 비율검정 : 두 표본 비율을 비교 결론부터 말씀드리면 일표본 비율검정은 카이제곱 2수준 적합도검정과 같습니다. 이표본 비율검정은 2x2 분할표에서의 동질성검정과 같습니다. 왜 그런지 하나씩 알아봅시다. 1. 일표본 비율검정과 카이제곱 2수준 적합도검정 1-1) 일표본 비율검정 일표본 비율검정의 예시 하나를 가져옵시다. 한국 남성의 흡연율이 60%라고 알려져 있다. 이를 확인.. 2021. 3. 21.
카이제곱 검정이 세 종류나 있었어?(적합도, 독립성, 동질성) 카이제곱검정은 분할표에서 빈도를 비교하는 것으로 검정을 수행합니다. 빈도를 비교한다는 원리는 동일하지만, 카이제곱분포는 그 목적에 따라 몇가지로 분류됩니다. - 적합도검정 (Goodness of fit) - 독립성검정 (Test of Independence) - 동질성검정 (Test of Homogeneity) 1. 적합도검정 (Goodness of fit) 적합도검정은 범주형인 하나의 변수에 대해, 이 변수가 우리가 기대하는 어떤 분포를 따르는지 여부를 검정합니다. 실제로 관측된 값과 일어날 것으로 기대하고 있는 값을 비교하는 검정입니다. 예제를 통해 이해해봅시다. 상자 안에 흰공, 검은공, 빨간공이 같은 비율로 들어있다고 알려져 있습니다. 공을 90개 뽑았고 각 색의 비율은 아래와 같습니다. 흰공 검.. 2021. 3. 20.
카이제곱검정은 언제 쓰는걸까 통계분석 언제쓰나 2. 카이제곱검정은 언제 쓰는걸까 지난 글에서는 t검정을 언제 사용할 수 있는지 알아보았습니다. 어떤 상황에 어느 검정을 쓰는지 일반화하여 표나, 디시전트리로 정리하는 것이 목적인데요. 일단 감을 잡아햐 하니, 몇개의 대표적인 검정들을 살펴보고 있는 것입니다. 이번 글에서는 카이제곱검정을 언제 사용하는지 알아봅시다. 카이제곱검정의 대표적인 예시는 폐암과, 흡연입니다. 폐암환자 100명과, 정상인 100명을 모집했습니다. 폐암 환자중 흡연자는 30명이었고, 정상인 중 흡연자는 10명이었습니다. 자료를 표로 나타내면 아래와 같습니다. 폐암 정상 합계 흡연 30 10 40 비흡연 70 90 160 합계 100 100 200 카이제곱검정을 하면 폐암과 흡연의 연관성을 알 수 있습니다. 폐암에 .. 2020. 7. 12.
반응형