본문 바로가기
@통계분석 특강/분석

대응표본 t검정 글 하나로 끝내버리기

by bigpicture 2023. 1. 13.
반응형

1. 언제 쓰는 건가요? (수정해야됨)

대응표본 t검정은 서로 대응인 두 집단의 평균을 비교할 때 사용됩니다. 두 집단이라고 표현했지만 사실 같은 대상입니다. 대응표본 t검정은 동일한 집단을 대상으로 전/후 비교를 할 때 사용됩니다. 예를 들어 30명을 모집해서 다이어트약을 먹기 전과 후 몸무게를 비교할 때 사용합니다. 

 

대응표본 t검정을 어떻게 수행하는지 먼저 간단히 이해해봅시다. 처리 전과 후 집단의 차를 구합니다. 예를들면 아래와 같습니다. 다이어트 약을 먹기 전과 후의 몸무게 데이터입니다. 

 

 

이 차이를 가지고 1표본 t검정을 수행합니다. 이 차이가 0인지 아닌지를 알아보는 것이 목적입니다. 이 차이들이 평균이 0인 모집단에서 뽑힌 표본이라고 가정하고 일표본 t검정을 수행하는 것입니다. 

 

2. 독립변수와 종속변수

독립변수와 종속변수 관점으로도 생각해봅시다. 다이어트 약을 먹기 전후 몸무게 비교에서 독립변수는 다이어트 약을 먹기 전/후 입니다. 따라서 독립변수는 '범주형 자료'입니다. 종속변수는 몸무게 이므로 종속변수는 '수치형 자료'입니다. 대응표본 t검정에서의 독립변수와 종속변수는 아래와 같습니다. 

독립변수 : 범주형
종속변수 : 수치형

 

2. 조건

모집단이 정규분포를 따라야 합니다. 정규성검정을 통해서 확인합니다. '차이'데이터를 이용해서 정규성검정을 합니다. 만약 정규성을 만족하지 않는 경우 비모수 검정인 윌콕슨 부호순위 검정을 사용합니다. 

 

3. 정규성검정

정규성검정에는 주로 샤피로-윌크 검정이 사용됩니다. 만약 정규성 검정에서 p값이 0.05 보다 작게 나와서 정규성이 기각 될 경우에는 독립표본 t검정 대신 비모수 검정인 윌콕슨 순위합 검정을 사용합니다. 

 

4. t 검정 절차

정규성검정에서 p값이 0.05 보다 크게 나왔다고 가정합시다. 따라서 t검정을 사용할 수 있습니다. t검정이 어떤 절차로 진행되는지 알아봅시다. 수식이 등장해서 어려울 수 있는데 최대한 간단하게 설명하겠습니다 .

 

가장 먼저 귀무가설과 대립가설을 세웁니다. 귀무가설은 무로 돌아가게 하고 싶은 가설입니다. 대립가설은 우리의 주장을 담고 있는 가설입니다. 

귀무가설 : 모집단의 평균이 $\mu$다. 
대립가설 : 모집단의 평균이 $\mu$가 아니다. 

 

여기서 $\mu$는 알려진 어떤 값입니다. 위 예시에서 과자 내용물의 무게가 30g으로 알려져 있다면 $\mu$는 30입니다. 모집단에서 표본을 뽑습니다. 표본 A라고 놓겠습니다. 알려진 모평균, 표본의 크기, 표본평균, 표본표준편차를 아래와 같이 놓겠습니다. 

알려진 모평균 : $\mu$
표본의 크기 : $n_{A}$
표본 평균 : $\bar{X}_{A}$
표본 표준편차 : $s_{A}$

아래 수식을 이용하여 T 통계량을 구합니다. 

$t=\frac{\bar{X}_{A}-\mu}{\frac{s_{A}}{\sqrt{n}}}$

위 T통계량이 아래와 같은 자유도의 t분포에서 뽑힌 것입니다. 

자유도 : $n-1$

우리가 구한 T통계량 보다 극단적인 영역의 넓이를 t분포에서 구합니다. 이 넓이가 바로 p값입니다. 

우리가 p 값을 직접 구할 일은 없습니다. R을 이용하면 코드 몇 줄이면 구할 수 있습니다. 그렇다고 원리를 이해할 필요가 없는 것은 아닙니다. t검정으로 나온 결과가 어떤 의미인지 제대로 해석하기 위해서는 원리를 알아야 합니다. 

반응형

댓글