본문 바로가기
@ 통계 교양/통계 Tips

독립표본 t검정은 언제쓰는걸까

by bigpicture 2020. 7. 12.
반응형

1. 독립표본 t검정은 언제쓰는걸까

 

통계 분석 방법의 종류는 정말 많습니다. 일부만 나열해도 이렇게 많습니다. 

 

정규성검정

등분산검정

일표본 t검정

독립표본t검정

대응표본t검

윌콕슨순위합검정

윌콕슨부호순위검정

 

일원분산분석

크루스칼왈리스검정

이원분산분석

다원분삭분석

반복측정분산분석

프라이드먼분석

다변량분산분석

 

피어슨상관분석

스피어만상관분석

 

단순선형회귀분석

다중선형회귀분석

다변량단순선형회귀분석

다변량다중선형회귀분석

 

카이제곱분석

피셔정확검정

 

신뢰성검정

 

이렇게 다양한 분석방법이 있는 이유는 상황과 조건에 따라 사용할 수 있는 검정이 다르기 때문일 것입니다. 언제 어떤 검정을 사용해야 하는지 한번쯤 정리해보려고 했는데 이제 시작하게 됐네요.

 

어던 통계분석을 사용할지 결정할 때 '데이터의 종류' 와 '데이터의 크기' 를 고려해야 합니다. 처음 부터 데이터 종류를 설명하면 맥락이 없어 이해가 잘 안될 것입니다. 그래서 이번 글에서는 가장 많이 사용하는 검정인 독립표본 t검정을 언제 사용하는지 알아보겠습니다. 

 

독립표본 t검정은 언제 사용할까요? 아마 많은 분들이 이렇게 대답하실 것입니다. 

 

"두 그룹의 평균을 비교할 때 사용합니다."

 

통계를 좀 더 아시는 분들은 이렇게 대답하실 거에요.

 

"서로 독립인 두 그룹의 평균을 비교할 때 사용합니다. 

 

통계를 좀 더 더 아시는 분들은 이렇게 대답하실 겁니다. 

 

"서로 독립이 두 그룹의 평균을 비교할 때 사용하는데, 표본의 크기가 충분히(30 이상) 크거나, 표본 크기가 10~30인 경우 정규성 검정에서 기각되지 않을 때 사용합니다."

맞습니다. 이번에는 '독립변수'와 '종속변수'라는 관점으로 설명해봅시다. t검정을 적용할 수 있는 자료의 독립변수와 종속변수는 어떤 특징을 가질까요? 

 

쉬운 설명을 위해 예시를 하나 가져와봅시다. 남자 30명과 여자 30명의 키를 비교하는 예제입니다. 독립표본 t검정을 적용할 수 있는 데이터입니다. 이 데이터의 독립변수와 종속변수는 무엇인가요? 

 

독립변수는 성별입니다. 종속변수는 키구요. 집합으로 나타내면 아래와 같습니다. 

 

성별 = {남자, 여자}

키 = {173.1, 165.3, 155.7, 153.8, ...}

 

성별과 키는 그냥 봐도 다른 종류의 데이터로 보입니다. 성별과 같은 데이터를 '범주형 자료'라고 부릅니다. 키와 같은 데이터는 '수치형 자료' 라고 부릅니다. 

 

독립표본 t검정이 적용 가능하려면 범주형 자료의 원소 수는 두개여야 합니다. 독립표본 t검정에서는 두 집단을 비교하는데, 여기서 두 집단은 범주형 자료의 원소 수를 말합니다. '남자' 와 '여자' 의 비교 또는 'A회사' 와 'B 회사' 의 비교 등입니다. 범주형 자료의 원소 수는 '수준(level)'이라고 부릅니다.  

 

t검정을 사용할 수 있는 데이터의 독립변수와 종속변수는 아래와 같습니다. 

 

<t검정이 적용 가능한 데이터의 조건>

 

독립변수 : 범주형(2수준)

종속변수 : 수치형

 

반응형

댓글