1. 독립표본 t검정은 언제쓰는걸까
통계 분석 방법의 종류는 정말 많습니다. 일부만 나열해도 이렇게 많습니다.
정규성검정
등분산검정
일표본 t검정
독립표본t검정
대응표본t검정
윌콕슨순위합검정
윌콕슨부호순위검정
일원분산분석
크루스칼왈리스검정
이원분산분석
다원분삭분석
반복측정분산분석
프라이드먼분석
다변량분산분석
피어슨상관분석
스피어만상관분석
단순선형회귀분석
다중선형회귀분석
다변량단순선형회귀분석
다변량다중선형회귀분석
카이제곱분석
피셔정확검정
신뢰성검정
이렇게 다양한 분석방법이 있는 이유는 상황과 조건에 따라 사용할 수 있는 검정이 다르기 때문일 것입니다. 언제 어떤 검정을 사용해야 하는지 한번쯤 정리해보려고 했는데 이제 시작하게 됐네요.
어던 통계분석을 사용할지 결정할 때 '데이터의 종류' 와 '데이터의 크기' 를 고려해야 합니다. 처음 부터 데이터 종류를 설명하면 맥락이 없어 이해가 잘 안될 것입니다. 그래서 이번 글에서는 가장 많이 사용하는 검정인 독립표본 t검정을 언제 사용하는지 알아보겠습니다.
독립표본 t검정은 언제 사용할까요? 아마 많은 분들이 이렇게 대답하실 것입니다.
"두 그룹의 평균을 비교할 때 사용합니다."
통계를 좀 더 아시는 분들은 이렇게 대답하실 거에요.
"서로 독립인 두 그룹의 평균을 비교할 때 사용합니다.
통계를 좀 더 더 아시는 분들은 이렇게 대답하실 겁니다.
"서로 독립이 두 그룹의 평균을 비교할 때 사용하는데, 표본의 크기가 충분히(30 이상) 크거나, 표본 크기가 10~30인 경우 정규성 검정에서 기각되지 않을 때 사용합니다."
맞습니다. 이번에는 '독립변수'와 '종속변수'라는 관점으로 설명해봅시다. t검정을 적용할 수 있는 자료의 독립변수와 종속변수는 어떤 특징을 가질까요?
쉬운 설명을 위해 예시를 하나 가져와봅시다. 남자 30명과 여자 30명의 키를 비교하는 예제입니다. 독립표본 t검정을 적용할 수 있는 데이터입니다. 이 데이터의 독립변수와 종속변수는 무엇인가요?
독립변수는 성별입니다. 종속변수는 키구요. 집합으로 나타내면 아래와 같습니다.
성별 = {남자, 여자}
키 = {173.1, 165.3, 155.7, 153.8, ...}
성별과 키는 그냥 봐도 다른 종류의 데이터로 보입니다. 성별과 같은 데이터를 '범주형 자료'라고 부릅니다. 키와 같은 데이터는 '수치형 자료' 라고 부릅니다.
독립표본 t검정이 적용 가능하려면 범주형 자료의 원소 수는 두개여야 합니다. 독립표본 t검정에서는 두 집단을 비교하는데, 여기서 두 집단은 범주형 자료의 원소 수를 말합니다. '남자' 와 '여자' 의 비교 또는 'A회사' 와 'B 회사' 의 비교 등입니다. 범주형 자료의 원소 수는 '수준(level)'이라고 부릅니다.
t검정을 사용할 수 있는 데이터의 독립변수와 종속변수는 아래와 같습니다.
<t검정이 적용 가능한 데이터의 조건>
독립변수 : 범주형(2수준)
종속변수 : 수치형
'@ 통계 교양 > 통계 Tips' 카테고리의 다른 글
모비율의 추정 간단 설명 (0) | 2020.08.04 |
---|---|
상관분석은 언제쓰는걸까 (0) | 2020.07.23 |
분산분석은 언제쓰는걸까 (0) | 2020.07.17 |
카이제곱검정은 언제 쓰는걸까 (4) | 2020.07.12 |
음이항분포의 정의는 왜 여러가지일까? (+파스칼분포) (1) | 2020.06.10 |
ROC curve 직접 그려보기 (9) | 2020.06.06 |
표본분산은 꼭 불편추정량이어야 하나요?? (0) | 2020.05.14 |
이항분포를 따르는 두 확률변수의 합의 분포 (2) | 2020.04.17 |
댓글
bigpicture님의
글이 좋았다면 응원을 보내주세요!
이 글이 도움이 됐다면, 응원 댓글을 써보세요. 블로거에게 지급되는 응원금은 새로운 창작의 큰 힘이 됩니다.
응원 댓글은 만 14세 이상 카카오계정 이용자라면 누구나 편하게 작성, 결제할 수 있습니다.
글 본문, 댓글 목록 등을 통해 응원한 팬과 응원 댓글, 응원금을 강조해 보여줍니다.
응원금은 앱에서는 인앱결제, 웹에서는 카카오페이 및 신용카드로 결제할 수 있습니다.