본문 바로가기
@ OO의 이해/데이터 없이 하는 검정

[데이터 없이 하는 검정] 3. 데이터는 없고 평균,분산,표본크기만 알아요. 대응표본 t검정 가능한가요?

by bigpicture 2019. 10. 25.
반응형

*데이터가 없는 상황을 가정하고 t검정의 절차를 이해하는 강의입니다. t검정이 무엇인지는 알고 있다고 전제합니다. 

 

한가지 상황을 가정합시다. 탈모약을 개발했고, 임상시험 단계입니다. 탈모환자 50명을 대상으로 투약 전과 후 환자의 모발수를 측정하였습니다. 평균,표준편차를 구해놓고 잠깐 눈을 붙인 사이에 데이터가 날아갔습니다. 대응표본 t검정을 해야하는데 가능할까요? 

 

결론부터 말씀드리면 가능합니다. 

 

우리가 대응표본 t검정을 하는 절차를 생각해봅시다. 표본1과 표본2의 데이터를 엑셀에 입력하고, 통계 도구를 이용하여 검정을 합니다. p값이 계산되어 나오고, 우리는 기각 여부를 결정합니다. 

 

 

 

Step 2의 과정은 엑셀이 알아서 계산해줍니다. 우리는 black box에 데이터를 집어넣고 버튼만 누르면 됩니다. 그런데 지금은 이 black box에서 일어나는 일을 알아야 검정을 할 수 가 있습니다. step2에서 일어나는 과정을 세부적으로 나눠보겠습니다. 

 

 

Step 1에서 필요한 평균, 분산은 알고 있습니다. 자유도는 각각의 표본의 크기에서 1을 빼주면 됩니다. 2-1과정은 해결됐습니다. 2-2과정으로 갑시다. t통계량을 구해야합니다. 아래와 같이 계산합니다. 

 

 

빨간 부분은 쌍을 이루는 데이터의 차이들의 합이고, 파란부분은 데이터의 차이 제곱들의 합입니다. 구할 수 있을까요? 먼저 아래 식부터 봅시다. 

 

 

시그마를 분리합시다. 

 

 

식을 둘로 나눕시다. 

 

 

각 항은 탈모약 복용 전과 후 모발수의 평균입니다. 

 

 

우리가 알고 있는 값입니다. 이번에는 아래 식을 봅시다. 

 

 

괄호 안을 전개합시다. 

 

 

셋으로 분리합시다. 

 

 

첫항과 세번째 항은 분산과 평균을 이용해서 구할 수 있습니다. 문제느 두번째 항인데 두번째 항은 못구합니다. 

 

대응표본 t검정의 경우는 데이터들이 서로 짝을 이루고 있고, 각각의 차이가 검정에 사용되기 때문에 데이터가 없이는 검정이 불가능합니다. 

반응형

댓글