본문 바로가기
@ OO의 이해/데이터 없이 하는 검정

[데이터 없이 하는 검정] 2. 데이터는 없고 평균,분산,표본크기만 알아요. 독립표본 t검정 가능한가요?

by bigpicture 2019. 10. 24.
반응형

*데이터가 없는 상황을 가정하고 t검정의 절차를 이해하는 강의입니다. t검정이 무엇인지는 알고 있다고 전제합니다. 

 

한가지 상황을 가정합시다. 두 집단의 데이터를 이용해서 평균,표준편차를 구해놓고 잠깐 눈을 붙인 사이에 데이터가 날아갔습니다. 데이터의 크기는 알고 있는 상태입니다. F검정을 하고 나서 t검정을 할 생각이었습니다. 가능할까요? 

 

결론부터 말씀드리면 가능합니다. 

 

지난 강의에서 F검정을 했구요. 오늘은 t검정을 해봅시다. 

 

우리가 t검정을 하는 절차를 생각해봅시다. 표본1과 표본2의 데이터를 엑셀에 입력하고, 통계 도구를 이용하여 검정을 합니다. p값이 계산되어 나오고, 우리는 기각 여부를 결정합니다. 

 

 

 

Step 2의 과정은 엑셀이 알아서 계산해줍니다. 우리는 black box에 데이터를 집어넣고 버튼만 누르면 됩니다. 그런데 지금은 이 black box에서 일어나는 일을 알아야 검정을 할 수 가 있습니다. step2에서 일어나는 과정을 세부적으로 나눠보겠습니다. 

 

 

2-1 과정에서 필요한 평균, 분산은 알고 있습니다. 자유도를 구해야 하는데요. 자유도는 등분산 가정일 때와 이분산가정일 때가 다릅니다. 등분산가정과 이분산 가정 여부는 F검정 결과로 결정합니다. 

 

F결정 기각 X → 등분산가정

F결정 기각 O → 이분산가정

 

등분산 가정에서 자유도는 아래와 같이 구합니다. (n₁ 과 n₂ 는 표본 1과 2의 자유도입니다.)

 

D.O.F (자유도) = n₁ n₂ - 2

 

이분산 가정에서 자유도는 아래와 같이 구합니다. (s₁ 과 s₂ 는 두 표본의 표준편차입니다.)

 

 

2-1과정은 해결됐습니다. 2-2과정으로 갑시다. t통계량을 구해야합니다. t 통계량은 이분산 가정 여부에 따라 두 가지로 나뉩니다. 

 

<등분산 가정>

 

등분산 가정은 먼저 합동분산을 구해야합니다. 표본의 크기와 표준편차를 알면 구할 수 있습니다. 

 

 

합동분산 s를 대입하여 아래 식으로 구합니다. 분자는 두 표본평균의 차입니다.

 

      

 

 

<이분산 가정>

 

이분산 가정에서는 아래와 같이 구합니다. 분자는 두 표본평균의 차입니다.

 

 

2-2는 해결됐습니다. 2-3으로 갑시다. t분포 함수는 자유도로 결정됩니다. 자유도를 알고 있으니 함수를 결정할 수 있습니다. 함수가 결정되었으니, t통계량을 이용하여 p-value를 구하면 됩니다. 

 

 

t통계량은 두 표본 평균의 크기에 따라 0보다 클 수도 있고, 작을 수도 있습니다. 따라서, p-value가 오른쪽 꼬리 넓이가 될 수도 있고 왼쪽 꼬리 넓이가 될 수도 있습니다. 

 

 

아래는 평균,분산,표본크기만 입력하면 t분포 계산할 수 있도록 만들어놓은 엑셀파일 입니다. 다운로드 하셔서 사용하시면 됩니다. 

 

데이터 없이 하는 t검정.xlsx
다운로드

 

반응형

댓글