본문 바로가기
@한눈에보기/검정통계량

Levene's test 의 검정통계량 (등분산검정)

by bigpicture 2021. 9. 1.
반응형

Levene's test 는 세 그룹 이상의 등분산검정에 사용합니다. 물론 두 그룹의 비교도 가능합니다. F검정의 경우 세 그룹 이상은 불가합니다. 

 

Levene's test 의 검정통계량은 아래와 같습니다. W도 F처럼 F분포에서의 통계량입니다. 

 

$W=\frac{\frac{\sum_{i=1}^{k}N_{i}\left ( Z_{i.}-Z_{..} \right )^{2} }{k-1}}
{\frac{\sum_{i=1}^{k}\sum_{j=1}^{N_{i}} \left ( Z_{ij}-Z_{i.} \right )^{2}   }{N_{1}+N_{2}+\cdots +N_{k}-k}}$

 

변수들은 아래와 같이 정의됩니다. 

 

$N$ : 전체 원소의 개수 (모든 그룹의 원소 개수의 합) $N_{i}$ 들의 합입니다. 

$k$ : 그룹의 개수

$N_{i}$ : i번째 그룹의 원소 수

$X_{ij}$ : i번째 그룹의 j번째 원소

 

아래는 Z의 정의입니다. 

 

$Z_{ij}=\left | X_{ij}-\mu _{i} \right |$

 

$Z_{i.}=\frac{\sum_{j=1}^{N_{i}}Z_{ij}}{N_{i}}$

 

$Z_{..}=\frac{\sum_{i=1}^{k}\sum_{j=1}^{N_{i}}Z_{ij}}{N}$

 

$Z_{ij}$는 i 번째 그룹 j번째 원소와 $Y_{ij}$에서 i번째 그룹의 평균의 차이입니다. i번째 그룹 내에서 정의된 편차라고 할 수 있습니다. i번째 그룹 j번째 원소의 편차입니다. 

$Z_{i.}$ 는 i번째 그룹의 평균 절대편차입니다. 

$Z_{..}$ 전체 원소의 평균절대편차입니다. 하지만 편차를 구할 때 전체 평균을 가지고 구한 것은 아니고, 해당 그룹의 평균을 이용합니다. 이는 각 그룹의 평균절대편차의 가중치평균입니다. $Z_{..}$을 아래와 같이 변형하면 이해가 되실겁니다. 

 

$Z_{..}=\frac{\sum_{i=1}^{k}\sum_{j=1}^{N_{i}}Z_{ij}}{N}=\frac{\sum_{j=1}^{N_{1}}Z_{1j}+\sum_{j=1}^{N_{2}}Z_{2j}+\sum_{j=1}^{N_{2}}Z_{2j}}{N}=\frac{N_{1}Z_{1.}+N_{2}Z_{2.}+N_{3}Z_{3.}}{N}$

 


분산분석의 통계량과 비교

분산분석의 통계량과 비교하면 W통계량에 대한 이해도를 높일 수 있습니다. 분산분석의 F통계량과 함께 써봅시다. 

 

$W=\frac{\frac{\sum_{i=1}^{k}N_{i}\left ( Z_{i.}-Z_{..} \right )^{2} }{k-1}}
{\frac{\sum_{i=1}^{k}\sum_{j=1}^{N_{i}} \left ( Z_{ij}-Z_{i.} \right )^{2}   }{N_{1}+N_{2}+\cdots +N_{k}-k}}$

 

$F=\frac{
\frac{\sum_{i=1}^{k}N_{i}
\left (\bar{X}_{i.}-\bar{X}_{..} \right )^2}{k-1}
}{
\frac{\sum_{i=1}^{k}\sum_{j=1}^{N_{i}}
\left ( X_{ij}-\bar{X}_{i.} \right )^2}{(N_{1}-1)+(N_{2}-1)+ \cdots + (N_{k}-1)}
}$

 

모양이 동일합니다. ANOVA의 원소 자리에 절대편차가 들어갔습니다. ANOVA가 각 집단의 평균을 비교하는 것이라면, levene's test는 각 집단의 절대편차의 평균을 비교하는 것이라고 이해할 수 있습니다. 


계산하기 쉽게 변형

이번에는 계산하기 쉬운 모양으로 바꿔보겠습니다. 간단히 계산하기 위해 세 그룹을 비교하는 수식에서 변형하겠습니다. 

 

$W=\frac{
\frac{
N_{1}\left ( Z_{1.}-Z_{..} \right )^{2}+
N_{2}\left ( Z_{2.}-Z_{..} \right )^{2}+
N_{3}\left ( Z_{3.}-Z_{..} \right )^{2}
}
{2}
}
{
\frac
{
\sum_{j=1}^{N_{1}} \left ( Z_{1j}-Z_{1.} \right )^{2}+
\sum_{j=1}^{N_{2}} \left ( Z_{2j}-Z_{2.} \right )^{2}+
\sum_{j=1}^{N_{3}} \left ( Z_{3j}-Z_{3.} \right )^{2}
}
{ (N_{1}-1)+(N_{2}-1)+(N_{3}-1)}
}$

 

분모의 분자의 첫항만 따로 떼어서 봅시다. 

 

$\sum_{j=1}^{N_{1}} \left ( Z_{1j}-Z_{1.} \right )^{2}$

 

전개합시다. 

 

$\sum_{j=1}^{N_{1}} \left ( Z_{1j}-Z_{1.} \right )^{2}=\sum_{j=1}^{N_{1}}\left \{ (Z_{1j})^{2}-2Z_{1j}Z_{1.}+(Z_{1.})^{2} \right \}$

 

시그마를 분리해서 써주겠습니다. 

 

$\sum_{j=1}^{N_{1}} \left ( Z_{1j}-Z_{1.} \right )^{2}=
\sum_{j=1}^{N_{1}}(Z_{1j})^{2}-\sum_{j=1}^{N_{1}}2Z_{1j}Z_{1.}+\sum_{j=1}^{N_{1}}(Z_{1.})^{2}$

 

두번째 항에서 시그마와 무관한 변수를 밖으로 꺼내줍니다. 

 

$\sum_{j=1}^{N_{1}} \left ( Z_{1j}-Z_{1.} \right )^{2}=
\sum_{j=1}^{N_{1}}(Z_{1j})^{2}-2Z_{1.}\sum_{j=1}^{N_{1}}Z_{1j}+\sum_{j=1}^{N_{1}}(Z_{1.})^{2}$

 

두번째 항의 시그마항은 $N_{1}Z_{1.}$ 과 같습니다. 

 

$\sum_{j=1}^{N_{1}} \left ( Z_{1j}-Z_{1.} \right )^{2}=
\sum_{j=1}^{N_{1}}(Z_{1j})^{2}-2N_{1}(Z_{1.})^{2}+\sum_{j=1}^{N_{1}}(Z_{1.})^{2}$

 

세번째 항도 아래와 같이 변형됩니다. 

 

$\sum_{j=1}^{N_{1}} \left ( Z_{1j}-Z_{1.} \right )^{2}=
\sum_{j=1}^{N_{1}}(Z_{1j})^{2}-2N_{1}(Z_{1.})^{2}+N_{1}(Z_{1.})^{2}$

 

두번째 항과 세번째 항을 계산합니다. 

 

$\sum_{j=1}^{N_{1}} \left ( Z_{1j}-Z_{1.} \right )^{2}=
\sum_{j=1}^{N_{1}}(Z_{1j})^{2}-N_{1}(Z_{1.})^{2}$

 

첫번째 항의 $Z_{1j}$를 아래와 같이 바꿔 써줍시다. 제곱되므로 절댓값을 없앨 수 있습니다. 

 

$\sum_{j=1}^{N_{1}} \left ( Z_{1j}-Z_{1.} \right )^{2}=
\sum_{j=1}^{N_{1}}(X_{1j}-\mu_{1})^{2}-N_{1}(Z_{1.})^{2}$

 

첫항에 $N_{1}-1$을 곱하고 나눠줍니다. 

 

$\sum_{j=1}^{N_{1}} \left ( Z_{1j}-Z_{1.} \right )^{2}=
(N_{1}-1)\frac{\sum_{j=1}^{N_{1}}(X_{1j}-\mu_{1})^{2}}{N_{1}-1}-N_{1}(Z_{1.})^{2}$

 

그룹 1의 분산입니다. 

 

$\sum_{j=1}^{N_{1}} \left ( Z_{1j}-Z_{1.} \right )^{2}=
(N_{1}-1)s^{2}_{1}-N_{1}(Z_{1.})^{2}$

 

위 변형을 이용하여 원래 식을 변형하면 아래와 같습니다. 

 

$W=\frac{
\frac{
N_{1}\left ( Z_{1.}-Z_{..} \right )^{2}+
N_{2}\left ( Z_{2.}-Z_{..} \right )^{2}+
N_{3}\left ( Z_{3.}-Z_{..} \right )^{2}
}
{2}
}
{
\frac
{
(N_{1}-1)s^{2}_{1}-N_{1}(Z_{1.})^{2}+
(N_{2}-1)s^{2}_{2}-N_{2}(Z_{2.})^{2}+
(N_{3}-1)s^{2}_{3}-N_{3}(Z_{3.})^{2}
}
{ (N_{1}-1)+(N_{2}-1)+(N_{3}-1)}
}$

 

k개 그룹으로 일반화 시키면 아래와 같습니다. 

 

$W=\frac{
\frac{
N_{1}\left ( Z_{1.}-Z_{..} \right )^{2}+
N_{2}\left ( Z_{2.}-Z_{..} \right )^{2}+ \dots +
N_{k}\left ( Z_{k.}-Z_{..} \right )^{2}
}
{k-1}
}
{
\frac
{
(N_{1}-1)s^{2}_{1}-N_{1}(Z_{1.})^{2}+
(N_{2}-1)s^{2}_{2}-N_{2}(Z_{2.})^{2}+ \dots +
(N_{k}-1)s^{2}_{k}-N_{k}(Z_{k.})^{2}
}
{ (N_{1}-1)+(N_{2}-1)+ \dots +(N_{k}-1)}
}$

 

아래 형태가 엑셀 등에서 입력하기 편합니다. 

 

$W=
\frac{(N_{1}-1)+(N_{2}-1)+ \dots +(N_{k}-1)}{k-1}

\frac{
N_{1}\left ( Z_{1.}-Z_{..} \right )^{2}+
N_{2}\left ( Z_{2.}-Z_{..} \right )^{2}+ \dots +
N_{k}\left ( Z_{k.}-Z_{..} \right )^{2}
}
{
(N_{1}-1)s^{2}_{1}-N_{1}(Z_{1.})^{2}+
(N_{2}-1)s^{2}_{2}-N_{2}(Z_{2.})^{2}+ \dots +
(N_{k}-1)s^{2}_{k}-N_{k}(Z_{k.})^{2}
}$

 

반응형

댓글