회귀계수를 추정하는 방법은 아래 그림과 같이 세가지가 있습니다.
최소제곱법과 최대우도법은 지난 글들에서 이미 공부한 상태입니다. 오늘은 세번째 방법인 '오차항 가정 직접법' 에 대해 알아봅시다.
오차항 가정 직접법
아래와 같은 데이터가 있다고 합시다.
$(x_{1},y_{1})$
$(x_{1},y_{1})$
$...$
$(x_{n},y_{n})$
선형모델을 아래와 같이 가정합시다.
$y=\beta_{0}+\beta_{1}x+\varepsilon$
두가지 가정을 하겠습니다.
- 오차항의 평균은 0이다.
- 오차항과 예측변수 x는 서로 독립이다.
선형모델의 양변의 기댓값을 구하면 아래와 같습니다.
$E(y)=E(\beta_{0}+\beta_{1}x+\varepsilon)$
우변을 아래와 같이 분리해서 써줍시다. x와 오차항이 독립이므로 분리가 가능합니다.
$E(y)=E(\beta_{0})+E(\beta_{1}x)+E(\varepsilon)$
아래와 같이 변형합니다. 오차항의 평균은 0입니다.
$E(y)=\beta_{0}+\beta_{1}E(x)$
평균을 bar 로 나타냅시다.
$\bar{y}=\beta_{0}+\beta_{1}\bar{x}$
이번에는 x와 y의 공분산을 구해봅시다.
$Cov(x,y)=E\left [ (x-\bar{x})(y-\bar{y}) \right ]$
아래 두 식을 이용하여 $y-\bar{y}$ 를 변형합니다.
$y=\beta_{0}+\beta_{1}x+\varepsilon$
$\bar{y}=\beta_{0}+\beta_{1}\bar{x}$
$y-\bar{y}=\beta_{1}(x-\bar{x})$
공분산 계산식에 대입합니다.
$Cov(x,y)=E\left [ (x-\bar{x})\beta_{1}(x-\bar{x}) \right ]$
$\beta_{1}$ 을 괄호 밖으로 꺼내주고 아래와 같이 제곱식으로 만들어줍니다.
$Cov(x,y)=\beta_{1}E\left [ (x-\bar{x})^2 \right ]$
기댓값 식은 x의 분산입니다.
$Cov(x,y)=\beta_{1}V(x)$
따라서 $\beta_{1}$ 은 아래와 같습니다.
$\beta_{1}=\frac{Cov(x,y)}{V(x)}$
공분산과 분산은 아래와 같이 구합니다. 표본이므로 n-1로 나눠줍니다.
$\beta_{1}=\frac{
\frac{\sum_{i=1}^{n}(x_{i}-\bar{x})(y_{i}-\bar{y})}{n-1}
}{
\frac{\sum_{i=1}^{n}(x-\bar{x})^2}{n-1}
}$
n-1로 약분하면 분자와 분모는 아래와 같이 변형됩니다.
$\beta_{1}=
\frac{
\sum_{i=1}^{n} (x_{i}-\bar{x})(y_{i}-\bar{y})
}
{
\sum_{i=1}^{n} (x_{i}-\bar{x})^2
}$
분모와 분자를 아래와 같이 간단한 기호로 나타내겠습니다.
$\beta_{1}=
\frac{
S_{xy}
}
{
S_{xx}
}$
요약
추정된 회귀계수에는 hat을 붙여줍니다. 모델로 구한 y값도 hat을 붙여줍니다. 데이터의 실제값은 $y$이고, 추정값은 $\hat{y}$ 입니다.
'@ 통계학 석박사 진학관련 > 회귀분석 요약' 카테고리의 다른 글
[회귀분석] 11. 우리가 구한 회귀모델의 성질 (6가지) (2) | 2021.04.17 |
---|---|
[회귀분석] 10. 세 방법의 회귀계수 추정 결과가 같다는 것 (0) | 2021.04.10 |
[회귀분석] 8. 최대우도법을 이용한 회귀계수 추정 일반화 (0) | 2021.03.26 |
[회귀분석] 7. 최대우도법을 이용한 회귀계수 추정 예시 (0) | 2021.03.26 |
[회귀분석] 6. 최소제곱법을 이용한 회귀계수 추정 일반화 (0) | 2021.03.25 |
[회귀분석] 5. 최소제곱법을 이용한 회귀계수 추정 예시 (0) | 2021.03.25 |
[회귀분석] 4. 회귀 계수의 추정의 세가지 방법 (0) | 2021.03.25 |
[회귀분석] 3. 단순 선형 회귀분석 소개 (2) | 2021.03.22 |
댓글