회귀계수를 추정하는 방법은 아래 그림과 같이 세가지가 있습니다.

최소제곱법과 최대우도법은 지난 글들에서 이미 공부한 상태입니다. 오늘은 세번째 방법인 '오차항 가정 직접법' 에 대해 알아봅시다.
오차항 가정 직접법
아래와 같은 데이터가 있다고 합시다.
(x1,y1)
(x1,y1)
...
(xn,yn)
선형모델을 아래와 같이 가정합시다.
y=β0+β1x+ε
두가지 가정을 하겠습니다.
- 오차항의 평균은 0이다.
- 오차항과 예측변수 x는 서로 독립이다.
선형모델의 양변의 기댓값을 구하면 아래와 같습니다.
E(y)=E(β0+β1x+ε)
우변을 아래와 같이 분리해서 써줍시다. x와 오차항이 독립이므로 분리가 가능합니다.
E(y)=E(β0)+E(β1x)+E(ε)
아래와 같이 변형합니다. 오차항의 평균은 0입니다.
E(y)=β0+β1E(x)
평균을 bar 로 나타냅시다.
ˉy=β0+β1ˉx
이번에는 x와 y의 공분산을 구해봅시다.
Cov(x,y)=E[(x−ˉx)(y−ˉy)]
아래 두 식을 이용하여 y−ˉy 를 변형합니다.
y=β0+β1x+ε
ˉy=β0+β1ˉx
y−ˉy=β1(x−ˉx)
공분산 계산식에 대입합니다.
Cov(x,y)=E[(x−ˉx)β1(x−ˉx)]
β1 을 괄호 밖으로 꺼내주고 아래와 같이 제곱식으로 만들어줍니다.
Cov(x,y)=β1E[(x−ˉx)2]
기댓값 식은 x의 분산입니다.
Cov(x,y)=β1V(x)
따라서 β1 은 아래와 같습니다.
β1=Cov(x,y)V(x)
공분산과 분산은 아래와 같이 구합니다. 표본이므로 n-1로 나눠줍니다.
β1=∑ni=1(xi−ˉx)(yi−ˉy)n−1∑ni=1(x−ˉx)2n−1
n-1로 약분하면 분자와 분모는 아래와 같이 변형됩니다.
β1=∑ni=1(xi−ˉx)(yi−ˉy)∑ni=1(xi−ˉx)2
분모와 분자를 아래와 같이 간단한 기호로 나타내겠습니다.
β1=SxySxx
요약
추정된 회귀계수에는 hat을 붙여줍니다. 모델로 구한 y값도 hat을 붙여줍니다. 데이터의 실제값은 y이고, 추정값은 ˆy 입니다.

'@ 통계학 석박사 진학관련 > 회귀분석 요약' 카테고리의 다른 글
[회귀분석] 11. 우리가 구한 회귀모델의 성질 (6가지) (2) | 2021.04.17 |
---|---|
[회귀분석] 10. 세 방법의 회귀계수 추정 결과가 같다는 것 (0) | 2021.04.10 |
[회귀분석] 8. 최대우도법을 이용한 회귀계수 추정 일반화 (0) | 2021.03.26 |
[회귀분석] 7. 최대우도법을 이용한 회귀계수 추정 예시 (0) | 2021.03.26 |
[회귀분석] 6. 최소제곱법을 이용한 회귀계수 추정 일반화 (0) | 2021.03.25 |
[회귀분석] 5. 최소제곱법을 이용한 회귀계수 추정 예시 (0) | 2021.03.25 |
[회귀분석] 4. 회귀 계수의 추정의 세가지 방법 (0) | 2021.03.25 |
[회귀분석] 3. 단순 선형 회귀분석 소개 (2) | 2021.03.22 |
댓글
bigpicture님의
글이 좋았다면 응원을 보내주세요!
이 글이 도움이 됐다면, 응원 댓글을 써보세요. 블로거에게 지급되는 응원금은 새로운 창작의 큰 힘이 됩니다.
응원 댓글은 만 14세 이상 카카오계정 이용자라면 누구나 편하게 작성, 결제할 수 있습니다.
글 본문, 댓글 목록 등을 통해 응원한 팬과 응원 댓글, 응원금을 강조해 보여줍니다.
응원금은 앱에서는 인앱결제, 웹에서는 카카오페이 및 신용카드로 결제할 수 있습니다.