반응형
결정계수는 회귀모델의 독립변수들이 종속변수를 얼마나 잘 설명하고 있는지를 말해준다. 결정계수가 높을 수록 독립변수들이 종속변수를 잘 설명하는 것이다. 그런데 우리는 결정계수가 아니라 수정된 결정계수를 사용한다. 그 이유가 무엇일까?
회귀분석에서는 독립변수가 늘어날 수록 결정계수 가 증가한다. 거지같은(?) 독립변수가 추가되더라도, 결정계수 는 항상 올라간다. 별로 유의하지 않고, 목적에 적합하지 않은 변수라고 해도 결정계수 가 증가하는 것이다. 따라서 결정계수로는 좋은 모델을 선별할 수 없다.
이런 이유로 수정된 결정계수가 등장했다. 수정된 결정계수는 독립변수 개수에 대해 패널티를 부여한다. 독립변수가 많아지면 의도적으로 회귀계수를 감소시키는 것이다. 이렇게 되면, 정말 의미 있는 독립변수라야 수정된 회귀계수를 증가시킬 수가 있게 된다.
반응형
'@ 통계 교양 > 통계 Tips' 카테고리의 다른 글
마르코브 연쇄 쉽게 이해하기 (0) | 2023.11.09 |
---|---|
자기회귀모델 (Autoregressive model) 쉽게 이해하기 (0) | 2023.11.06 |
다중공선성 확인하는 방법 (분산팽창요인 VIF) (0) | 2023.10.30 |
표준화 회귀계수가 뭔가요? (0) | 2023.10.25 |
표본 크기가 커지면 정규성을 따르지 않는 문제 (0) | 2023.09.19 |
머신러닝과 데이터마이닝의 차이 (0) | 2023.08.01 |
최빈값은 언제 쓸까? (mode) (0) | 2023.06.28 |
모집단이 정규분포를 따르면 표본평균은 항상 정규분포를 따를까? (0) | 2023.01.14 |
댓글