본문 바로가기
@선택과목2/손으로 푸는 분산분석

[손으로 푸는 분산분석] 1. 소개

by bigpicture 2022. 12. 23.
반응형

안녕하세요. 본 강의의 제목은 손으로 푸는 분산분석입니다. 분산분석의 원리를 수학적으로 이해해보는 강의입니다. 분산분석의 모든 과정을 수식으로 써가며 이해하는 것이 목적입니다. 선수 과목은 「손으로 푸는 통계」와 「손으로 푸는 등분산검정」입니다. 통계검정의 원리, 등분산검정의 원리를 이해하고 있다고 가정하고 설명합니다. 

 

분산분석은 셋 이상의 집단의 평균을 비교할 때 사용하는 통계검정 방법입니다. 쉽게 생각할 수 있는 예시는 세 반의 수학점수 평균 비교가 있습니다. 그런데 방금 든 예시는 가장 간단한 형태의 분산분석입니다. 분산분석은 독립변수의 개수에 따라 여러가지로 나뉩니다. 방금 든 예시는 독립변수가 한가지인 분산분석입니다.

 

세반의 수학점수 비교에서 독립변수와 종속변수는 무엇일까요?

 

독립변수는 반의 종류이고, 종속변수는 수학점수입니다. 독립변수의 개수는 반의 종류 하나입니다. 종속변수 개수도 수학점수 하나입니다. 이렇게 독립변수와 종속변수가 한개인 분산분석을 일원분산분석이라고 부릅니다. 영어로는 one-way ANOVA 입니다. ANOVA는 analysis of variance 의 줄임말입니다. 

 

독립변수와 종속변수의 종류에 대해서도 이야기해봅시다. 독립변수인 반의 종류는 '범주형 변수'입니다. 종속변수인 점수는 '수치형 변수'입니다. 아래와 같이 정리할 수 있습니다. 

 

분산분석 종류 독립변수 개수 종속변수 개수 독립변수 종류 종속변수 종류
일원분산분석 1개 1개 범주형 수치형

 

분산분석 중에는 독립변수의 개수가 2개 이상인 경우도 있습니다. 독립ㅁ변수의 개수가 2개인 경우의 분산분석을 이원분산분석이라고 부릅니다. 영어로는 two-way ANOVA 입니다. 이원분산의 예시는 '반과 성별에 따른 수학점수 평균 비교'가 있습니다. 독립변수는 반의 종류, 성별 두 가지 입니다. 수학 점수가 반별로 차이가 있는지, 성별에 따라 차이가 있는지를 알고 싶은 경우 사용합니다. 이원분산분석에선는 반과 성별의 상호작용효과도 알아낼 수 있습니다.  표로 정리하면 아래와 같습니다. 

 

분산분석 종류 독립변수 개수 종속변수 개수 독립변수 종류 종속변수 종류
일원분산분석 1개 1개 범주형 수치형
이원분산분석 2개 1개 범주형 수치형

 

독립변수 개수가 3개 이상일 수도 있는데, 너무 복잡한 경우라서 다루지 않겠습니다. 종속변수가 여러개인 경우를 다변량 분산분석이라고 부르는데, 이 경우도 다루지 않겠습니다. 

 

통계분석에서 자주 사용되는 일원분산분석과 이원분산분석을 이해하는 것을 목적으로 합시다. 다음 시간에는 일원분산분석의 귀무가설과 대립가설에 대해 공부해봅시다. 

반응형

댓글