본문 바로가기
@ 통계 교양/통계 Tips

상관분석은 언제쓰는걸까

by bigpicture 2020. 7. 23.
반응형

4. 상관분석은 언제쓰는걸까

 

우리는 a지난 세 강에 걸쳐서 아래 세가지 통게분석방법을 언제 사용하는지 알아보았습니다.

 

'독립표본 t검정' 

'카이제곱 검정'

'분산분석'

 

오늘은 상관분석을 언제 사용하는지 알아봅시다. 

 

상관분석은 두 변수 사이에 상관관계를 알아볼 때 사용합니다. 더 정학히 말하면 '선형' 관계만을 확인할 수 있습니다. 

 

상관분석을 하면 '상관계수'와 'p 값' 이 구해집니다. 상관계수 값이 1에 가까울 수록 두 변수의 관계는 직선에 가까워집니다. 두 변수로 산점도를 그렸을 때, 점이 완벽히 직선을 이루는 경우의 상관계수가 1입니다. 

 

p값은 상관계수가 0인지 아닌지 유의성을 판단합니다. 관계가 있다 혹은 없다를 판단하는 것이고, 관계의 강도는 상관계수로 판단합니다. 상관계수가 1에 가까울 수록 강한 상관관계입니다. 

 

예를 들어봅시다. 

 

100명의 키와 몸무게가 있습니다. 키와 몸무게가 상관관계가 있는지 알고 싶은 경우 상관분석을 합니다. 

 

상관분석에서 독립변수와 종속변수를 알아봅시다. 위 예제에서 독립변수는 키입니다. 종속변수는 몸무게입니다. 집합으로 나타내면 아래와 같습니다.

 

독립변수 = {173.5, 154.6, 166.7, 182.3,...}

종속변수 = {65.7, 66.8, 72.4, 82.1,...}

 

독립변수와 종속변수는 쌍을 이루어야 합니다. 독립변수와 종속변수 모두 수치형자료입니다. 

 

<상관분석이 적용 가능한 데이터의 조건>

 

독립변수 : 수치형

종속변수 : 수치형 

 

독립변수와 종속변수는 서로 대응관계

 

반응형

댓글