본문 바로가기
@선택과목2/손으로 푸는 상관분석

[손으로 푸는 상관분석] 2. 상관분석 결과 살펴보기

by bigpicture 2022. 4. 18.
반응형

지난 시간에 아래 데이터를 가지고 상관분석을 했습니다. 

 

 

R에서 상관분석한 결과는 아래와 같았습니다. 

 

> cor.test(md$height,md$weight)

	Pearson's product-moment correlation

data:  md$height and md$weight
t = 4.8325, df = 28, p-value = 4.385e-05
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.4148779 0.8323934
sample estimates:
      cor 
0.6743531

 

결과를 보이는 대로 써보면 아래와 같습니다. 번호를 붙여서 쓰겠습니다. 

 

1) t = 4.8325

2) df = 28

3) p-value = 4.385e-05

4) 95 percent confidence interval : 0.4148779 0.8323934

5) cor 0.6743531

 

t는 t검정을 할 때의 t값입니다. df는 사용한 t분포의 자유도구요. p-value 는 t검정의 유의확률입니다. 95 percent confidence interval 은 t분포의 95% 신뢰구간입니다. 따라서 1~4번은 t검정과 관련된 값입니다. 

 

5번은 상관계수입니다. 

 

위 결과의 의미를 정확히 알지는 못하는 상태지만, 적어도 두가지는 알 수 있습니다. 상관분석에서는 t검정을하고, 상관계수를 구한다는 사실입니다. 

 

다음시간 부터는 수학적인 원리를 알아볼 것인데요. 원리가 궁금하지 않고 대략적인 의미만 알고 싶은 분도 계실 수 있으니 여기서 설명하고 넘어가겠습니다. 

 

상관분석에서 t검정의 귀무가설과 대립가설은 아래와 같습니다. 

 

귀무가설 : 상관계수가 0이다.

대립가설 : 상관계수가 0이 아니다. 

 

상관분석의 t검정은 상관계수가 0인지 아닌지를 검정합니다. 만약 p값이 0.05 이하로 나왔다면 상관계수는 0이 아니라고 할 수 있습니다. 상관계수가 0이면 두 변수는 아무 관계가 없는 것입니다. 0이 아니라면 관계가 있는 것이구요. 따라서 상관분석에서의 t검정은 관계의 유무를 알려줍니다. 

 

상관계수는 두 변수가 얼마나 상관있는지를 나타대는 수치입니다. 피어슨 상관계수, 스피어만 상관계수, 크론바흐 알파 등 여러종류가 있는데요. 엑셀에서 계산해주는 상관계수는 피어슨 상관계수입니다. 피어슨상관계수는 -1~1 사이 값을 갖습니다. 1에 가까울 수록 양의 상관관계를 갖는 것이고, -1에 가까울 수록 음의 상관관계를 갖습니다. 상관계수는 관계의 강도를 나타냅니다. 

 

상관계수가 얼마 이상이어야 관계가 충분히 있는거냐? 라는 대답은 존재하지 않습니다. 정답이 없습니다. 문헌마다 기준이 다르긴 한데, 제가 찾은 기준 하나를 공유드립니다. 

 

0.0~0.2 : very weak correlation (or negligible)
0.2~0.4 : weak correlation
0.4~0.6 : moderate correlation
0.6~0.8 : strong correlation
0.8~1.0 : very strong correlation

 

음의 상관관계의 경우 위 값에다가 (-) 를 붙이면 됩니다. 

 

오늘 배운 내용을 정리해보면 아래와 같습니다. 

 

t검정 : 관계의 유무를 나타냄. p<0.05 인 경우 상관관계 있음

피어슨상관계수 : 관계의 강도를 나타냄. 1에 가까울 수록 양의 상관관계, -1에 가까울 수록 음의 상관관계임

반응형

댓글