본문 바로가기
@선택과목2/손으로 푸는 상관분석

[손으로 푸는 상관분석] 3. 공부 순서 정하기

by bigpicture 2022. 4. 20.
반응형

지난시간에 산관분석 결과를 살펴봤습니다 .상관분석을 하면 t검정 결과인 p값과 상관계수가출력되는데요. 간단한 설명은 아래와 같습니다. 

t검정 : 관계의 유무를 나타냄. p<0.05 인 경우 상관관계 있음

피어슨상관계수 : 관계의 강도를 나타냄. 1에 가까울 수록 양의 상관관계, -1에 가까울 수록 음의 상관관계임

두가지 결과의 대략적인 의미를 이해하는 것은 어렵지 않습니다만. 우리가 궁금한 것은 더 깊은 이해입니다. 수학적으로 직접 전부 계산할 수 있을 정도의 이해를 원합니다. 이러한 이해에 도달하기 위한 앞으로의 공부 순서를 알아봅시다. 

 

상관계수가 무엇인지 알기 위한 공부순서

t검정 보다 상관계수를 이해하는 것이 상대적으로 쉽습니다. 상관계수의 공부순서를 먼저 정해봅시다. 상관계수는 여러가지가 있는데 일단 피어슨상관계수를 먼저 다루겠습니다. 

피어슨 상관계수는 아래와 같이 정의됩니다. 

$\rho_{X,Y}=\frac{cov(X,Y)}{\sigma_{X} \sigma_{Y}}$

X와 Y는 확률변수입니다. 우변의 분자는 X와 Y의 공분산(covariance)입니다. 분모는 각각의 표준편차입니다. 피어슨 상관계수는 공분산을 응용하여 만들었습니다. 아래 공부 순서를 따르면 됩니다.

 

1) 공분산의 탄생

2) 공분산의 의미
3) 공분산 응용해서 피어슨 상관계수 만들기

 

상관분석에서 t검정이 어떻게 쓰였는지 알기 위한 공부순서

여기서 말하는 t검정은 상관분석에서의 t검정을 말합니다. t검정이 상관분석에 어떻게 사용되었는지를 알고 싶은 것입니다. t검정이 무엇인지를 설명하지는 않겠습니다. z검정과 t검정이 무엇인지는 아는 상태라고 가정하겠습니다. 모르시는 분들은 [손으로 푸는 통계] 강의를 먼저 듣고 오실 것을 추천드립니다. 

t검정은 자유도와 t통계량만 알면 쉽게 할 수 있습니다. 상관분석에서 자유도는 n-1입니다. t통계량은 아래와 같습니다. 

$t=r \sqrt{\frac{n-2}{1-r^{2}}}$

이 통계량을 유도하면됩니다.

 

전체 공부 순서 

앞으로 진행할 공부 순서는 아래와 같습니다. 

1) 공분산의 탄생

2) 공분산의 의미
3) 공분산 응용해서 피어슨 상관계수 만들기

4) 상관분석에서의 t통계량 유도하기

반응형

댓글