본문 바로가기
반응형

상관분석10

t검정 대신 상관분석을 쓸 수 있다고? t 검정 대신 상관분석을 사용할 수 있다는 흥미로운 사실을 한가지 예시를 통해 보여드리겠습니다. 아래와 같이 남자와 여자 각 30명의 키 데이터가 있습니다. 지면 관계상 12명 씩만 나타냈습니다. t검정 먼저 남녀 키를 비교하는 t검정을 해봅시다. 위 데이터의 경우 이분산가정과 등분산가정 결과가 같았습니다. R로 수행한 t-test 결과는 아래와 같습니다. p값만 보면 됩니다. 0.2683이 나옵니다. 상관분석 위 데이터를 이용하여 상관분석을 하려면 어떻게 해야할까요. 남자와 여자의 상관관계를 보는 것은 불가능합니다. 서로 대응되어 있지 않기 때문입니다. 독립변수~종속변수 관계가 필요합니다. 독립변수와 종속변수를 아래와 같이 설정할 경우 상관분석이 가능해집니다. 독립변수 : 성별 종속변수 : 키 성별과 .. 2022. 8. 21.
[손으로 푸는 상관분석] 4. 공분산의 탄생 지난시간에 상관분석을 이해하기 위한 공부순서를 정해봤습니다. 공부 순서는 아래와 같습니다. 1) 공분산의 탄생 2) 공분산의 의미 3) 공분산 응용해서 피어슨 상관계수 만들기 4) 상관분석에서의 t통계량 유도하기 이번 글에서는 공분산의 탄생과정을 이해해봅시다. 공분산은 이름에 '분산'이라는 말이 붙어있습니다. 공분산이 등장한 역사적 배경을 정확히 알지는 못합니다. 예상해 볼 수는 있을겁니다. 제 생각에는 분산을 정의한 수식을 두개의 대응된 변수에 적용해보는 과정에서 탄생한 것 같습니다. X라는 변수가 있다고 합시다. X의 분산은 아래와 같이 정의됩니다. $V[X]=E\left [ \left ( X-\mu_{x} \right )\left ( X-\mu_{x} \right ) \right ]$ Y라는 변수가.. 2022. 4. 22.
[손으로 푸는 상관분석] 3. 공부 순서 정하기 지난시간에 산관분석 결과를 살펴봤습니다 .상관분석을 하면 t검정 결과인 p값과 상관계수가출력되는데요. 간단한 설명은 아래와 같습니다. t검정 : 관계의 유무를 나타냄. p 2022. 4. 20.
[손으로 푸는 상관분석] 2. 상관분석 결과 살펴보기 지난 시간에 아래 데이터를 가지고 상관분석을 했습니다. R에서 상관분석한 결과는 아래와 같았습니다. > cor.test(md$height,md$weight) Pearson's product-moment correlation data: md$height and md$weight t = 4.8325, df = 28, p-value = 4.385e-05 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.4148779 0.8323934 sample estimates: cor 0.6743531 결과를 보이는 대로 써보면 아래와 같습니다. 번호를 붙여서 쓰겠습니다. 1) t = 4.8325 2) df.. 2022. 4. 18.
[손으로 푸는 상관분석] 1. 일단 해보기 가장 만만한 엑셀로 상관분석을 일단 해봅시다. 상관분석이 뭔지 몰라도 괜찮습니다. 아래 데이터를 이용할 것입니다. 30명의 키와 몸무게 데이터입니다. 키는 mm 단위이고, 몸무게는 kg 단위입니다. 데이터 탭에서 '데이터 분석'을 클릭합니다. 통계 데이터분석이라는 창이 뜨면 상관분석을 선택하고 확인을 눌러줍니다. 입력범위를 클릭하고 키와 몸무게 데이터를 선택해줍니다. 열 이름도 포함되도록 선택합니다. 첫째 행 이름표 사용에 체크합니다. 출력범위는 같은 시트 내 적당한 셀을 선택합니다. 확인을 클릭하면 결과가 출력됩니다. 1과 0.67435가 상관계수입니다. 키와 키 사이의 상관계수가 1, 몸무게와 몸무게 사이의 상관계수가1, 키와 몸무게 사이의 상관계수가 0.6735라는 의미입니다. 엑셀에서는 상관계수만.. 2022. 4. 17.
상관분석에서 독립변수와 종속변수를 서로 바꿔도 결과가 같을까 같습니다. 상관분석에서는 독립변수와 종속변수의 구분이 따로 없습니다. 2021. 9. 8.
상관분석 예시모음 피어슨 상관분석은 두 수치형 변수 사이의 선형관계의 강도를 계산하는 방법입니다. -1~1 사이의 값으로 나타나며 -1에 가까울 수록 음의 상관관계 1에 가까울 수록 양의 상관관계를 갖습니다. 독립 또는 종속변수가 수치형이 아니라 명목형인 순위자료인 경우에는 스피어만검정 또는 캔달의 타우 검정을 합니다. 피어슨 상관분석 예시 키와 몸무게의 상관관계 30대 남성 아버지 소득과 자녀 소득의 상관관계 국어점수와 수학점수의 상관관계 광고비용과 매출의 상관관계 스피어만, 캔달타우 상관분석 예시 몸무게 순위와 키 순위의 상관관계 2021. 9. 8.
상관계수가 0이라고 관계가 없는게 아니다 상관관계가 없다는 것은 '선형 관계'가 없다는 것입니다. 상관분석은 선형관계의 여부만을 고려하기 때문입니다. 예를들어 아래와 같은 관계는 포착할 수가 없는 것입니다. 위 그래프에서 X와 Y의 관계는 비선형관계입니다. 선형관계는 없지만 관계가 없다고 할 수는 없습니다. 2021. 3. 17.
상관분석은 언제쓰는걸까 4. 상관분석은 언제쓰는걸까 우리는 a지난 세 강에 걸쳐서 아래 세가지 통게분석방법을 언제 사용하는지 알아보았습니다. '독립표본 t검정' '카이제곱 검정' '분산분석' 오늘은 상관분석을 언제 사용하는지 알아봅시다. 상관분석은 두 변수 사이에 상관관계를 알아볼 때 사용합니다. 더 정학히 말하면 '선형' 관계만을 확인할 수 있습니다. 상관분석을 하면 '상관계수'와 'p 값' 이 구해집니다. 상관계수 값이 1에 가까울 수록 두 변수의 관계는 직선에 가까워집니다. 두 변수로 산점도를 그렸을 때, 점이 완벽히 직선을 이루는 경우의 상관계수가 1입니다. p값은 상관계수가 0인지 아닌지 유의성을 판단합니다. 관계가 있다 혹은 없다를 판단하는 것이고, 관계의 강도는 상관계수로 판단합니다. 상관계수가 1에 가까울 수록 .. 2020. 7. 23.
상관분석을 할 때 주의할 점(이질적 하위표본 효과) 상관분석을 할 때 주의할 점(이질적 하위표본 효과) 상관분석을 할때 주의해야하는 것 중 '이질적 하위표본효과'라는 것이 있습니다. 이질적 하위표본은 heterogeneous subsamples 인데요. 말은 어려운데 예제를 하나 보시면 쉽게 이해하실 수 있을 것입니다. 키와 몸무게 사이의 상관분석을 할 것입니다. 세 집단에 대해 상관분석을 할건데요. 아래 세 집단입니다. - 전체 - 남자 - 여자 데이터는 사이즈코리아라는 사이트에서 가져왔습니다. (사이즈코리아 데이터 다운로드 방법 : https://hsm-edu.tistory.com/727). 사용한 데이터 → 계산한 상관계수는 아래와 같았습니다. - 전체 : 0.61 - 남자 : 0.40 - 여자 : 0.27 아래는 계산에 사용된 R코드입니다. lib.. 2020. 2. 1.
반응형