본문 바로가기
반응형

@통계분석 특강5

카이제곱분포 글 하나로 끝내버리기 1. 어디에 사용되나? 1) 카이제곱분포는 t분포 유도에 사용됩니다. t분포 유도에는 확률변수 $\frac{ns^2}{\sigma^2}$ 가 사용되는데, 이 확률변수가 n자유도 카이제곱분포를 따르기 때문입니다. $s^2$은 표본분산, $\sigma^2$은 모분산입니다. 2) 카이제곱검정에 사용됩니다. 2. 어떻게 생겼나요? 카이제곱분포도 t분포처럼 '자유도'에 따라 모양이 결정됩니다. t분포에서 자유도는 표본크기에서 1을 뺀 값이었는데요. 카이제곱분포 자유도의 의미는 뒤에서 설명하겠습니다. k자유도 카이제곱분포 함수는 아래와 같습니다. $f(x)=\frac{1}{2^{\frac{k}{2}}\Gamma\left ( \frac{k}{2} \right ) }x^{\frac{k}{2}-1}e^{-\frac{x}.. 2023. 1. 14.
t분포 글 하나로 끝내버리기 1. 어디에 사용되나요? t분표는 t검정에 사용됩니다. t검정이 분산분석의 사후분석, 상관분석, 회귀분석 과정에도 사용되기 때문에 t분포가 이러한 검정에서 사용된다고 할 수 있습니다. 2. 어떻게 생겼나요? t분포 함수의 수식은 아래와 같습니다. $f(t)=\frac{\Gamma\left ( \frac{\nu+1}{2} \right )}{\sqrt{\nu \pi}\ \Gamma\left ( \frac{\nu}{2} \right )} \left ( 1+\frac{t^2}{\nu} \right )^{-\left ( \frac{\nu+1}{2} \right )}$ t분포의 모양을 결정하는 파라미터는 $\nu$ 하나밖에 없습니다. $\nu$는 자유도입니다. 표본 크기가 n 인 경우 자유도 $\nu$는 n-1입니.. 2023. 1. 14.
대응표본 t검정 글 하나로 끝내버리기 1. 언제 쓰는 건가요? (수정해야됨) 대응표본 t검정은 서로 대응인 두 집단의 평균을 비교할 때 사용됩니다. 두 집단이라고 표현했지만 사실 같은 대상입니다. 대응표본 t검정은 동일한 집단을 대상으로 전/후 비교를 할 때 사용됩니다. 예를 들어 30명을 모집해서 다이어트약을 먹기 전과 후 몸무게를 비교할 때 사용합니다. 대응표본 t검정을 어떻게 수행하는지 먼저 간단히 이해해봅시다. 처리 전과 후 집단의 차를 구합니다. 예를들면 아래와 같습니다. 다이어트 약을 먹기 전과 후의 몸무게 데이터입니다. 이 차이를 가지고 1표본 t검정을 수행합니다. 이 차이가 0인지 아닌지를 알아보는 것이 목적입니다. 이 차이들이 평균이 0인 모집단에서 뽑힌 표본이라고 가정하고 일표본 t검정을 수행하는 것입니다. 2. 독립변수와.. 2023. 1. 13.
독립표본 t검정 글 하나로 끝내버리기 1. 언제 쓰는 건가요? 독립표본 t검정은 서로 독립인 두 집단의 평균을 비교할 때 사용합니다. 예를 들면 서울 시민 남자의 키와 여자의 키 비교가 있습니다. 2. 독립변수와 종속변수 독립변수와 종속변수 관점으로도 생각해봅시다. 서울 시민의 남녀 키 비교에서 독립변수는 성별입니다. 성별이 달라졌을 때 키가 달라지는지 알고 싶은 것이기 때문입니다. 따라서 독립변수는 '범주형 자료'입니다. 종속변수는 키 이므로 종속변수는 '수치형 자료'입니다. t검정에서의 독립변수와 종속변수는 아래와 같습니다. 독립변수 : 범주형 종속변수 : 수치형 2. 조건 1) 두 집단이 서로 독립이어야 합니다. 2) 모집단이 정규분포를 따라야 합니다. 정규성검정을 통해서 확인합니다. 만약 정규성을 만족하지 않는 경우 비모수 검정인 윌.. 2023. 1. 13.
일표본 t검정 글 하나로 끝내버리기 1. 언제 쓰는 건가요? 일표본 t검정은 모집단의 평균이 알려져 있는 상황에서, 정말 그 사실이 맞는지 확인할 때 사용합니다. 예를 들어 어떤 과자 포장지에 내용물 무게가 30g이라고 나와있다고 합시다. 30g이 정말 맞는지 확인하고 싶은 경우 표본을 뽑아 일표본 t검정을 합니다. 여기서 표본을 뽑는다는건 과자 50봉지 정도를 구입한다는 의미입니다. 2. 조건 1) 데이터는 연속형 자료여야 합니다. t검정은 t분포를 사용하는데, t분포는 모집단이 정규분포를 따른다는 것을 전제로 유도된 분포입니다. 정규분포는 연속형 변수에서 유도된 분포이기 때문에 모집단이 연속형 데이터인 경우에만 t검정을 사용할 있는 것이 원칙적으로는 맞습니다. 2) 모집단이 정규분포를 따라야 합니다. 이유는 1번에서 설명했습니다. 3... 2023. 1. 13.
반응형