본문 바로가기
반응형

t검정19

[손으로 푸는 t검정] 5. t분포 유도과정 요약 우리는 지난시간까지 t분포를 유도했습니다. 상당히 길고 복잡한 과정이었는데요. 오늘은 전체 과정을 간단히 요약하며 복습하겠습니다. Step1) t 통계량 정의 t통계량은 아래와 같이 정의됩니다. $t=\frac{\bar{X}-\mu}{\frac{s}{\sqrt{n}}}$ Z 통계량에서 모표준편차 $\sigma$를 표본표준편차 s로 바꾼 통계량입니다. T통계량이 따르는 분포가 T분포입니다. Step2) t통계량 변형 모집단이 정규분포를 따른다는 가정을 하고, t 통계량을 아래와 같이 변형하였습니다. $t=Z\frac{1}{\sqrt{V}}\sqrt{n}$ Z는 표준정규분포를 따르는 확률변수이고 V는 n자유도 카이제곱분포를 따르는 확률변수입니다. Step3) Z와 V의 결합확률밀도함수 Z와 V의 확률밀도함수.. 2023. 4. 7.
독립표본 t검정 신뢰구간 (단측검정,이분산가정) 독립표본 t검정의 신뢰구간입니다. 단측검정, 이분산가정인 경우입니다. 1. 신뢰구간 1) 95% 신뢰구간 ① 우측 꼬리인 경우 $\mu_{1}-\mu_{2} \leq \left ( \bar{X}_{1}-\bar{X}_{2} \right ) + \sqrt{\frac{s^2_{1}}{N_{1}}+\frac{s^2_{2}}{N_{2}}}\cdot t_{0.95}$ $\bar{X}_{1}$은 표본 1의 평균 $\bar{X}_{2}$는 표본 2의 평균입니다. $t_{0.95}$ 는 t분포에서 누적 확률 95%에 해당되는 t값입니다. ② 좌측 꼬리인 경우 $\left ( \bar{X}_{1}-\bar{X}_{2} \right ) - \sqrt{\frac{s^2_{1}}{N_{1}}+\frac{s^2_{2}}{N_{.. 2023. 4. 1.
독립표본 t검정 신뢰구간 (양측검정,이분산가정) 독립표본 t검정의 신뢰구간입니다. 양측검정, 이분산가정인 경우입니다. 1. 신뢰구간 1) 95% 신뢰구간 $ \left ( \bar{X}_{1}-\bar{X}_{2} \right )- \sqrt{\frac{s^2_{1}}{N_{1}}+\frac{s^2_{2}}{N_{2}}}\cdot t_{0.975} \leq \mu_{1}-\mu_{2} \leq \left ( \bar{X}_{1}-\bar{X}_{2} \right )+ \sqrt{\frac{s^2_{1}}{N_{1}}+\frac{s^2_{2}}{N_{2}}}\cdot t_{0.975}$ $\bar{X}_{1}$은 표본 1의 평균 $\bar{X}_{2}$는 표본 2의 평균입니다. $t_{0.975}$ 는 t분포에서 97.5%에 해당되는 구간의 오른쪽 t값.. 2023. 4. 1.
[손으로 푸는 t검정] 4. t분포 유도 (1) t통계량 변형 우리가 분포를 유도해야할 확률변수는 아래와 같습니다. $\frac{\bar{X}-\mu}{\frac{s}{\sqrt{n}}}$ 위 확률변수를 T라고 놓겠습니다. $T=\frac{\bar{X}-\mu}{\frac{s}{\sqrt{n}}}$ 아래와 같이 변형합시다. 분모를 모분산으로 곱하고 나눠주었습니다. $T=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}\frac{s}{\sigma} }$ 우변 분모를 아래와 같이 둘로 분리해 써줍니다. $T=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}} }\frac{1}{\frac{s}{\sigma} }$ 우변 두번째 항을 루트 안에 넣어줍니다. $T=\frac{\bar{X}-\mu}{\frac{\sigma}{\.. 2023. 2. 16.
독립표본 t검정 글 하나로 끝내버리기 1. 언제 쓰는 건가요? 독립표본 t검정은 서로 독립인 두 집단의 평균을 비교할 때 사용합니다. 예를 들면 서울 시민 남자의 키와 여자의 키 비교가 있습니다. 2. 독립변수와 종속변수 독립변수와 종속변수 관점으로도 생각해봅시다. 서울 시민의 남녀 키 비교에서 독립변수는 성별입니다. 성별이 달라졌을 때 키가 달라지는지 알고 싶은 것이기 때문입니다. 따라서 독립변수는 '범주형 자료'입니다. 종속변수는 키 이므로 종속변수는 '수치형 자료'입니다. t검정에서의 독립변수와 종속변수는 아래와 같습니다. 독립변수 : 범주형 종속변수 : 수치형 2. 조건 1) 두 집단이 서로 독립이어야 합니다. 2) 모집단이 정규분포를 따라야 합니다. 정규성검정을 통해서 확인합니다. 만약 정규성을 만족하지 않는 경우 비모수 검정인 윌.. 2023. 1. 13.
일표본 t검정 글 하나로 끝내버리기 1. 언제 쓰는 건가요? 일표본 t검정은 모집단의 평균이 알려져 있는 상황에서, 정말 그 사실이 맞는지 확인할 때 사용합니다. 예를 들어 어떤 과자 포장지에 내용물 무게가 30g이라고 나와있다고 합시다. 30g이 정말 맞는지 확인하고 싶은 경우 표본을 뽑아 일표본 t검정을 합니다. 여기서 표본을 뽑는다는건 과자 50봉지 정도를 구입한다는 의미입니다. 2. 조건 1) 데이터는 연속형 자료여야 합니다. t검정은 t분포를 사용하는데, t분포는 모집단이 정규분포를 따른다는 것을 전제로 유도된 분포입니다. 정규분포는 연속형 변수에서 유도된 분포이기 때문에 모집단이 연속형 데이터인 경우에만 t검정을 사용할 있는 것이 원칙적으로는 맞습니다. 2) 모집단이 정규분포를 따라야 합니다. 이유는 1번에서 설명했습니다. 3... 2023. 1. 13.
[손으로 푸는 t검정] 1. 강의 소개 안녕하세요 통계의 본질입니다. 본 강의의 제목은 「손으로 푸는 t검정」 입니다. t검정의 원리를 수학적으로 이해해보는 강의입니다. t검정의 모든 과정을 수식으로 써가며 이해하는 것이 목적입니다. 선수 과목은 「손으로 푸는 통계」입니다. 여러분이 통계검정의 원리를 이해하고 있다고 가정하고 진행합니다. t 검정은 두 집단의 평균을 비교할 때 사용하는 통계분석입니다. 쉽게 생각할 수 있는 예시는 두 반의 수학점수 평균비교입니다. 이 예시의 독립변수와 종속변수를 알아봅시다. 독립변수는 반의 종류입니다. 반의 종류는 범주형 변수 입니다. 종속변수는 수학 점수이고 수치형 변수 입니다. 아래와 같이 정리할 수 있습니다. 독립변수 개수 종속변수 개수 독립변수 종류 종속변수 종류 t검정 1개 1개 범주형 수치형 t검정은.. 2022. 7. 31.
Welch two sample t-test 가 뭔가요? R로 t검정을 해보신 분들은 결과 창에서 Welch two sample test 를 본 적이 있으실겁니다. var.equal 을 FALSE 로 할 경우 아래와 같이 출력됩니다. > t.test(male,female) Welch Two Sample t-test data: male and female t = 6.9208, df = 57.854, p-value = 4.026e-09 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 12.23857 22.19969 sample estimates: mean of x mean of y 171.5828 154.3637 Welch Two Sam.. 2022. 7. 10.
변수 관점으로 통계분석방법들 분류하기 결과부터 보기 독립변수 종속변수 t검정 범주형 수치형 분산분석 (일원분산분석) 범주형 수치형 카이제곱검정 범주형 범주형 상관분석 (피어슨) 수치형 수치형 회귀분석 (단순선형) 수치형 수치형 로지스틱 회귀분석 수치형 (or 범주형) 범주형 아래 통계분석방법들을 변수 관점에서 분류해보려고 합니다. t검정 분산분석(일원분산분석) 카이제곱검정 상관분석(피어슨상관분석) 회귀분석(단순선형회귀분석) 변수는 독립변수와 종속변수로 나뉩니다. 각 변수는 자료의 형태에 따라 수치형자료 또는 범주형자료입니다. 어떤 통계 분석 방법의 독립변수와 종속변수가 수치형 자료인지 범주형자료인지를 알아보는 것이 이번 글의 목적입니다. 수치형 자료와 범주형자료가 무엇인지 모르는 분들을 위해 간단히 설명드리겠습니다. 수치형자료는 양적자료라고.. 2021. 9. 6.
대응표본 t검정 예시 모음 대응표본 t검정은 어떤 처리 전과 후의 평균을 비교하는 검정방법입니다. 대응표본 t검정의 다양한 예시를 적어보았습니다. 문제의 조사방법이 정답은 아니니 문제 자체를 비판해보는 것도 도움이 될 것입니다. 단측검정을 사용할지 양측검정을 사용할지도 고민해보시면 공부가 될 것입니다. 예시1) 다이어트 프로그램 한 헬스장에서 다이어트 프로그램을 열었습니다. 3달 동안 운동과 식단관리를 해주는 프로그램입니다. 30명의 고객을 모집했습니다. 프로그램을 시작하기 전 고객들의 평균 몸무게는 90kg, 표준편차는 10kg 이었습니다. 3달동안 프로그램에 참여한 뒤 몸무게를 측정했더니 평균 82kg, 표준편차는 17kg 이었습니다. 다이어트 프로그램은 효과가 있는걸까요? 예시2) 시험의 난이도 어느 회사에서 올해 입사시험 .. 2021. 3. 20.
독립표본 t검정 예시 모음 독립표본 t검정은 두 집단의 평균을 비교하는 검정방법입니다. 독립표본 t검정의 다양한 예시를 적어보았습니다. 문제의 조사방법이 정답은 아니니 문제 자체를 비판해보는 것도 도움이 될 것입니다. 단측검정을 사용할지 양측검정을 사용할지도 고민해보시면 공부가 될 것입니다. 예시1) 핸드폰 사용량 20대 남자와 여자의 유튜브 사용량을 비교하기 위해 20대 남자 50명과 20대 여자 50명을 모집했다. 하루 평균 유튜브 사용량을 조사했고, 남자는 평균 3시간, 표준편차 25분이 나왔다. 여자는 평균 2시간 45분, 표준편차 32분이 나왔다. 누가 더 많이 사용하는가? 예시1) 신약의 효과 A회사에서 혈중 콜레스테롤 수치(mg/dl)를 낮춰주는 약을 개발했습니다. 효과를 입증하기 위해 고콜레스테롤 혈증 환자 60명을.. 2021. 3. 20.
독립표본 t검정, 대응표본 t검정 검정통계량 수식 이분산 독립표본 t검정 (Welch Two sampl test) t통계량 $T=\frac{\bar{X}_{1}-\bar{X}_{2}}{\sqrt{ \frac{s_{1}^{2}}{N_{1}}+\frac{s_{2}^{2}}{N_{2}} }}$ 자유도 $df= \frac{ \left ( \frac{s_{1}^{2}}{n_{1}} + \frac{s_{2}^{2}}{n_{2}} \right )^2 } { \frac { \left ( \frac{s_{1}^{2}}{n_{1}} \right )^2 } {n_{1}-1} + \frac { \left ( \frac{s_{2}^{2}}{n_{2}} \right )^2 } {n_{2}-1} }$ 등분산 독립표본 t검정 통계량 $T=\frac{\bar{X}_{1}-\bar{X.. 2021. 3. 19.
[통계분석 언제 뭘 써야하나] 2. t검정의 분류 (두 집단의 평균비교) 두 집단의 평균을 비교할 때는 t검정이 사용됩니다. t검정은 아래와 같이 분류됩니다. 그림 이후에 나오는 설명과 함께 보시면 됩니다. 1. 독립 or 대응 여부 판별 두 집단이 서로 독립인지 대응인지 여부를 판단합니다. 두 집단이 서로 영향을 주지 않을 때 독립이라고 합니다. 만약 두 집단이 같은 사람으로 구성되어 있고, 어떤 처리 전 후의 차이만 있다면 두 집단은 대응입니다. 예를 들면 30명을 모집하고 탈모약을 먹기 전과 후 머리카락 수를 비교한다면 대응표본입니다. 2. 두 집단이 독립인 경우 집단이 독립이라면 위 그림에서 왼쪽 화살표를 따라 가면 됩니다. 표본의 정규성 여부를 판단해야 합니다. 표본의 크기가 30 이상이면 중심극한정리에 의해 정규성을 따른다고 가정할 수 있습니다. 표본의 크기가 10.. 2021. 3. 19.
[손으로 푸는 통계 ver2.0] 프롤로그 #3. t검정을 이해하기 위한 목차 만들기 지난 글에서 t검정을 '진짜'이해한다는게 무엇인지 말씀드렸습니다. t검정 이라는 산을 정복하기 위해서는 정상에 도달 할 수 있는 '경로'를 정해야합니다. 이 경로는 책 혹은 강의의 목차를 의미합니다. 지금부터 앞으로 이어질 강의의 목차를 만들어봅시다. 마지막 단원은 t검정입니다. 마지막 단원의 번호를 X라고 놓겠습니다. X부터 하나씩 빼며 목차를 만들고, 마지막에 첫번째 강의를 1로 만드는 X를 대입하면 됩니다. X단원. t검정 t검정을 하기 위해서는 t분포를 유도해야합니다. X단원. t검정 X-1단원. t분포 유도 t분포를 유도하려면 카이제곱분포와 정규분포를 먼저 유도해야합니다. X단원. t검정 X-1단원. t분포 유도 X-2단원. 카이제곱분포 유도 X-3단원. 정규분포 유도 정규분포를 유도한 뒤에 Z.. 2021. 1. 20.
[손으로 푸는 통계 ver2.0] 프롤로그 #2. t검정을 '진짜' 이해한다는 것 t검정을 이해하고 싶었습니다. 저는 비전공자 직장인이고, 지난 글에서 t검정을 이해하기 위해 『손으로 푸는 통계』 라는 강의를 시작했다고 말씀드렸습니다. 우리가 오르려는 산 정상에는 t검정이 있고, 정상까지 어떻게 올라갈지 그 루트(route)를 정하기 전에 먼저 t검정을 이해한다는게 무엇인지 이야기해보려고 합니다. 수학적으로 정의된 어떤 대상을 이해하는데는 세가지 단계가 있습니다. (제가 수학/공학/통계학 등을 공부하며 알게된 것이고 사람마다 의견이 다를 수 있습니다.) 1단계) 사용할 줄 아는것 2단계) 원리를 아는 것 3단계) 유도할 줄 아는 것 t검정으로 예를 들어봅시다. t검정을 1단계 수준으로 이해한다는 것은 엑셀,SPSS,R을 이용해서 t검정을 수행하여 p값을 구할 줄 아는 것입니다. 구해진.. 2021. 1. 16.
독립표본 t검정은 언제쓰는걸까 1. 독립표본 t검정은 언제쓰는걸까 통계 분석 방법의 종류는 정말 많습니다. 일부만 나열해도 이렇게 많습니다. 정규성검정 등분산검정 일표본 t검정 독립표본t검정 대응표본t검정 윌콕슨순위합검정 윌콕슨부호순위검정 일원분산분석 크루스칼왈리스검정 이원분산분석 다원분삭분석 반복측정분산분석 프라이드먼분석 다변량분산분석 피어슨상관분석 스피어만상관분석 단순선형회귀분석 다중선형회귀분석 다변량단순선형회귀분석 다변량다중선형회귀분석 카이제곱분석 피셔정확검정 신뢰성검정 이렇게 다양한 분석방법이 있는 이유는 상황과 조건에 따라 사용할 수 있는 검정이 다르기 때문일 것입니다. 언제 어떤 검정을 사용해야 하는지 한번쯤 정리해보려고 했는데 이제 시작하게 됐네요. 어던 통계분석을 사용할지 결정할 때 '데이터의 종류' 와 '데이터의 크기.. 2020. 7. 12.
[데이터 없이 하는 검정] 2. 데이터는 없고 평균,분산,표본크기만 알아요. 독립표본 t검정 가능한가요? *데이터가 없는 상황을 가정하고 t검정의 절차를 이해하는 강의입니다. t검정이 무엇인지는 알고 있다고 전제합니다. 한가지 상황을 가정합시다. 두 집단의 데이터를 이용해서 평균,표준편차를 구해놓고 잠깐 눈을 붙인 사이에 데이터가 날아갔습니다. 데이터의 크기는 알고 있는 상태입니다. F검정을 하고 나서 t검정을 할 생각이었습니다. 가능할까요? 결론부터 말씀드리면 가능합니다. 지난 강의에서 F검정을 했구요. 오늘은 t검정을 해봅시다. 우리가 t검정을 하는 절차를 생각해봅시다. 표본1과 표본2의 데이터를 엑셀에 입력하고, 통계 도구를 이용하여 검정을 합니다. p값이 계산되어 나오고, 우리는 기각 여부를 결정합니다. Step 2의 과정은 엑셀이 알아서 계산해줍니다. 우리는 black box에 데이터를 집어넣고 버.. 2019. 10. 24.
데이터를 입력하는 두가지 방법 비교 (엑셀과 SPSS의 데이터 입력방식 비교) 데이터를 입력하는 두가지 방법 비교 (엑셀과 SPSS의 데이터 입력방식 비교) 엑셀에서 남자와 여자키의 발크기를 비교하는 독립표본 t검정을 하려면 데이터를 아래와 같이 입력해야 합니다. 엑셀에서는 위 데이터를 아래 빈칸에 입력하여 t검정을 수행합니다. 이 데이터가 어떻게 구성되어 있는 것인지, 독립변수와 종속변수 입장에서 살펴봅시다. 데이터가 정리된 형태 때문에 남자키가 독립변수고 여자키가 종속변수인 것 같아 보입니다. X와 Y같은 느낌을 받기 때문입니다. 때문에 t검정의 독립변수와 종속변수 모두 '연속형'이라고 착각합니다. 위 데이터에서 독립변수는 '성별'입니다. 종속변수는 '키'입니다. 행방향으로 독립변수가, 열 방향으로 종속변수가 입력되어 있는 형태입니다. 아래와 같이 이해할 수 있습니다. 독립변수.. 2019. 8. 26.
Z검정의 한계(정규성,t,비모수검정의 출현+디시전트리) 지금까지 우리는 Z검정에대해 공부했습니다. Z검정은 아무때나 사용할 수 있는 검정방법은 아닙니다. Z검정을 하기 위해서는 두 가지 조건이 필요합니다. 1) 모집단의 분산을 알고 있음 2) 중심극한정리를 적용할 수 있을 만큼 표본의 크기가 충분히 큼(or 모집단이 정규분포를 따름) 2)번은 표본평균의 분포를 정규분포로 가정하기 위한 조건입니다. 이제 이런 질문이 생깁니다. 표본의 크기가 충분히 크다는게 어느정도지? 모집단의 분산을 모를 때는? 표본의 크기가 충분히 크기 않을 때는? 일단 첫번째 질문에 먼저 답하겠습니다. 일반적으로, 경험적으로 표본의 크기가 30개 이상이면 중심극한정리를 만족한다고 가정합니다. 나머지 세 질문이 매우 중요한데요. 이런 질문들이 여러 검정 방법들을 탄생시켰습니다. 오늘은 그 .. 2018. 6. 2.
반응형