반응형 분류 전체보기648 [손으로 푸는 확률분포] 초기하분포 (2) 유도 (2) 유도 모집단의 크기는 M입니다. 모집단 안에는 우리가 원하는 원소가 k개 있습니다. 모집단에서 크기가 n인 표본을 뽑는 경우의 수는 아래와 같습니다. MCnMCn 우리가 뽑은 크기 n인 표본 안에 우리가 원하는 원소 x개가 들어 있을 경우의 수를 구해봅시다. 모집단에 있는 k개 중에서 x개가 뽑혀야 합니다. 총 n개가 뽑혀야 하므로, 나머지는 모집단에 있는 우리가 원하지 않는 것의 수 즉 M-k개 중에서 n-x개가 뽑히면 됩니다. 조합식으로 표현하며 아래와 같습니다. kCx⋅M−kCn−xkCx⋅M−kCn−x 이산확률분포는 우리가 원하는 원소가 k개 들어 있는 크기가 M인 모집단에서 표본 n개를 뽑을 때, 우리가 원하는 원소가 x개 들어있을 확률분포입니다. 따라서 아래 확률은.. 2019. 12. 16. 양측검정 결과로 나온 유의확률을 단측검정으로 쓰려면 2를 곱해야할까 나눠야할까 양측검정 결과로 나온 유의확률을 단측검정으로 쓰려면 2를 곱해야할까 나눠야할까 SPSS의 결과는 아래와 같이 양측검정 결과만 알려줍니다. 만약 단측검정을 하고 싶으면 어떻게 해야할까? 먼저 위상황을 그림으로 이해해봅시다. 왜 0.006이 아니라 0.003일까요? 이유는 아래와 같습니다. 양측검정의 경우 0.05를 양쪽으로 나눠서 각 꼬리마다 0.025의 유의수준을 갖습니다. 따라서 위 예제는 0.003을 0.025와 비교하는 상황이었던 것입니다. 0.025(유의수준) vs 0.003(유의확률) 우리는 유의수준을 0.05로 하는데 익숙하므로, 위 결과에 각각 2를 곱해줍니다. 0.05 vs 0.006 SPSS는 이렇게 유의확률에 2배된 값을 출력해줍니다. 만약 단측검정을 하고 싶다면 출력된 0.006의 절.. 2019. 12. 13. 통계학의 역사(스티븐 스티글러) 요약 #10 통계학의 역사(스티븐 스티글러) 요약 #10 (p.38) 2부 1830년대 이후의 사회과학과 통계학 (2부-4) 렉서스의 실패, 심리학의 성공 통계적 방법을 적용할 수 있는 '동질적 집단'을 확보하려는 시도가 19세기 후반까지 계속 이어졌다고 하는데...이 동질적집단이 뭘 말하는지 모르겠다. 19세기 말 실험심리학이 다른 사회과학보다 진보 속도가 빨랐는데, 그 이유가 실험조건 통제가 가능하기 때문이라고 한다. 실험조건 통제는 동질적 집단을 얻는 것을 가능하게 해줬다. 그래서 이 동질적 집단이 뭘까? 책을 읽어봐야 알 수 있을 듯 하다. 2019. 12. 12. [손으로 푸는 확률분포] 초기하분포 (1) 소개 (1) 소개 모집단이 있습니다. 모집단의 크기는 M입니다. 모집단 안에는 우리가 원하는 원소가 k개 있습니다. 모집단에서 크기가 n인 표본을 뽑을 것입니다. 이 표본 안에 우리가 원하는 원소가 x개 있을 확률분포가 초기하분포 입니다. 모집단의 크기 : M 모집단 중 원하는 원소 개수 : k 표본의 크기 : n 표본 중 원하는 원소 개수 : x 로또를 예로들어봅시다. 로또는 45개 숫자 중에서 6개를 맞추는 것입니다. 45개라는 모집단에 우리가 원하는 숫자 6개가 있는 것입니다. 45개라는 모집단에서 6개를 뽑았고, 그 중 우리가 원하는 숫자의 개수를 x라고 놓는다면 초기하분포가 됩니다. M : 45 k : 6 n : 6 x : 맞춘 번호 수 2019. 12. 5. 통계학의 역사(스티븐 스티글러) 요약 #9 통계학의 역사(스티븐 스티글러) 요약 #9 (p.36-37) 2부 1830년대 이후의 사회과학과 통계학 (2부-3) 케틀레의 성공과 실패 이 책은 10개의 장으로 구성되어 있다. 10개의 장은 3개의 '부'로 나뉘어진다. 1,2,3,4 장은 1부에 속하고 5,6,7장은 2부, 8,9,10장은 3부에 속한다. 10개의 장을 한번 살펴보자. 1장. 최소제곱법과 관측 결과들의 집합2장. 확률을 연구한 사람들과 불확정성의 측정3장. 역확률4장. 가우스와 라플라스의 종합5장. 케틀레의 두 가지 시도6장. 이항분포를 되살리려는 시도들7장. 특출한 사회과학 : 정신물리학8장. 영국에서의 혁신적인 발달 : 골턴9장. 그 다음 세대 : 에지워스10장. 피어슨과 율 5장 이야기를 하겠다. 5장은 제목에서 알 수 있듯이 케.. 2019. 12. 4. [손으로 푸는 확률분포] 푸아송분포 (6) 그래프 (6) 그래프 푸아송 분포의 그래프는 아래와 같습니다. 람다를 5부터 70까지 키워가며 그래프를 그렸습니다. 세로선은 평균입니다. 푸아송분포의 평균과 분산이 모두 λ입니다. λ가 커지면 평균이 커지는 것이므로 그래프가 우측으로 이동합니다. λ가 커지면 분산이 커지는 것이므로, 그래프가 좌우로 퍼집니다. 그래프는 R을 이용하여 그렸습니다. 아래는 사용 코드입니다. plot(0,type='n',ylim=c(0,0.2),xlim=c(0,100),ann=FALSE) title(main="Poisson distribution", xlab="x",ylab="p(x)") lambda=c(5,10,30,50,70) for (i in 1:5) { x=1:100 y=dpois(x, lambda[i], log = FALSE.. 2019. 12. 3. 통계학의 역사(스티븐 스티글러) 요약 #8 통계학의 역사(스티븐 스티글러) 요약 #8 (p.34-35) 2부 1830년대 이후의 사회과학과 통계학 (2부-2) 사회과학 당시에는 사회와 인간에 대한 통계 결과가 '신의 섭리'의 결과라고 생각했다. 이러한 사회적 분위기는 프로이센의 성직자 쥐스밀히(1707~1767)가 [신성한 질서]라는 책을 출간한 데서도 엿볼 수 있다. 이러한 생각은 18세기 뿐 아니라 19세기에도 나타난다. 차이가 있다면 원인을 '신'이 아니라 '사회'가 어떤 원리에 따라 움직인다고 생각했다. 이렇게 생각이 변한 원인은 사회 이론을 '과학화'하려는 시도에서 나왔다. 사회이론을 과학화하여 '사회과학'을 추구한 것이다. 요약일 : 2019/12/02 2019. 12. 2. [손으로 푸는 확률분포] 푸아송분포 (5) 분산 (5) 분산 푸아송 분포의 분산을 구해봅시다. 푸아송 분포함수는 아래와 같습니다. 푸아송분포의 분산은 아래와 같이 구합니다. x가 1부터 시작해도 결과가 같습니다. x를 약분합니다. 아래와 같이 변형합니다. 람다를 꺼냈습니다. x-1을 n으로 치환합니다. 전개합니다. 빨간 부분은 푸아송분포의 평균입니다. 파랑부분은 푸아송분포함수값의 총 합이므로 1입니다. 계산하면 아래와 같습니다. 2019. 12. 1. 그래프를 꼭 그려봐야 하는 이유(엔스콤의 사인방) 이 그룹들의 통계량이 같다고??? (엔스컴의 사인방) 973년, 엔스컴은 "Graphs in Statistical Analysis"라는 제목의 논문을 출간합니다. SPSS가 1968년에 펀치카드 형식으로 처음 등장했고, 엑셀이 1987에 처음 등장했습니다. 엔스컴이 논문을 게재한 1973년은 오늘날처럼 그래프를 클릭 몇번으로 그릴 수 있는 시대는 아니었을 겁니다. 논문의 서두에는 이런 이야기가 있습니다. "출간되는 대부분의 책들과 대부분의 프로그램들은 그래프에 너무 신경을 쓰지 않는다. 우리 중 대다수는 아래와 같은 사상에 주입당했다." (1) 수치계산은 정확하지만 그래프는 거칠다(대충이다,상세하지 않다). (2) 어떤 데이터의 정확한 통계분석에는 오직 한 세트의 계산이 존재한다. (3) 데이터를 실제로.. 2019. 12. 1. [손으로 푸는 확률분포] 푸아송분포 (4) 평균 (4-1) 통계량 - 평균 푸아송분포는 λ 라고 가정하고 유도한 분포이므로, 평균은 당연히 λ 겠지만 확률분포의 평균을 구하는 수식으로도 구해보겠습니다. 푸아송분포 평균을 구할 때 테일러급수가 사용되므로, 먼저 테일러급수를 알아봅시다. f(x)의 테일러급수는 아래와 같습니다. a가 0일 때는 매클로린 급수라고 합니다. 이번에는 e^x의 매클로린 급수를 구해봅시다. x 자리에 λ를 대입합시다. 위 식을 증명에 사용할 것입니다. 1번식이라고 하겠습니다. 이제 푸아송 분포의 평균을 구해봅시다. 푸아송 분포함수는 아래와 같습니다. 푸아송분포의 평균은 아래와 같이 구합니다. x에 0을 넣으면 전체 항이 0이 되므로, x를 1부터 시작해도 됩니다. 아래와 같이 변형합니다. x-1을 n으로 치환하겠습니다. 빨간 식을.. 2019. 11. 29. 통계학의 역사(스티븐 스티글러) 요약 #7 통계학의 역사(스티븐 스티글러) 요약 #7 (p.31-33) 2부 1830년대 이후의 사회과학과 통계학 디킨즈의 소설 '어려운 시절'의 일부를 인용한다. 대화문인데 이해가 잘 안된다. 뒷부분을 읽고 알게됐는데, 모든것을 '통계의 대상'으로 여기는 사회분위기를 비판한 것이라고 한다. 2부는 19세기 사회과학이 중심이고, 네사람을 중심인물로 삼는다. 사회학 : 케틀레(Quetelet)인구통계 : 렉시스(Lexis)심리학 : 페히너(Fechner), 에빙하우스(Ebbinghaus) (2부-1) 시대배경 1830년대부터 19세기 말까지는 통계가 사회속으로 활발하게 퍼져나갔다고 한다. 다양한 사회현상들에 대한 통계 자료를 수집,정리하고 배포하는 기구나 협회가 생기기 시작했고 통계학술잡지가 등장했다. 이렇게 사회통.. 2019. 11. 28. 통계학의 역사(스티븐 스티글러) 요약 #6 통계학의 역사(스티븐 스티글러) 요약 #6 (p.29-30) 1부 1820년까지의 통계역사 (책 목차 : 1827년 이전 천문학과 측지학에서의 수리통계학 발달사) (1부-3) 역확률과 정규분포의 탄생 1부에서는 주연급 조연들의 확률연구가 소개된다고 했다. 주연급 조연이라는데 겁나 유명한 사람들이다. - 베르누이 (Jabob Bernoulli)- 드 무아르 (De Moivre)- 심프슨 (Thomas Simpson)- 베이즈 (Thomas Bayes) 통계학의 역사는 베르누이 전후로 뚜렷하게 구분된다고 한다. 베르누이 이후부터 관측 결과로 부터 무언가를 추론하기 시작했다. 그 전까지는 어떤 사건의 확률을 구하는 정도였다. 베르누이 이후에, 저기 저 사람들이 확률이론을 발달시켰다. 굉장히 중요하고 핵심적인 .. 2019. 11. 26. [손으로 푸는 확률분포] 푸아송분포 (3) 예시 (3) 예시 아래와 같은 푸아송 분포를 유도했습니다. 예시를 통해 위 식을 어떻게 사용하는지 알아봅시다. 증명에도 사용했던 길냥이 예시로 가봅시다. 하루동안 돌다니며 길냥이를 마주치는 평균 횟수가 3회라고 합시다. 오늘 하루 동안 길냥이를 1번 마주칠 확률은 얼마일까요? 위 경우는 람다가 3인 푸아송분포가 됩니다. 길냥이를 한번 마주칠 확률은 x에 1을 넣어서 구하면 됩니다. 2019. 11. 26. 통계학의 역사(스티븐 스티글러) 요약 #5 통계학의 역사(스티븐 스티글러) 요약 #5 (p.27-28) 1부 1820년까지의 통계역사 (책 목차 : 1827년 이전 천문학과 측지학에서의 수리통계학 발달사) (1부-2) 최소제곱법의 탄생 천문학과 측지학에는 세가지 중요한 문제가 있었다. 1) 목성과 토성의 운동에 대한문제2) 달의 운동에 대한 문제3) 지구의 모양을 정하는 문제(공인가, 럭비공인가, 럭비공이라면 적도와 양극지방중 어디가 더 긴가) 특히 달의 운동에 대한 문제에는 현상금이 걸려있었다. 달의 운동을 통해 바다에서의 경도를 파악할 수 있었고, 이는 안전한 항해를 위해 필요했다. 통계학의 역사에 이 세가지 문제가 등장하는 이유는 관측 결과의 불일치성 때문이다. 관측 결과를 수학적으로 예측하고 싶은데 결과가 매번 다르니 통계적 방법이 필요했.. 2019. 11. 22. 통계학의 역사(스티븐 스티글러) 요약 #4 통계학의 역사(스티븐 스티글러) 요약 #4 (p.23-27) 책은 여전히 번역자인 조재근교수님의 글이다. 지난글까지가 '들어가는 말'이었다. 알고보니 이 길고긴 역자의 칼럼?에는 목차가 있있었다. 들어가는말1900년 이전까지의 통계학사 제1부 1820년까지의 통계학사 제2부 1830년대 이후의 사회과학과 통계학 제3부 19세기 말 유전학 연구에서의 혁신적인 발달몇 가지 덧붙이는 이야기들맺는말 3개의 부로 나뉘어져 있는 목차는 이 책의 목차와 유사하다. 책의 내용이 다루는 시대의 통계역사를 개괄하는 것이 목적이라고 한다. 1부 1820년까지의 통계역사 (책 목차 : 1827년 이전 천문학과 측지학에서의 수리통계학 발달사) (1부-1) 시대배경 1700년 근처부터 19세기 초의 시대에는 천문학 중심의 자연철.. 2019. 11. 20. 통계학의 역사(스티븐 스티글러) 요약 #3 통계학의 역사(스티븐 스티글러) 요약 #3 (p.18-22) 통계학의 역사라고 번역된 이 책의 원래 제목은 아래와 같다. The History of Statistics : The Measurement of Uncertainty before 1900 직역하면 '통계의 역사 : 1900 이전에 이루어진 불확실성의 측정' 이다. 불확실성을 측정한다는 것은 불확실성을 정량적으로 표현한다는 것을 의미한다. 통계학의 역사는 불확실성을 정량화하려는 시도들이었나 보다. 왜 불확실성을 정량화하려고 시도했을까? 불확실한 것은 그냥 불확실한 대로 두면 안되나? 책에 의하면 18,19세기 천문학자들이나 측지학 연구자들은 관측 대상에게 '참 값'이 있다고 생각했다. 불확실성은 참값을 측정하려는 시도에서 발생하는 오차라고 생각한.. 2019. 11. 20. 통계학의 역사(스티븐 스티글러) 요약 #2 통계학의 역사(스티븐 스티글러) 요약 #2 (p.14-17) Statistics 라는 단어에는 두가지 의미가 있다. '통계'라는 복수명사와 '통계학'이라는 단수명사이다. 당신은 Statistics 라는 단어를 들으면 어떤 뜻이 먼저 떠오르는가? 나는 통계학이 먼저 떠오른다. 하지만 아마 대부분의 사람은 '통계'를 떠올릴거다. 이 책의 제목은 통계의 역사일까 통계학의 역사일까? 통계학의 역사다. 저자는 statistics를 '통계학'이라는 의미로 사용했다. 한국에서는 통계학을 고등수학의 '일부분'으로 배우다보니, 독립적인 학문으로 인식하지 않는 경우가 많다. 이 책의 역자는 한국에서 통계학의 위치를 이야기하며, '통계든 통계학이든 환영받지 못하는 존재'라고 했다. 현재(2019)는 상황이 많이 달라진 것 .. 2019. 11. 20. 통계학의 역사(스티븐 스티글러) 요약 #1 통계학의 역사(스티븐 스티글러) 요약 #1 어느날 회사에서 통계학을 공부하라고 했다. 어떤 연구를 진행하는데 통계 지식이 필요했고, 누군가 공부를 해야했다. 당시 팀장님이 나에게 "필요한 책을 사줄테니 통계 공부를 하라"고 했다. 내가 통계공부를 시작하게 된 이유다. 몇년 뒤 다른 회사로 이직을 했다. 대기업 연구소였는데, 모든 사원이 통계 교육을 받아야 했다. 통계가 중요하다는 사실을 실감했다. 얼마 지나지 않아 또 이직을 했다. 옮겨간 회사에서는 통계를 더 많이 사용했다. 통계와의 세번의 인연은 "통계 공부를 제대로 해봐야 겠다"라는 생각이 들게 했다. 문제는 의지였다. 퇴근 후 자신을 채찍질하며 통계 공부를 하도록 만들어야 했다. 혼자서는 힘들어서 블로그를 시작했고, 블로그에 글이 하나씩 쌓이는 재.. 2019. 11. 18. [손으로 푸는 확률분포] 푸아송분포 (2-3) 두 증명 결과가 같은 이유 (2-3) 두 증명 결과가 같은 이유 두가지 방법으로 푸아송분포를 유도했습니다. 이항분포를 이용하여 유도한 결과는 아래와 같습니다. 미분방정식을 세워서 유도한 결과는 아래와 같습니다. λ 와 ks를 비교할겁니다. 의미가 같다는 것을 보이겠습니다. λ는 이항분포 B(n,p)의 평균입니다. 어떤 시간 동안의 시행횟수를 n, 사건 발생확률을 p라고 놓았을 때의 평균입니다. 이번에는 ks를 봅시다. s는 어떤 단위 시간을 의미합니다. 길냥이 예제에서는 '하루'라는 시간입니다. 시간 s 안에 Δt 라는 '사건이 최대 1번 일어나는 짧은 시간'을 잡은 것입니다. Δt 동안 사건이 1번 발생할 확률을 아래와 같이 정의했었습니다. 위 식을 k에 대해 정리하면 아래와 같습니다. 양변에 s를 곱합시다. 전체시간 s를 사건.. 2019. 11. 15. [손으로 푸는 확률분포] 푸아송분포 (2-2) 미분방정식으로 유도 ② 유도 (2-2) 미분방정식으로 유도 ② 유도 지난시간에 세개의 식을 유도했습니다. 본격적으로 푸아송분포를 유도합시다. 길냥이 예제를 이어서 사용하겠습니다. 아래와 같은 확률을 정의해봅시다. 이 확률은 t+Δt 라는 시간동안 길냥이를 x번 만날 확률입니다. 이 확률은 아래와 같이 다른 두 확률의 곱으로 표현할 수 있습니다. t+Δt 라는 시간동안 길냥이를 x번 만날 확률은 t라는 시간동안 x번 만나고 이후 Δt라는 시간동안 0번 만날 확률과 t라는 시간동안 x-1번 만나고 이후 Δt라는 시간동안 1번 만날 확률의 합과 같습니다. 1,2번식(맨 위 빨간식)을 대입하여 정리합시다. 전개하겠습니다. 이항하여 아래와 같이 정리합시다. Δt로 양변을 나눠줍시다. Δt를 0으로 보내면 아래와 같은 미분방정식이 됩니다. 이.. 2019. 11. 7. [손으로 푸는 확률분포] 푸아송분포 (2-2) 미분방정식으로 유도 ① 준비 (2-2) 미분방정식으로 유도 ① 준비 지난시간에는 이산확률분포를 이용하여 포아송분포를 유도했는데요. 이번에는 미분방정식을 세워서 포아송분포를 유도해보겠습니다. 푸아송분포 첫번째 시간에 소개한 예시를 떠올려봅시다. 24시간 동안 길냥이를 만날 확률분포를 포아송분포의 예로 들었습니다. 길냥이를 만나는 사건이 최대 1번 일어날 수 있을 만큼 작은 시간을 Δt 라고 놓읍시다. Δt 라는 시간 동안 길냥이를 만날 사건이 1번 일어날 확률을 아래와 같이 놓겠습니다. 이 확률은 Δt에 비례할 것입니다. Δt가 길 수록 길냥이를 만날 확률이 높아질 것이기 때문입니다. 따라서 아래와 같이 놓을 수 있습니다. 비례상수를 k라고 합시다. 이때, Δt 동안 길냥이를 만나지 않을 확률은 아래와 같습니다. 전체확률이 1이므로 .. 2019. 11. 5. 통계 분야 논문 수, 한국은 몇위일까? 논문과 관련된 랭킹을 확인할 수 있는 사이트가 있습니다. 어떤 분야의 저널 순위나, 국가별 순위 등을 제공합니다. SJR이라는 사이트입니다. 링크는 아래와 같습니다. https://www.scimagojr.com/ 다양한 순위가 있는데, 오늘 알아볼 순위는 통계 분야의 한국 순위입니다. COUNTRY RANKS의 EXPLORE를 클릭합니다. 아래와 같은 화면이 나옵니다. 논문 숫자순위가 디폴트화면으로 나옵니다. 미국이 1위고, 한국은12위네요. 논문 수가 많다고 반드시 연구를 잘하고 있는 것은 아닙니다. 논문 별로 수준이 다르기 때문입니다. 좋은 저널(impact factor)에 논문이 게재되거나, 같은 이야기이지만 인용이 많이 된 논문이 많은 것이 더 의미가 있습니다. 이번에는 Citations를 클릭.. 2019. 11. 5. [손으로 푸는 확률분포] 푸아송분포 (2-1) 이항분포로 부터 유도 (2-1) 이항분포로 부터 유도 이항분포 함수는 아래와 같습니다. 푸아송분포는 n과 p를 각각 다루지 않고, 이항분포의 평균인 np를 다룹니다. 이 값을 λ(람다)라고 놓습니다. 아래와 같이 변형합시다. 이항분포 수식의 p 자리에 위 식을 넣겠습니다. 조합 식을 팩토리얼로 전개합시다. 위 식의 빨간항을 아래와 같이 나눠서 써줍시다. 팩토리얼 식을 아래와 같이 풀어 써줍니다. 파란 부분끼리 약분해줍니다. x팩토리얼과, n의 x승의 자리를 바꿔줍니다. 위 식의 파란 부분을 아래와 같이 변형합시다 . 이번에는 아래 식을 봅시다. 몇개의 인수가 곱해져있는 걸가요? n!를 (n-x)!로 나눈 것인데, n!의 인수는 n개 입니다. (n-x)!의 인수는 (n-x)개입니다. n개 에서 (n-x)개를 약분하면, x개가 .. 2019. 10. 28. 표준오차가 뭔가요? 표준편차랑 다른건가요? 모집단이 있습니다. 모집단의 평균을 μμ(뮤), 표준편차를 σσ (시그마)라고 합시다. 모집단의 평균이 궁금한데 모집단이 너무 커서 구할 수가 없었습니다. 모집단의 평균을 추정하기 위해 모집단에서 크기가 n인 표본을 추출했습니다. 이 표본을 표본1이라고 합시다. 표본 1의 평균을 구했고 ˉX1¯X1 이라고 놓겠습니다. 이렇게 표본을 계속 뽑았습니다. 표본 평균들이 많이 구해지겠죠. 이 표본평균에는 아래와 같은 성질이 성립합니다. E[ˉX]E[¯X] V[ˉX]=σ2nV[¯X]=σ2n 표본 평균의 평균이 모평균과 같다는 것과, 표본 평균의 분산이 모분산을 n으로 나눈 것과 같다는 성질입니다. 이유가 .. 2019. 10. 26. [데이터 없이 하는 검정] 3. 데이터는 없고 평균,분산,표본크기만 알아요. 대응표본 t검정 가능한가요? *데이터가 없는 상황을 가정하고 t검정의 절차를 이해하는 강의입니다. t검정이 무엇인지는 알고 있다고 전제합니다. 한가지 상황을 가정합시다. 탈모약을 개발했고, 임상시험 단계입니다. 탈모환자 50명을 대상으로 투약 전과 후 환자의 모발수를 측정하였습니다. 평균,표준편차를 구해놓고 잠깐 눈을 붙인 사이에 데이터가 날아갔습니다. 대응표본 t검정을 해야하는데 가능할까요? 결론부터 말씀드리면 가능합니다. 우리가 대응표본 t검정을 하는 절차를 생각해봅시다. 표본1과 표본2의 데이터를 엑셀에 입력하고, 통계 도구를 이용하여 검정을 합니다. p값이 계산되어 나오고, 우리는 기각 여부를 결정합니다. Step 2의 과정은 엑셀이 알아서 계산해줍니다. 우리는 black box에 데이터를 집어넣고 버튼만 누르면 됩니다. 그.. 2019. 10. 25. [데이터 없이 하는 검정] 2. 데이터는 없고 평균,분산,표본크기만 알아요. 독립표본 t검정 가능한가요? *데이터가 없는 상황을 가정하고 t검정의 절차를 이해하는 강의입니다. t검정이 무엇인지는 알고 있다고 전제합니다. 한가지 상황을 가정합시다. 두 집단의 데이터를 이용해서 평균,표준편차를 구해놓고 잠깐 눈을 붙인 사이에 데이터가 날아갔습니다. 데이터의 크기는 알고 있는 상태입니다. F검정을 하고 나서 t검정을 할 생각이었습니다. 가능할까요? 결론부터 말씀드리면 가능합니다. 지난 강의에서 F검정을 했구요. 오늘은 t검정을 해봅시다. 우리가 t검정을 하는 절차를 생각해봅시다. 표본1과 표본2의 데이터를 엑셀에 입력하고, 통계 도구를 이용하여 검정을 합니다. p값이 계산되어 나오고, 우리는 기각 여부를 결정합니다. Step 2의 과정은 엑셀이 알아서 계산해줍니다. 우리는 black box에 데이터를 집어넣고 버.. 2019. 10. 24. [데이터 없이 하는 검정] 1. 데이터는 없고 평균,분산,표본크기만 알아요. F검정 가능한가요? *데이터가 없는 상황을 가정하고 F검정의 절차를 이해하는 강의입니다. F검정이 무엇인지는 알고 있다고 전제합니다. 한가지 상황을 가정합시다. 두 집단의 데이터를 이용해서 평균,표준편차를 구해놓고 잠깐 눈을 붙인 사이에 데이터가 날아갔습니다. 데이터의 크기는 알고 있는 상태입니다. F검정을 하고 나서 t검정을 할 생각이었습니다. 가능할까요? 결론부터 말씀드리면 가능합니다. 우리가 F검정을 하는 절차를 생각해봅시다. 표본1과 표본2의 데이터를 엑셀에 입력하고, 통계 도구를 이용하여 검정을 합니다. p값이 계산되어 나오고, 우리는 기각 여부를 결정합니다. Step 2의 과정은 엑셀이 알아서 계산해줍니다. 우리는 black box에 데이터를 집어넣고 버튼만 누르면 됩니다. 그런데 지금은 이 black box에서.. 2019. 10. 22. 통계 용어 검색하는 방법 (한국통계학회 통계용어집) 한국통계학회 홈페이지에서 통계용어 검색기능을 제공합니다. 통계학회 홈페이지 주소는 아래와 같습니다. http://www.kss.or.kr/ 1) 위 링크로 들어갑니다. 2) 자료실 탭에서 '통계 용어'를 클릭합니다. 검색어를 입력해도 되고, 글자를 클릭해도 됩니다. 3) 예를들어 '가'를 클릭하면, '가'로 시작하는 용어들이 검색됩니다. 4) 프아송인지, 푸아송인지, 포아송인지도 검색할 수 있습니다. 5) weibull 분포를 한글로 적으려고 할 때, 검색해 볼 수 있습니다. 와이블분포라고 쓰는군요. 자주 사용할 일은 없겠지만, 논문을 쓰거나 책을 쓸때 유용하게 쓰일 것 같네요. 2019. 10. 19. [손으로 푸는 베이즈통계] 8. 베이즈정리 심화형 유도 (5) 유도하기 손으로 푸는 베이즈통계8. 베이즈정리 심화형 유도 (5) 유도하기 우리는 3,4,5강에서 아래 세가지 내용을 배웠습니다. 조건부확률 확률의 곱셈정리 전체확률의 법칙 표본공간 S가 n개로 분할되어 있고, 표본공간의 임의의 사건을 A라고 하면 아래 등식이 성립한다. 이 재료들로 베이즈정리를 유도해보겠습니다. 아래 그림과 같이 표본공간 S가 n개로 분할되어 있다고 해봅시다. 조건부확률을 정의해봅시다. 사건 A가 발생했을 때, 사건 B가 발생할 확률입니다. 분자를 "확률의 곱셈정리" 이용하여 변형하면 아래와 같습니다. 분모를 "전체확률의 법칙"을 이용하여 변형하면 아래와 같습니다. 위 수식이 베이즈정리입니다. 이렇게만 봐서는 어떤 의미인지 와닿지 않을겁니다. 위 수식이 어떤 의미를 갖는지 그 직관적 이해에 관하.. 2019. 10. 18. [손으로 푸는 베이즈통계] 7. 베이즈정리 심화형 유도 (1) 재료 : 전체확률의 법칙(law of total probability) 손으로 푸는 베이즈통계7. 베이즈정리 심화형 유도 (1) 재료 : 전체확률의 법칙(law of total probability) 표본공간을 S라고 합시다. 표본공간은 사건이 일어날 수 있는 전체 집합입니다. 주사위를 던지는 사건을 예로 들면 표본공간 S는 {1,2,3,4,5,6}입니다. 표본공간 S가 n개로 분할되어 있다고 해봅시다. 그림으로 표현하면 아래와 같습니다. 이렇게 n개로 분할되어 있는 표본공간 위에 어떤 사건 A가 있다고 해봅시다 . 사건 A의 개수는 아래와 같이 나타낼 수 있습니다. (A와 겹치는 부분을 다 더하면 A가 되겠죠?) 혹시 아래처럼 A가 어떤 분할영역과 겹치치 않더라도 위 식은 여전히 성립합니다. 겹치지 않는 부분은 교집합의 원소 수가 0이 될 것이기 때문입니다. 따라서 어떤 .. 2019. 10. 18. 이전 1 ··· 16 17 18 19 20 21 22 다음 반응형