본문 바로가기
반응형

전체 글648

[손으로 푸는 통계 ver1.0] 90. 표본분산의 분포 시뮬레이션 (3) 누적분포함수 비교 지난 글에서 표본분산의 분포를 히스토그램으로 그려보았습니다. 모집단을 설정하고 실제 표본을 뽑아서 그린 히스토그램과 표본크기에서 1을 뺀 자유도를 갖는 카이제곱분포 함수를 그렸다. 모집단이 균등분포를 따르는 경우 표본분산의 분포와 카이제곱분포는 잘 일치하지 않았습니다. 위에 그린 함수는 확률밀도함수인데요. 표본분산의 분포를 그릴 때 히스토그램 형태로 그려야 하기 때문에 구간 간격에 따라 모양이 조금씩 달라집니다. 누적분포함수로 그릴 경우 이러한 문제가 없어지기 때문에 누적분포함수로도 그려보려고 합니다. 실험 방법은 앞의 글과 동일합니다. 모집단은 네 가지 종류로 설정했습니다. 모집단1 : 1~10 의 자연수. 1:10으로 표기 모집단2 : 1~1000 의 자연수. 1:1000으로 표기 모집단3 : 표준정.. 2022. 6. 8.
[손으로 푸는 통계 ver1.0] 89. 표본분산의 분포 시뮬레이션 (2) 뭔가 이상하다 아래는 지난시간에 그렸던 그래프입니다. 1~10의 자연수를 갖는 모집단에서 크기가 30인 표본을 뽑고, 표본분산의 분포를 그래프로 그린 것입니다. 더 정확히 말하면 아래 확률변수의 분포입니다. n1σ2s2n1σ2s2 오른쪽 그림은 29자유도의 카이제곱분포입니다. n이 커지면 표본분산의 그래프는 n-1 자유도 카이제곱분포를 따른다고 알려져 있습니다. 나란히 그려진 상태에서 보니 비슷해 보였는데요. 그래프를 겹쳐서 그려보니 이야기가 달라졌습니다. 많이 다릅니다. 겹쳐 그린 그래프로 다시 시뮬레이션을 해보려고 합니다. 모집단을 더 다양화했고 절차도 가다듬었습니다. 1. 배경 우리가 표본분산의 분포를 유도할 때 설정했던 두 가지 조건은 아래와 같습니다. 1) 표본평균의 분포가 정규.. 2022. 6. 6.
[신뢰도와 신뢰구간의 이해] 4. 신뢰도가 높으면 좋은걸까? 신뢰도는 높을 수록 좋은걸까요? 의문을 해결하기 위해 수능 문제를 하나 가져왔습니다. 문제에서 표본의 크기는 100이고, 표본평균이 245, 표본표준편차가 20 입니다. 95% 신뢰도로 신뢰구간을 계산하면 아래와 같습니다. 모표준편차를 모르기 때문에 표본표준편차를 대신 사용합시다. 여기서 발생하는 오차에 대해서는 나중에 다루기로 합시다. ˉX11.96σnμˉX1+1.96σn¯X11.96σnμ¯X1+1.96σn 2451.9620100μ245+1.96201002451.9620100μ245+1.9620100 $241.1 \.. 2022. 6. 3.
[통계 적률의 이해] 11. 정규분포의 왜도 구하기 지난시간에 정규분포의 중심적률생성함수를 구했습니다. 아래와 같습니다. Mxμ(t)=eσ2t22Mxμ(t)=eσ2t22 오늘은 정규분포의 중심적률함수를 이용해서 정규분포의 왜도를 계산해보려고 합니다. 왜도를 중심적률로 나타내면 아래와 같습니다. γ1=μ3(μ2)32γ1=μ3(μ2)32 μ2μ2 는 2차 중심적률, μ3μ3는 3차 중심적률입니다. 중심적률생성함수를 한번 미분합시다. dMxμ(t)dt=eσ2t22σ2tdMxμ(t)dt=eσ2t22σ2t 한번 더 미분합시다. $\frac{d^{2}M_{x-\mu}(t)}{dt^{2}.. 2022. 5. 25.
[통계 적률의 이해] 10. 정규분포의 중심적률생성함수 지난 시간에 우리는 정규분포의 적률생성함수를 이용하여 평균과 분산을 구했습니다. 우리가 구했던 정규분포의 적률생성함수는 아래와 같습니다. MX(t)=E(etX)=eμt+σ2t22MX(t)=E(etX)=eμt+σ2t22 이제 왜도를 구할 차례인데요. 1,2,3차 적률을 이용하여 왜도를 구하는 방법은 아래와 같습니다. γ1=μ33μ1μ2+2{μ1}3[μ2{μ1}2]32 중심적률을 이용하면 훨씬 간단하게 구할 수 있었습니다. $\gamma _{1}=\frac.. 2022. 5. 24.
[확률과통계 기초] 1-9. 이항정리 원리 이해하기 이항정리는 조합을 배우고 나서 바로 등장합니다. 이항정리에 조합이 사용되기 때문입니다. '이항'이라고 하면 '항을 옮긴다'는 뜻에 더 익숙하실 겁니다. 이항정리에서 이항은 항을 옮긴다는 뜻이 아니라 '두개의 항'이라는 뜻입니다. 이항정리는 두개의 항으로된 식을 거듭제곱한 식을 전개하는 방법입니다. 가장 간단한 형태는 아래와 같습니다. (a+b)n 결론부터 말씀드리면 아래와 같이 전개할 수 있습니다. (a+b)n=nCn an+nCn1 an1b+nCn2 an2b2++nC1 abn1+nC0 bn 원리를 알아봅시다. 작은 숫자부터 시작하겠습니다. n에 2를 넣어봅시다.. 2022. 5. 20.
[확률과통계 기초] 1-8. 조합의 성질 (2) nCr=n1Cr+n1Cr1 직관적이해와 증명 지난시간에 이어서 조합의 성질을 알아봅시다. 오늘은 아래 두 성질 중 두번째 성질을 공부해보겠습니다. 1) nCr=nCnr2) nCr=n1Cr+n1Cr1 n개에서 r개를 뽑는 것과, n1개에서 r개를 뽑고 n1개에서 r1개를 뽑는 것의 경우의 수가 같다는 성질입니다. 숫자를 넣어 보면 아래와 같습니다. 5C3=4C3+4C2 수학적으로 증명하기 전에 직관적으로 이해해봅시다. ABCDE 중에 3개를 뽑는 경우를 생각해 봅시다.  ABC ABD ABE ... 위 경우는 둘로 나눌 수 있습니다. A가 들어있는 경우와 A가 들어있지 않은 경우입니다.  A가 들어간 경우의 수는 A를 제.. 2022. 5. 20.
[확률과통계 기초] 1-7. 조합의 성질 (1) nCr=nCnr 직관적이해와 증명 n개 중에서 r개를 뽑는 조합은 아래와 같이 계산됩니다.  nCr=n!(nr)!r! 오늘은 조합의 대표적인 성질 두 가지를 알아봅시다. 이런저런 유도 과정에서 자주 사용되므로, 익숙해 지는 것이 좋습니다. 1) nCr=nCnr 2) nCr=n1Cr+n1Cr1 오늘은 첫번째 성질을 알아봅시다. n개 중에 r개를 뽑는 것과, n개 중에 n-r개를 뽑는 것이 같다는 성질입니다. 숫자를 넣어보면 아래와 같습니다. 5C3=5C2 다섯개 중에 3개를 뽑는 경우의 수와, 5개 중에 2개를 뽑는 경우의 수가 같습니다. 수학적으로 증명하기 전에 직관적으로 이해해봅시다. ABCDE 중에 3개를 뽑.. 2022. 5. 20.
[확률과통계 기초] 1-6. 조합이란 무엇인가 조합이 무엇인지는 '조합'이라는 한 단어로 설명하기는 어렵습니다. 조합은 아래와 같이 사용합니다.  'n개에서 r개를 택하는 조합' '서로 다른 n개 중에서 순서에 상관없이 r개를 선택하는 것' 이라는 뜻입니다. 예를 들어 a,b,c 세개의 알파벳 중에서 2개를 택하는 조합은 아래와 같습니다.  abacbc 순열에서는 ab와 ba가 서로 다른 경우였는데, 조합에서는 순서를 고려하지 않으므로 같은 경우입니다. 이렇게 택하는 경우의 수를 조합의 수라고 합니다.   용어설명예시n개에서 r개를 택하는 조합서로 다른 n개 중에서 순서에 상관 없이r개를 선택하는 것a,b,c 에서 2개를 택하는 조합조합의 수조합의 경우의 수3가지 조금 더 복잡한 예시를 통해 조합의 수를 계산해보고 나서 일반화합시다. 알파벳 a,b,.. 2022. 5. 20.
[확률과통계 기초] 1-5. 순열이란 무엇인가 순열은 '순서가 있는 나열'입니다. 순열이라는 두글자만 사용하는 경우는 드물고, 아래와 같이 사용합니다.  'n개에서 r개를 택하는 순열'  풀어서 설명하면 이렇습니다. '서로 다른 n개 중에서 r개를 뽑아서 순서가 있게 나열하는 것' 예를 들면 a,b,c 세개의 알파벳 중에서 2개를 택하는 순열은 아래와 같습니다.  abbcaccabccb 이 때, 나열하는 개수를 '순열의 수'라고 합니다. 3개 중에서 2개를 택하는 순열의 수는 6가지인 것입니다.  좀 헷갈리죠. 정리해봅시다.  용어의미예시순열순서가 있는 나열 n개에서 r개를 택하는 순열n개에서 r개를 뽑아서 순서가 있게 나열a,b,c 에서 2개를 택하는 순열순열의 수순서가 있게 나열하는 경우의 수6가지 조금 더 복잡한 예시를 통해 순열의 수를 계산해.. 2022. 5. 20.
[확률과통계 기초] 1-4. 합사건, 곱사건, 배반사건, 여사건 우리는 지난시간까지 시행, 표본공간, 사건 이라는 용어를 배웠습니다. 오늘도 용어를 배우는 시간인데요. 네자기 종류의 사건을 배워볼 것입니다. 합사건, 곱사건, 배반사건, 여사건입니다. 어떤 시행의 표본공간을 S라고 합시다. 이 말이 이해되시나요? 표본공간은 어떤 시행 결과로 나올 수 있는 전체집합입니다. 주사위를 던지는 시행을 했다면 표본공간은 아래와 같습니다. S={1,2,3,4,5,6} 사건은 표본공간의 부분집합입니다. 주사위 던지기라는 시행의 사건을 몇가지 적어보면 아래와 같습니다. 홀수의 눈이 나오는 사건 = {1,3,5} 짝수의 눈이 나오는 사건 = {2,4,6} 3이상의 눈이 나오는 사건 = {3,4,5,6} 1. 합사건 (사건들의 합집합) 표본공간의 부분집.. 2022. 5. 20.
[확률과통계 기초] 1-3. 시행,표본공간,사건 한눈에보기 우리가 지난 시간까지 시행, 표본공간,사건 이라는 용어를 배웠습니다. 시행,표본공간,사건은 자주 사용되는 용어라서 익숙하게 만들어야 합니다. 이미 배운내용이지만 한번 더 복습해봅시다. 각 용어의 정의는 아래와 같습니다. 시행 : 무한히 반복될 수 있고, 잘 정의된 결과 집합을 갖는 행위 표본공간 : 어떤 시행에서 발생할 수 있는 모든 결과를 모아놓은 집합 사건 : 어떤 시행의 결과들의 집합. 확률이 할당되어 있음. 표본공간의 부분집합. 시행,표본공간,사건을 쉽게 기억하는 방법은 주사위 던지기 예시로 기억하는 것입니다. 시행은 주사위던지기이고, 표본공간은 1부터6 까지의 집합이고, 사건은 짝수의 눈이 나오는 사건이나 홀수의 눈이 나오는 사건 등 표본공간의 부분집합입니다. 시행 표본공간 사건 주사위 던지기 .. 2022. 5. 20.
[확률과통계] 독립사건의 두 가지 맥락 독립사건을 처음 배우는 시기는 고등학교 수학시간입니다. 두 사건 A와 B가 있을 때, 아래 등식을 만족하면 서로 독립입니다. P(XY)=P(X)P(Y) 주사위를 한 번 던질 때, 아래 두 사건이 독립인지 판단하시오. 라는 문제를 풀었던 기억이 있습니다. A={1,2,3} B={4,5,6} 확률을 계산해봅시다. P(A)=0.5 P(B)=0.5 P(AB)=0 등식이 성립하지 않으므로 독립이 아닙니다. A와 B는 배반사건인데요. 배반사건은 종속이라는걸 기억하시는 분들도 계실겁니다. 위 문제를 아래와 같이 바꿔봅시다. 아래 두 사건이 독립인지 판단하시오. A={1,2,3} $B=.. 2022. 5. 18.
[확률과통계] 짝수눈 vs 홀수눈 배반사건일까? 짝수눈과 홀수눈이 나오는 사건은 배반사건일까요? 그럴 수도 있고 아닐 수도 있습니다. 주사위를 한번 던질 때, 홀수눈이 나오는 사건과 짝수눈이 나오는 사건은 배반사건입니다. 홀수눈이 나오면 짝수눈은 나올 수 없기 때문입니다. 주사위를 두 개로 늘려봅시다. 주사위 A와 주사위 B가 있습니다. 두 주사위를 던질 때 주사위 A에서 홀수 눈이 나오는 사건과, 주사위 B에서 짝수 눈이 나오는 사건은 배반사건이 아닙니다. 서로 전혀 영향을 주지 않습니다. 둘은 서로 독립관계입니다. 배반사건으로 보이는데 알고 보면 독립사건이라 헷갈릴 때가 있는데요. 위와 같이 구분을 해놓으면 덜 헷갈립니다. 2022. 5. 18.
[손으로 푸는 통계 ver1.0] 88. 표본분산의 분포 시뮬레이션 (1) 확률밀도함수 비교 우리가 표본분산의 분포를 유도할 때 설정했던 두가지 조건입니다. 1) 표본평균의 분포가 정규분포를 따를 만큼 표본의 크기 n이 크다. 2) 모집단의 분포는 정규분포를 따른다. 1번은 표본의 크기를 충분히 크게 하면 되는거구요. 두번째 조건도 표본의 크기가 충분히 크면 무시할 수 있다는 것을 지난시간에 다뤘습니다. 증명하진 않고 증명이 되어 있는 논문만 보여드렸습니다. 오늘은 통계 프로그램인 R을 이용해서 정말 표본의 크기가 충분히 크면 모집단이 정규분포를 따르지 않아도 표본분산이 카이제곱분포를 따르는지 확인해보려고 합니다. 모집단은 1부터 10까지의 자연수로 설정했습니다. 전혀 정규분포가 아닙니다. 모집단 = {1,2,3,4,5,6,7,8,9,10} 크기가 2인 표본 크기가 2인 표본을 10000개 뽑아.. 2022. 5. 12.
반응형