Processing math: 100%
본문 바로가기
반응형

분류 전체보기648

[손으로 푸는 통계 ver1.0] 90. 표본분산의 분포 시뮬레이션 (3) 누적분포함수 비교 지난 글에서 표본분산의 분포를 히스토그램으로 그려보았습니다. 모집단을 설정하고 실제 표본을 뽑아서 그린 히스토그램과 표본크기에서 1을 뺀 자유도를 갖는 카이제곱분포 함수를 그렸다. 모집단이 균등분포를 따르는 경우 표본분산의 분포와 카이제곱분포는 잘 일치하지 않았습니다. 위에 그린 함수는 확률밀도함수인데요. 표본분산의 분포를 그릴 때 히스토그램 형태로 그려야 하기 때문에 구간 간격에 따라 모양이 조금씩 달라집니다. 누적분포함수로 그릴 경우 이러한 문제가 없어지기 때문에 누적분포함수로도 그려보려고 합니다. 실험 방법은 앞의 글과 동일합니다. 모집단은 네 가지 종류로 설정했습니다. 모집단1 : 1~10 의 자연수. 1:10으로 표기 모집단2 : 1~1000 의 자연수. 1:1000으로 표기 모집단3 : 표준정.. 2022. 6. 8.
[손으로 푸는 통계 ver1.0] 89. 표본분산의 분포 시뮬레이션 (2) 뭔가 이상하다 아래는 지난시간에 그렸던 그래프입니다. 1~10의 자연수를 갖는 모집단에서 크기가 30인 표본을 뽑고, 표본분산의 분포를 그래프로 그린 것입니다. 더 정확히 말하면 아래 확률변수의 분포입니다. n1σ2s2 오른쪽 그림은 29자유도의 카이제곱분포입니다. n이 커지면 표본분산의 그래프는 n-1 자유도 카이제곱분포를 따른다고 알려져 있습니다. 나란히 그려진 상태에서 보니 비슷해 보였는데요. 그래프를 겹쳐서 그려보니 이야기가 달라졌습니다. 많이 다릅니다. 겹쳐 그린 그래프로 다시 시뮬레이션을 해보려고 합니다. 모집단을 더 다양화했고 절차도 가다듬었습니다. 1. 배경 우리가 표본분산의 분포를 유도할 때 설정했던 두 가지 조건은 아래와 같습니다. 1) 표본평균의 분포가 정규.. 2022. 6. 6.
[신뢰도와 신뢰구간의 이해] 4. 신뢰도가 높으면 좋은걸까? 신뢰도는 높을 수록 좋은걸까요? 의문을 해결하기 위해 수능 문제를 하나 가져왔습니다. 문제에서 표본의 크기는 100이고, 표본평균이 245, 표본표준편차가 20 입니다. 95% 신뢰도로 신뢰구간을 계산하면 아래와 같습니다. 모표준편차를 모르기 때문에 표본표준편차를 대신 사용합시다. 여기서 발생하는 오차에 대해서는 나중에 다루기로 합시다. ˉX11.96σnμˉX1+1.96σn 2451.9620100μ245+1.9620100 $241.1 \.. 2022. 6. 3.
[통계 적률의 이해] 11. 정규분포의 왜도 구하기 지난시간에 정규분포의 중심적률생성함수를 구했습니다. 아래와 같습니다. Mxμ(t)=eσ2t22 오늘은 정규분포의 중심적률함수를 이용해서 정규분포의 왜도를 계산해보려고 합니다. 왜도를 중심적률로 나타내면 아래와 같습니다. γ1=μ3(μ2)32 μ2 는 2차 중심적률, μ3는 3차 중심적률입니다. 중심적률생성함수를 한번 미분합시다. dMxμ(t)dt=eσ2t22σ2t 한번 더 미분합시다. $\frac{d^{2}M_{x-\mu}(t)}{dt^{2}.. 2022. 5. 25.
[통계 적률의 이해] 10. 정규분포의 중심적률생성함수 지난 시간에 우리는 정규분포의 적률생성함수를 이용하여 평균과 분산을 구했습니다. 우리가 구했던 정규분포의 적률생성함수는 아래와 같습니다. MX(t)=E(etX)=eμt+σ2t22 이제 왜도를 구할 차례인데요. 1,2,3차 적률을 이용하여 왜도를 구하는 방법은 아래와 같습니다. γ1=μ33μ1μ2+2{μ1}3[μ2{μ1}2]32 중심적률을 이용하면 훨씬 간단하게 구할 수 있었습니다. $\gamma _{1}=\frac.. 2022. 5. 24.
[확률과통계 기초] 1-9. 이항정리 원리 이해하기 이항정리는 조합을 배우고 나서 바로 등장합니다. 이항정리에 조합이 사용되기 때문입니다. '이항'이라고 하면 '항을 옮긴다'는 뜻에 더 익숙하실 겁니다. 이항정리에서 이항은 항을 옮긴다는 뜻이 아니라 '두개의 항'이라는 뜻입니다. 이항정리는 두개의 항으로된 식을 거듭제곱한 식을 전개하는 방법입니다. 가장 간단한 형태는 아래와 같습니다. (a+b)n 결론부터 말씀드리면 아래와 같이 전개할 수 있습니다. (a+b)n=nCn an+nCn1 an1b+nCn2 an2b2++nC1 abn1+nC0 bn 원리를 알아봅시다. 작은 숫자부터 시작하겠습니다. n에 2를 넣어봅시다.. 2022. 5. 20.
[확률과통계 기초] 1-8. 조합의 성질 (2) nCr=n1Cr+n1Cr1 직관적이해와 증명 지난시간에 이어서 조합의 성질을 알아봅시다. 오늘은 아래 두 성질 중 두번째 성질을 공부해보겠습니다. 1) nCr=nCnr2) nCr=n1Cr+n1Cr1 n개에서 r개를 뽑는 것과, n1개에서 r개를 뽑고 n1개에서 r1개를 뽑는 것의 경우의 수가 같다는 성질입니다. 숫자를 넣어 보면 아래와 같습니다. 5C3=4C3+4C2 수학적으로 증명하기 전에 직관적으로 이해해봅시다. ABCDE 중에 3개를 뽑는 경우를 생각해 봅시다.  ABC ABD ABE ... 위 경우는 둘로 나눌 수 있습니다. A가 들어있는 경우와 A가 들어있지 않은 경우입니다.  A가 들어간 경우의 수는 A를 제.. 2022. 5. 20.
[확률과통계 기초] 1-7. 조합의 성질 (1) nCr=nCnr 직관적이해와 증명 n개 중에서 r개를 뽑는 조합은 아래와 같이 계산됩니다.  nCr=n!(nr)!r! 오늘은 조합의 대표적인 성질 두 가지를 알아봅시다. 이런저런 유도 과정에서 자주 사용되므로, 익숙해 지는 것이 좋습니다. 1) nCr=nCnr 2) nCr=n1Cr+n1Cr1 오늘은 첫번째 성질을 알아봅시다. n개 중에 r개를 뽑는 것과, n개 중에 n-r개를 뽑는 것이 같다는 성질입니다. 숫자를 넣어보면 아래와 같습니다. 5C3=5C2 다섯개 중에 3개를 뽑는 경우의 수와, 5개 중에 2개를 뽑는 경우의 수가 같습니다. 수학적으로 증명하기 전에 직관적으로 이해해봅시다. ABCDE 중에 3개를 뽑.. 2022. 5. 20.
[확률과통계 기초] 1-6. 조합이란 무엇인가 조합이 무엇인지는 '조합'이라는 한 단어로 설명하기는 어렵습니다. 조합은 아래와 같이 사용합니다.  'n개에서 r개를 택하는 조합' '서로 다른 n개 중에서 순서에 상관없이 r개를 선택하는 것' 이라는 뜻입니다. 예를 들어 a,b,c 세개의 알파벳 중에서 2개를 택하는 조합은 아래와 같습니다.  abacbc 순열에서는 ab와 ba가 서로 다른 경우였는데, 조합에서는 순서를 고려하지 않으므로 같은 경우입니다. 이렇게 택하는 경우의 수를 조합의 수라고 합니다.   용어설명예시n개에서 r개를 택하는 조합서로 다른 n개 중에서 순서에 상관 없이r개를 선택하는 것a,b,c 에서 2개를 택하는 조합조합의 수조합의 경우의 수3가지 조금 더 복잡한 예시를 통해 조합의 수를 계산해보고 나서 일반화합시다. 알파벳 a,b,.. 2022. 5. 20.
[확률과통계 기초] 1-5. 순열이란 무엇인가 순열은 '순서가 있는 나열'입니다. 순열이라는 두글자만 사용하는 경우는 드물고, 아래와 같이 사용합니다.  'n개에서 r개를 택하는 순열'  풀어서 설명하면 이렇습니다. '서로 다른 n개 중에서 r개를 뽑아서 순서가 있게 나열하는 것' 예를 들면 a,b,c 세개의 알파벳 중에서 2개를 택하는 순열은 아래와 같습니다.  abbcaccabccb 이 때, 나열하는 개수를 '순열의 수'라고 합니다. 3개 중에서 2개를 택하는 순열의 수는 6가지인 것입니다.  좀 헷갈리죠. 정리해봅시다.  용어의미예시순열순서가 있는 나열 n개에서 r개를 택하는 순열n개에서 r개를 뽑아서 순서가 있게 나열a,b,c 에서 2개를 택하는 순열순열의 수순서가 있게 나열하는 경우의 수6가지 조금 더 복잡한 예시를 통해 순열의 수를 계산해.. 2022. 5. 20.
[확률과통계 기초] 1-4. 합사건, 곱사건, 배반사건, 여사건 우리는 지난시간까지 시행, 표본공간, 사건 이라는 용어를 배웠습니다. 오늘도 용어를 배우는 시간인데요. 네자기 종류의 사건을 배워볼 것입니다. 합사건, 곱사건, 배반사건, 여사건입니다. 어떤 시행의 표본공간을 S라고 합시다. 이 말이 이해되시나요? 표본공간은 어떤 시행 결과로 나올 수 있는 전체집합입니다. 주사위를 던지는 시행을 했다면 표본공간은 아래와 같습니다. S={1,2,3,4,5,6} 사건은 표본공간의 부분집합입니다. 주사위 던지기라는 시행의 사건을 몇가지 적어보면 아래와 같습니다. 홀수의 눈이 나오는 사건 = {1,3,5} 짝수의 눈이 나오는 사건 = {2,4,6} 3이상의 눈이 나오는 사건 = {3,4,5,6} 1. 합사건 (사건들의 합집합) 표본공간의 부분집.. 2022. 5. 20.
[확률과통계 기초] 1-3. 시행,표본공간,사건 한눈에보기 우리가 지난 시간까지 시행, 표본공간,사건 이라는 용어를 배웠습니다. 시행,표본공간,사건은 자주 사용되는 용어라서 익숙하게 만들어야 합니다. 이미 배운내용이지만 한번 더 복습해봅시다. 각 용어의 정의는 아래와 같습니다. 시행 : 무한히 반복될 수 있고, 잘 정의된 결과 집합을 갖는 행위 표본공간 : 어떤 시행에서 발생할 수 있는 모든 결과를 모아놓은 집합 사건 : 어떤 시행의 결과들의 집합. 확률이 할당되어 있음. 표본공간의 부분집합. 시행,표본공간,사건을 쉽게 기억하는 방법은 주사위 던지기 예시로 기억하는 것입니다. 시행은 주사위던지기이고, 표본공간은 1부터6 까지의 집합이고, 사건은 짝수의 눈이 나오는 사건이나 홀수의 눈이 나오는 사건 등 표본공간의 부분집합입니다. 시행 표본공간 사건 주사위 던지기 .. 2022. 5. 20.
[확률과통계] 독립사건의 두 가지 맥락 독립사건을 처음 배우는 시기는 고등학교 수학시간입니다. 두 사건 A와 B가 있을 때, 아래 등식을 만족하면 서로 독립입니다. P(XY)=P(X)P(Y) 주사위를 한 번 던질 때, 아래 두 사건이 독립인지 판단하시오. 라는 문제를 풀었던 기억이 있습니다. A={1,2,3} B={4,5,6} 확률을 계산해봅시다. P(A)=0.5 P(B)=0.5 P(AB)=0 등식이 성립하지 않으므로 독립이 아닙니다. A와 B는 배반사건인데요. 배반사건은 종속이라는걸 기억하시는 분들도 계실겁니다. 위 문제를 아래와 같이 바꿔봅시다. 아래 두 사건이 독립인지 판단하시오. A={1,2,3} $B=.. 2022. 5. 18.
[확률과통계] 짝수눈 vs 홀수눈 배반사건일까? 짝수눈과 홀수눈이 나오는 사건은 배반사건일까요? 그럴 수도 있고 아닐 수도 있습니다. 주사위를 한번 던질 때, 홀수눈이 나오는 사건과 짝수눈이 나오는 사건은 배반사건입니다. 홀수눈이 나오면 짝수눈은 나올 수 없기 때문입니다. 주사위를 두 개로 늘려봅시다. 주사위 A와 주사위 B가 있습니다. 두 주사위를 던질 때 주사위 A에서 홀수 눈이 나오는 사건과, 주사위 B에서 짝수 눈이 나오는 사건은 배반사건이 아닙니다. 서로 전혀 영향을 주지 않습니다. 둘은 서로 독립관계입니다. 배반사건으로 보이는데 알고 보면 독립사건이라 헷갈릴 때가 있는데요. 위와 같이 구분을 해놓으면 덜 헷갈립니다. 2022. 5. 18.
[손으로 푸는 통계 ver1.0] 88. 표본분산의 분포 시뮬레이션 (1) 확률밀도함수 비교 우리가 표본분산의 분포를 유도할 때 설정했던 두가지 조건입니다. 1) 표본평균의 분포가 정규분포를 따를 만큼 표본의 크기 n이 크다. 2) 모집단의 분포는 정규분포를 따른다. 1번은 표본의 크기를 충분히 크게 하면 되는거구요. 두번째 조건도 표본의 크기가 충분히 크면 무시할 수 있다는 것을 지난시간에 다뤘습니다. 증명하진 않고 증명이 되어 있는 논문만 보여드렸습니다. 오늘은 통계 프로그램인 R을 이용해서 정말 표본의 크기가 충분히 크면 모집단이 정규분포를 따르지 않아도 표본분산이 카이제곱분포를 따르는지 확인해보려고 합니다. 모집단은 1부터 10까지의 자연수로 설정했습니다. 전혀 정규분포가 아닙니다. 모집단 = {1,2,3,4,5,6,7,8,9,10} 크기가 2인 표본 크기가 2인 표본을 10000개 뽑아.. 2022. 5. 12.
자유도란 무엇이며, 표본과 모집단의 평균과 분산의 자유도는 무엇인가 통계학에서 자유도가 어떻게 정의됐는지 알기 위해 위키피디아의 정의를 가져왔습니다. In statistics, the number of degrees of freedom is the number of values in the final calculation of a statistic that are free to vary. "통계량의 최종 계산에서 자유롭게 바뀔 수 있는 값의 개수" 모집단에서 표본을 뽑아 평균을 구할 때 표본의 원소는 자유롭게 바뀔 수 있습니다. 반드시 얼마여야 한다는 조건이 없습니다. 표본을 뽑을 때마다 달라집니다. n개를 뽑는다면 n개 모두 표본을 뽑을 때마다 자유롭게 바뀔 수 있습니다. 따라서 표본평균의 자유도는 n입니다. 표본분산의 자유도는 얼마일까요? 표본분산은 표본평균을 알아야.. 2022. 5. 12.
[확률과통계 기초] 1-2. 사건 지난 시간에는 시행과 표본공간이라는 용어를 배웠습니다. 이번 시간에는 중요한 용어를 한가지 더 배워보겠습니다. 오늘 배워볼 용어는 사건입니다. 사건이 무엇인지 정확하게 이해하기 위해서 위키피디아의 정의를 가져왔습니다. In probability theory, an event is a set of outcomes of an experiment (a subset of the sample space) to which a probability is assigned. 간단히 요약해보았습니다. 사건은 시행 결과들의 집합이다. 이 집합에는 확률이 할당되어 있다. 지난 시간에 배운 표본공간도 시행결과들의 집합이었는데요. 표본공간에는 '가능한 모든' 이라는 말이 붙어있었습니다. 주사위 던지기를 예로 들면, 표본공간은 {.. 2022. 5. 10.
[확률과통계 기초] 1-1. 시행과 표본공간 오늘은 용어를 배워볼 것입니다. 서로 용어를 잘 정의해 놓으면 의사 소통이 편해집니다. 용어가 사용되는 내용들을 설명하기도 쉽고 이해하기도 쉬워집니다. 오늘 배울 용어는 시행과 표본공간이 무엇인지 알아봅시다. 시행이 무엇인지 정확하게 이해하기 위해서 위키피디아의 정의를 가져왔습니다. In probability theory, an experiment or trial (see below) is any procedure that can be infinitely repeated and has a well-defined set of possible outcomes, known as the sample space. 약간의 의역을 가미해서 이해하기 쉽게 번역해봅시다. 확률론에서 시행은 1)무한히 반복될 수 있고 2).. 2022. 5. 9.
[확률과 통계 기초] 0. 전체 내용 큰그림 그리기 확률과 통계 기초는 통계학을 공부하시는 분들 중 고등학교 '확률과 통계' 내용을 잊어버리셨거나 배우지 않은 분들을 위한 강의입니다. 중고등학교 확률과통계 내용을 제대로 공부하지 않았던 분들은 통계학을 공부할 때 이해가 되지 않는 부분이 많을 것입니다. 이런 분들을 위한 강의구요. 고등학교 확률과 통계 내용 중에서 통계학을 공부할 때 필요한 내용만 추려보았습니다. 고등학교 확률과 통계 과목은 크게 세개의 단원으로 구성됩니다. 1. 경우의 수 2. 확률 3. 통계 각 단원에서 필요한 내용들만 추리면 아래와 같습니다. 통계는 내용이 많아서 세개의 중단원으로 나눴습니다. 중단원은 확률변수와 확률분포, 모집단과 표본, 통계적 추정입니다. 영상의 순서나 제목은 강의를 진행하며 조금씩 바뀔 수 있습니다. 내용도 추가.. 2022. 5. 9.
z분포 vs t분포 표본의 크기에 따른 z분포와 t분포의 차이입니다. n이 3일 때는 t분포가 z분포보다 두터운 꼬리를 갖고 있습니다. n이 커질 수록 t 분포가 z분포에 가까워져 갑니다. 꼬리가 두텁다는 말은 같은 통계량에서 p값이 더 크다는 말입니다. p값이 커서 기각을 덜하게 되므로 보수적이라 할 수 있습니다. n이 커지면서 t분포는 z분포에 가까워져 갑니다. 얼마나 더 보수적인지 수치로 알아봅시다. 표본크기 z값 (p값) t값 (p값) 3 1.644854 (0.05) 1.644854 (0.099) 10 1.644854 (0.05) 1.644854 (0.065) 30 1.644854 (0.05) 1.644854 (0.055) 50 1.644854 (0.05) 1.644854 (0.053) 표본 크기가 30 정도여도 차.. 2022. 5. 9.
[통계 Q&A] 적률생성함수 만들때 어떻게 X만 대체해도 되나요? Q) 적률생성함수 만들때 어떻게 X만 대체해도 되나요? 질문을 이해하기 위해 약간의 배경설명을 하겠습니다. 확률변수 X의 평균은 아래와 같이 구합니다. E[X]=xf(x)dx 적률생성함수는 X자리에 etX 를 넣어서 구합니다. E[etX]=etxf(x)dx 이때 왜 우변의 x 하나만 etX 로 교체할 수 있냐는 질문입니다. f(x)안에도 x가 있고, dx에도 x가 있으니 다 교체해야하는 것 아닌가라는 의문이 드신 것 같아요. A) E[ ] 는 함수가 아닙니다. 그냥 기호입니다. '대괄호 안에 있는 확률변수의 기댓값' 이라고 매번.. 2022. 5. 4.
히스토그램 간격 설정 원리 엑셀이나 R에서 히스토그램을 그리면 알아서 간격을 설정해주는데요. 오늘은 그 원리를 알아봅시다. 히스토그램의 간격을 설정할 때는 일반적으로 Sturge's Rule 을 사용합니다. 데이터의 크기를 n이라고 할 때 간격의 개수는 아래와 같이 계산됩니다. 막대의 개수라고 생각하시면 됩니다. bin 이라고도 부릅니다. number of bins=log2n+1 괄호 기호는 '올림' 의 의미입니다. 2022. 5. 2.
분산 구하는 두 가지 방법 (제곱의평균-평균의제곱 유도) 평균 아래와 같은 자료가 있다고 합시다. x1,x2,...,xn 이 자료를 변수 X로 나타낸다고 합시다. X={x1,x2,...,xn} X의 평균은 아래와 같이 정의됩니다. E[X]=x1+x2++xnn 시그마 기호로 나타내면 아래와 같습니다. E[X]=x1+x2++xnn=ni=1xin 편의상 변수 X의 평균을 μ 라고 놓겠습니다. E[X]=μ 분산 변수 X의 분산은 아래와 같이 정의됩니다. 편차의 제곱의 평균입니다. $V[X]=E\left [ \left ( X-\mu \right )^2 \ri.. 2022. 4. 27.
[손으로 푸는 상관분석] 4. 공분산의 탄생 지난시간에 상관분석을 이해하기 위한 공부순서를 정해봤습니다. 공부 순서는 아래와 같습니다. 1) 공분산의 탄생 2) 공분산의 의미 3) 공분산 응용해서 피어슨 상관계수 만들기 4) 상관분석에서의 t통계량 유도하기 이번 글에서는 공분산의 탄생과정을 이해해봅시다. 공분산은 이름에 '분산'이라는 말이 붙어있습니다. 공분산이 등장한 역사적 배경을 정확히 알지는 못합니다. 예상해 볼 수는 있을겁니다. 제 생각에는 분산을 정의한 수식을 두개의 대응된 변수에 적용해보는 과정에서 탄생한 것 같습니다. X라는 변수가 있다고 합시다. X의 분산은 아래와 같이 정의됩니다. V[X]=E[(Xμx)(Xμx)] Y라는 변수가.. 2022. 4. 22.
[손으로 푸는 상관분석] 3. 공부 순서 정하기 지난시간에 산관분석 결과를 살펴봤습니다 .상관분석을 하면 t검정 결과인 p값과 상관계수가출력되는데요. 간단한 설명은 아래와 같습니다. t검정 : 관계의 유무를 나타냄. p 2022. 4. 20.
[손으로 푸는 상관분석] 2. 상관분석 결과 살펴보기 지난 시간에 아래 데이터를 가지고 상관분석을 했습니다. R에서 상관분석한 결과는 아래와 같았습니다. > cor.test(mdheight,mdweight) Pearson's product-moment correlation data: mdheightandmdweight t = 4.8325, df = 28, p-value = 4.385e-05 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.4148779 0.8323934 sample estimates: cor 0.6743531 결과를 보이는 대로 써보면 아래와 같습니다. 번호를 붙여서 쓰겠습니다. 1) t = 4.8325 2) df.. 2022. 4. 18.
[손으로 푸는 상관분석] 1. 일단 해보기 가장 만만한 엑셀로 상관분석을 일단 해봅시다. 상관분석이 뭔지 몰라도 괜찮습니다. 아래 데이터를 이용할 것입니다. 30명의 키와 몸무게 데이터입니다. 키는 mm 단위이고, 몸무게는 kg 단위입니다. 데이터 탭에서 '데이터 분석'을 클릭합니다. 통계 데이터분석이라는 창이 뜨면 상관분석을 선택하고 확인을 눌러줍니다. 입력범위를 클릭하고 키와 몸무게 데이터를 선택해줍니다. 열 이름도 포함되도록 선택합니다. 첫째 행 이름표 사용에 체크합니다. 출력범위는 같은 시트 내 적당한 셀을 선택합니다. 확인을 클릭하면 결과가 출력됩니다. 1과 0.67435가 상관계수입니다. 키와 키 사이의 상관계수가 1, 몸무게와 몸무게 사이의 상관계수가1, 키와 몸무게 사이의 상관계수가 0.6735라는 의미입니다. 엑셀에서는 상관계수만.. 2022. 4. 17.
[책 증정 이벤트] 데이터 요약과 시각화 with R (임경덕) 루비페이퍼 라는 출판사에서 책을 한권 보내왔습니다. 읽어보고 괜찮으면 채널에 이 책을 소개하면서 증정 이벤트를 하자고 제안하셨습니다. 책을 처음부터 끝까지 전부 읽어봤습니다. 잘 쓰여진 책인 것 같아서 소개를 드리려고 합니다. 10분을 추첨해서 책을 보내드릴 거구요. 이벤트 참여 방법은 더보기 란에 있습니다. 제가 돈을 받은게 아니라서 유료광고는 아니지 않나 생각했는데요. 알아보니 상품 무료제공도 유료광고라고 합니다. 그래서 영상 제목에 광고라고 표시한겁니다. 자 그럼 책 소개를 시작하겠습니다. 책 제목은 데이터 요약과 시각화 with R 입니다. R은 무료 통계 프로그램이구요. 오픈소스라서 참여자들이 계속해서 발전시켜 나가고 있는 프로그램입니다. 저도 R을 사용하고 있습니다. 통계를 처음 접한 시기에는.. 2022. 4. 16.
회귀분석 한번에 감잡기 (F값, t값) 아래는 예시 종속변수 : 성적(Y) 독립변수 : IQ, EQ, SQ 아래와 같은 모델을 가정함 Y=a×IQ+b×EQ+c×SQ+d F검정과 t검정 두가지를 수행함. 1) F검정은 아래 두 모델을 비교함 Y=d Y=a×IQ+b×EQ+c×SQ+d overall 한 비교라고 할 수 있음. 둘의 차이가 있으면 우리가 가정한 모델이 의미가 있는 것임. 2) t검정은 a,b,c,d 가 0인지 아닌지 비교함. 만약 F검정에서 모델이 의미가 있었어도, t검정에서 b=0이 나오면 EQ는 무의미한 값임. + R2은 (회귀선에 의해 설명되는 변동)/(전체변동) 을 의미함. 회귀 모델이 Y를 몇%정도 설명하는가를 알려줌. 2022. 4. 14.
[손으로 푸는 확률분포] 정규분포 (2) 과녁을 이용한 유도 정규분포를 유도하는 방법은 두 가지가 있습니다. 과녁 맞추기를 이용한 유도와 이항분포를 이용한 유도입니다. 두 유도방법 모두 '정규분포가 무엇인가' 라는 질문에 좋은 답변을 제공해줍니다. 오늘은 첫번째 방법인 '과녁 맞추기를 이용한 유도'를 알아봅시다. 우리가 어떤 물체의 길이를 측정하는 상황이라고 해봅시다. 우리가 측정할 때 마다 측정값은 조금씩 달라질 것입니다. 측정에는 항상 오차가 있기 때문입니다. 측정을 무한히 반복했다고 가정하고, 측정된 값들을 확률분포로 만들고 싶었습니다. 실제로 측정을 무한 번 하지는 않을 거구요. 그럴듯한 수학 모델을 만들어 볼 겁니다. 그럴듯한 수학 모델을 만들기 위해 물체의 길이를 측정하는 것과 비슷한 상황 하나를 생각해냈습니다. 바로 '과녁 맞추기' 입니다. 아래와 같.. 2022. 4. 1.
반응형