본문 바로가기
반응형

전체 글647

[손으로 푸는 통계 ver1.0] 79. aX가 정규분포를 다를 때, X도 정규분포를 따를까 변수 aX가 평균이 $\mu$이고, 분산이 $\sigma^{2}$인 정규분포를 따른다고 합시다. 기호로는 아래와 같이 나타냅니다. $aX \sim N \left( \mu,\sigma^{2} \right)$ aX의 확률밀도함수를 f(ax), 누적분포함수를 F(ax)라고 놓겠습니다. F(ax) 는 아래와 같이 정의됩니다. P[aX 2021. 11. 22.
이항분포, 정규분포, 푸아송분포의 관계 이항분포를 정규분포로 근사할 때도 n을 무한대로 보내고, 푸아송분포로 보낼 때도 n을 무한대로 보내니 혼란이 오시는 분들이 계실겁니다. 오늘은 이 문제를 해결해봅시다. 이항분포, 푸아송분포, 정규분포 함수는 아래와 같습니다. 이항분포 : $f(x)=\binom{n}{x} p^{x}(1-p)^{n-x}$ 푸아송분포 : $f(x)=\frac{\lambda^{x}e^{-\lambda}}{x!}$ 정규분포 : $f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x-\mu}{\sigma} \right )^{2}}$ 이항분포를 정규분포로 근사할 때는 p를 고정한 상태로 n을 무한대로 보냅니다. 예를 들면 앞면이 나오는 확률(p)는 고정되고, 동전을 던지는.. 2021. 11. 19.
양측검정과 단측검정의 검정력은 같을까 다를까 가설검정에는 두가지 오류가 있습니다. 1종오류인 α와 2종오류인 β 입니다. 1종오류는 신뢰도와 관련 있고, 2종오류는 검정력과 관련이 있습니다. 관계는 아래와 같습니다. 1종오류(α) = 1-신뢰도 2종오류(β) = 1-검정력 양측검정에서 단측검정으로 바뀐다고 해서 1종오류가 바뀌지는 않습니다. 한쪽에 0.05를 몰아주던 것이 양쪽에 0.025씩 나뉘주는 것으로 바뀔 뿐입니다. 전체 오류는 0.05로 동일합니다. 하지만 2종오류 입장에서는 다릅니다. 단측검정이 양측검정으로 바뀌게 되면 위에 보이시는 세로 선이 우측으로 이동하게 되고, 2종오류는 커지는 결과를 낳습니다. 따라서 단측검정이 양측검정으로 바뀌면 검정력은 줄어들게 됩니다. 2021. 11. 12.
[t분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 t분포의 통계량들을 표로 요약한 내용입니다. 정의 - 표본평균을 정의하는 모표준편차 대신 표본표준편차를 넣어 정의된 확률변수의 확률분포 - 정규분포보다 꼬리쪽이 heavy함 정의역 $-\infty 2021. 11. 10.
[카이제곱분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 카이제곱분포의 통계량들을 표로 요약한 내용입니다.  k는 자유도입니다.  정의표준정규분포를 따르는 확률변수들의 제곱합을 확률변수로 하는 분포정의역$\left\{\begin{matrix} 00 \leq x \end{matrix}\right.$분포함수$f(x;k)=\frac{1}{2^{\frac{k}{2}}\Gamma \left ( \frac{k}{2} \right )}x^{\frac{k}{2}-1}e^{-\frac{x}{2}}$누적분포함수$F(x;k)=\frac{1}{\Gamma \left ( \frac{k}{2} \right )}\cdot   \gamma \left ( \frac{k}{2},\frac{x}{2} \right )$평균$k$분산$2k$왜도$\sqrt{\frac{8}{k}}$첨도$\frac{1.. 2021. 11. 8.
[정규분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 정규분포에 대한 통계량들을 표로 요약한 내용입니다. 정의 - 평균에 대해 대칭이고, 평균에 가까울 수록 발생 확률이 높아지는 분포 - 주어진 표준편차에서 미분엔트로피를 최대화하는 분포 분포함수 $\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x-\mu}{\sigma} \right )^{2}}$ 누적분포함수 $\int_{-\infty}^{x}\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{t-\mu}{\sigma} \right )^{2}}dt=\frac{1}{2}\left [ 1+\mathrm{erf}\left ( \frac{x-\mu}{\sqrt{2}\sigma} \right ) \right ]$.. 2021. 11. 5.
[통계 적률의 이해] 9. 정규분포의 적률생성함수로 평균,분산 구해보기 지난시간에 유도한 정규분포의 적률생성함수는 아래와 같습니다. $M_{X}(t)=E(e^{tX})=e^{ \mu t+\frac{ \sigma^2 t^2 }{2} }$ 적률생성함수를 이용하여 평균, 표준편차, 왜도, 첨도를 구해봅시다. 1. 평균 적률생성함수를 한번 미분하고 t에 0을 넣으면 됩니다. 적률생성함수를 한번 미분합시다. $\frac{dM_{X}(t)}{dt}=E(Xe^{tX})=e^{ \mu t+\frac{ \sigma^2 t^2 }{2} } \times \left (\mu+\sigma^{2}t \right )$ t에 0을 넣겠습니다. $\left.\begin{matrix} \frac{dM_{X}(t)}{dt} \end{matrix}\right|_{t=0}=E(X)=\mu$ 2. 분산 분산은 아.. 2021. 11. 4.
[통계 적률의 이해] 8. 정규분포의 적률생성함수 적률생성함수가 무엇인지 알게되었으니 실제 확률변수에 적용해봅시다. 가장 대표적인 분포인 정규분포를 따르는 확률변수에 적용하겠습니다. 적률생성함수의 정의는 아래와 같습니다. $M_{X}(t)=E\left [ e^{tX} \right ]=\int_{-\infty}^{\infty}e^{tx}f(x)dx$ 정규분포의 확률밀도함수는 아래와 같습니다. $f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x-\mu}{\sigma} \right )^{2}}$ 정규분포의 확률밀도함수를 적률생성함수 수식에 대입합시다. $M_{X}(t)=\int_{-\infty}^{\infty}e^{tx}\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2.. 2021. 11. 4.
[균등분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 균등분포에 대한 통계량들을 표로 요약한 내용입니다. 더 정확히 말하면 연속균등분포입니다. 정의 모든 확률변수의 함수값이 동일한 분포 분포함수 $\left\{\begin{matrix} \frac{1}{b-a} & (a \leq x \leq b ) \\ 0 & \mathrm{else} \end{matrix}\right.$ 누적분포함수 $\left\{\begin{matrix} 0 & (xb) \end{matrix}\right.$ 평균 $\frac{1}{2}(a+b)$ 분산 $\frac{1}{12}(b-a)^{2}$ 왜도 0 첨도 $\frac{9}{5}$ 적률생성함수 $\left\{\begin{matrix} \frac{e^{tb}-e^{ta}}{t(b-a)} & (t \neq 0) \\ 1 & (t=0) \en.. 2021. 11. 4.
[다항분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 다항분포에 대한 통계량들을 표로 요약한 내용입니다. 정의 이항분포에서 시행의 결과가 셋 이상인 확률분포 분포함수 $f\left ( x_{1},x_{2},...,x_{k} \right )=\frac{n!}{x_{1}!x_{2}! \cdots x_{k}!} \left ( p_{1} \right )^{x_{1}} \left ( p_{2} \right )^{x_{2}} \cdots \left ( p_{k} \right )^{x_{k}}$ 아래 수식 만족 n=x_{1}+x_{2}+\cdots + x_{k} n : 시행횟수 누적분포함수 - 평균 $E\left [ X_{k} \right ]=np_{k}$ 예를들어, $E\left [ X_{1} \right ]=np_{1}$ 분산 $V\left [ X_{1} \righ.. 2021. 11. 3.
[초기하분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 초기하분포에 대한 통계량들을 표로 요약한 내용입니다. 정의 모집단의 크기는 M입니다. 모집단 안에는 우리가 원하는 원소가 k개 있습니다. 모집단에서 크기가 n인 표본을 뽑을 것입니다. 이 표본 안에 우리가 원하는 원소가 x개 있을 확률분포가 초기하분포 입니다. 모집단의 크기 : M 모집단 중 원하는 원소 개수 : k 표본의 크기 : n 표본 중 원하는 원소 개수 : x 분포함수 $ \frac{\binom{k}{x}\cdot \binom{M-k}{n-x}}{\binom{M}{n}}$ 누적분포함수 링크 참고 https://www.researchgate.net/publication/333330279_Hypergeometric_Functions_on_Cumulative_Distribution_Function/l.. 2021. 11. 2.
[통계 Q&A] 상관계수 구하기 Q) 아래 데이터의 피어슨상관계수를 구해주세요. A) 표본의 상관계수는 아래 식을 이용하여 구하면 됩니다. $$r_{xy}=\frac{\sum_{i=1}^{n}\left ( x_{i}-\bar{x} \right )\left ( y_{i}-\bar{y} \right )} {\sqrt{\sum_{i=1}^{n}\left ( x_{i}-\bar{x} \right )^{2}}\sqrt{\sum_{i=1}^{n}\left ( y_{i}-\bar{y} \right )^{2}}}$$ $\bar{x}$는 x의 평균, $\bar{y}$ 는 y의 평균입니다. $\bar{x}=\frac{7+3+5+7+2+1+5+4+4}{9}=4.2$ $\bar{y}=\frac{11+14+13+26+8+3+6+12+11}{9}=11.6$ 피.. 2021. 11. 1.
[통계 Q&A] 푸아송분포 문제 Q) 한시간 동안 평균 60마리 고양이 마주침. 1분동안 2마리의 고양이를 마주칠 확률? 1분동안 3마리 이하의 고양이를 마주칠 확률? A) 먼저 푸아송분포의 분포함수는 아래와 같습니다. $f(x)=\frac{\lambda^{x}e^{-\lambda}}{x!}$ 람다($\lambda$)는 단위시간당 평균발생횟수 입니다. 한시간에 평균 60마리를 마주치므로, 1분에는 평균 1마리를 마주칩니다. 따라서 푸아송분포는 아래와 같습니다. $f(x)=\frac{e^{-1}}{x!}$ 이때 x는 1분동안 고양이를 마주치는 횟수입니다. 1분동안 2마리의 고양이를 마주칠 확률? x에 2를 넣으면 됩니다. 1분동안 3마리 이하의 고양이를 마주칠 확률? x 에 0,1,2,3 을 각각 넣고 더해주시면됩니다. 2021. 11. 1.
[푸아송분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 푸아송분포에 대한 통계량들을 표로 요약한 내용입니다. 정의 이항분포에서 시행횟수가 무수히 많아지고, 발생확률은 아주 작은 경우입니다. 이항분포의 평균인 np가 $\lambda$ 입니다. 단위시간당 사건의 평균 발생횟수입니다. 분포함수 $ \frac{\lambda^{x}e^{-\lambda}}{x!}$ 누적분포함수 $e^{-\lambda}\sum_{k=1}^{\left \lfloor x \right \rfloor}\frac{\lambda^{k}}{k!} $ 평균 $\lambda$ 분산 $\lambda$ 왜도 $\lambda^{-\frac{1}{2}}$ 첨도 $\frac{1}{\lambda}+3$ 적률생성함수 $e^{\lambda\left ( e^{t}-1 \right )}$ 특성함수 $e^{\lambda\.. 2021. 11. 1.
[통계 Q&A] 지수분포 문제 Q) 대기시간이 5분인 지수분포에서 10번 방문했을 때, 대기시간이 4분 이내가 8회 이상일 확률은? A) 대기시간이 5분이라는 것은, 1분에 사건이 평균 0.2회 발생하는 것을 의미합니다. 따라서 지수분포는 아래와 같습니다. $f(t)=0.2e^{-0.2t}$ 방문 시 대기시간이 4분 이내일 확률은 아래와 같이 구합니다. $P\left ( 0\leq t\leq 4 \right )=\int_{0}^{4}0.2e^{-0.2t}=\left [ -e^{-0.2t} \right ]_{0}^{4}=1-e^{-0.8}$ 10번 방문 중 대기시간 4분 이내가 8회 이상 발생할 확률은 아래와 같이 구합니다. 10번 방문 중 8회 발생 : $\binom{10}{8}\left [ 1-e^{-0.8} \right ]^{8}.. 2021. 10. 30.
반응형