본문 바로가기
반응형

전체 글645

양측검정과 단측검정의 검정력은 같을까 다를까 가설검정에는 두가지 오류가 있습니다. 1종오류인 α와 2종오류인 β 입니다. 1종오류는 신뢰도와 관련 있고, 2종오류는 검정력과 관련이 있습니다. 관계는 아래와 같습니다. 1종오류(α) = 1-신뢰도 2종오류(β) = 1-검정력 양측검정에서 단측검정으로 바뀐다고 해서 1종오류가 바뀌지는 않습니다. 한쪽에 0.05를 몰아주던 것이 양쪽에 0.025씩 나뉘주는 것으로 바뀔 뿐입니다. 전체 오류는 0.05로 동일합니다. 하지만 2종오류 입장에서는 다릅니다. 단측검정이 양측검정으로 바뀌게 되면 위에 보이시는 세로 선이 우측으로 이동하게 되고, 2종오류는 커지는 결과를 낳습니다. 따라서 단측검정이 양측검정으로 바뀌면 검정력은 줄어들게 됩니다. 2021. 11. 12.
[t분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 t분포의 통계량들을 표로 요약한 내용입니다. 정의 - 표본평균을 정의하는 모표준편차 대신 표본표준편차를 넣어 정의된 확률변수의 확률분포 - 정규분포보다 꼬리쪽이 heavy함 정의역 $-\infty 2021. 11. 10.
[카이제곱분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 카이제곱분포의 통계량들을 표로 요약한 내용입니다. 정의 표준정규분포를 따르는 확률변수들의 제곱합을 확률변수로 하는 분포 정의역 $\left\{\begin{matrix} 0 2021. 11. 8.
[정규분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 정규분포에 대한 통계량들을 표로 요약한 내용입니다. 정의 - 평균에 대해 대칭이고, 평균에 가까울 수록 발생 확률이 높아지는 분포 - 주어진 표준편차에서 미분엔트로피를 최대화하는 분포 분포함수 $\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x-\mu}{\sigma} \right )^{2}}$ 누적분포함수 $\int_{-\infty}^{x}\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{t-\mu}{\sigma} \right )^{2}}dt=\frac{1}{2}\left [ 1+\mathrm{erf}\left ( \frac{x-\mu}{\sqrt{2}\sigma} \right ) \right ]$.. 2021. 11. 5.
[통계 적률의 이해] 9. 정규분포의 적률생성함수로 평균,분산 구해보기 지난시간에 유도한 정규분포의 적률생성함수는 아래와 같습니다. $M_{X}(t)=E(e^{tX})=e^{ \mu t+\frac{ \sigma^2 t^2 }{2} }$ 적률생성함수를 이용하여 평균, 표준편차, 왜도, 첨도를 구해봅시다. 1. 평균 적률생성함수를 한번 미분하고 t에 0을 넣으면 됩니다. 적률생성함수를 한번 미분합시다. $\frac{dM_{X}(t)}{dt}=E(Xe^{tX})=e^{ \mu t+\frac{ \sigma^2 t^2 }{2} } \times \left (\mu+\sigma^{2}t \right )$ t에 0을 넣겠습니다. $\left.\begin{matrix} \frac{dM_{X}(t)}{dt} \end{matrix}\right|_{t=0}=E(X)=\mu$ 2. 분산 분산은 아.. 2021. 11. 4.
[통계 적률의 이해] 8. 정규분포의 적률생성함수 적률생성함수가 무엇인지 알게되었으니 실제 확률변수에 적용해봅시다. 가장 대표적인 분포인 정규분포를 따르는 확률변수에 적용하겠습니다. 적률생성함수의 정의는 아래와 같습니다. $M_{X}(t)=E\left [ e^{tX} \right ]=\int_{-\infty}^{\infty}e^{tx}f(x)dx$ 정규분포의 확률밀도함수는 아래와 같습니다. $f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x-\mu}{\sigma} \right )^{2}}$ 정규분포의 확률밀도함수를 적률생성함수 수식에 대입합시다. $M_{X}(t)=\int_{-\infty}^{\infty}e^{tx}\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2.. 2021. 11. 4.
[균등분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 균등분포에 대한 통계량들을 표로 요약한 내용입니다. 더 정확히 말하면 연속균등분포입니다. 정의 모든 확률변수의 함수값이 동일한 분포 분포함수 $\left\{\begin{matrix} \frac{1}{b-a} & (a \leq x \leq b ) \\ 0 & \mathrm{else} \end{matrix}\right.$ 누적분포함수 $\left\{\begin{matrix} 0 & (xb) \end{matrix}\right.$ 평균 $\frac{1}{2}(a+b)$ 분산 $\frac{1}{12}(b-a)^{2}$ 왜도 0 첨도 $\frac{9}{5}$ 적률생성함수 $\left\{\begin{matrix} \frac{e^{tb}-e^{ta}}{t(b-a)} & (t \neq 0) \\ 1 & (t=0) \en.. 2021. 11. 4.
[다항분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 다항분포에 대한 통계량들을 표로 요약한 내용입니다. 정의 이항분포에서 시행의 결과가 셋 이상인 확률분포 분포함수 $f\left ( x_{1},x_{2},...,x_{k} \right )=\frac{n!}{x_{1}!x_{2}! \cdots x_{k}!} \left ( p_{1} \right )^{x_{1}} \left ( p_{2} \right )^{x_{2}} \cdots \left ( p_{k} \right )^{x_{k}}$ 아래 수식 만족 n=x_{1}+x_{2}+\cdots + x_{k} n : 시행횟수 누적분포함수 - 평균 $E\left [ X_{k} \right ]=np_{k}$ 예를들어, $E\left [ X_{1} \right ]=np_{1}$ 분산 $V\left [ X_{1} \righ.. 2021. 11. 3.
[초기하분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 초기하분포에 대한 통계량들을 표로 요약한 내용입니다. 정의 모집단의 크기는 M입니다. 모집단 안에는 우리가 원하는 원소가 k개 있습니다. 모집단에서 크기가 n인 표본을 뽑을 것입니다. 이 표본 안에 우리가 원하는 원소가 x개 있을 확률분포가 초기하분포 입니다. 모집단의 크기 : M 모집단 중 원하는 원소 개수 : k 표본의 크기 : n 표본 중 원하는 원소 개수 : x 분포함수 $ \frac{\binom{k}{x}\cdot \binom{M-k}{n-x}}{\binom{M}{n}}$ 누적분포함수 링크 참고 https://www.researchgate.net/publication/333330279_Hypergeometric_Functions_on_Cumulative_Distribution_Function/l.. 2021. 11. 2.
[통계 Q&A] 상관계수 구하기 Q) 아래 데이터의 피어슨상관계수를 구해주세요. A) 표본의 상관계수는 아래 식을 이용하여 구하면 됩니다. $$r_{xy}=\frac{\sum_{i=1}^{n}\left ( x_{i}-\bar{x} \right )\left ( y_{i}-\bar{y} \right )} {\sqrt{\sum_{i=1}^{n}\left ( x_{i}-\bar{x} \right )^{2}}\sqrt{\sum_{i=1}^{n}\left ( y_{i}-\bar{y} \right )^{2}}}$$ $\bar{x}$는 x의 평균, $\bar{y}$ 는 y의 평균입니다. $\bar{x}=\frac{7+3+5+7+2+1+5+4+4}{9}=4.2$ $\bar{y}=\frac{11+14+13+26+8+3+6+12+11}{9}=11.6$ 피.. 2021. 11. 1.
[통계 Q&A] 푸아송분포 문제 Q) 한시간 동안 평균 60마리 고양이 마주침. 1분동안 2마리의 고양이를 마주칠 확률? 1분동안 3마리 이하의 고양이를 마주칠 확률? A) 먼저 푸아송분포의 분포함수는 아래와 같습니다. $f(x)=\frac{\lambda^{x}e^{-\lambda}}{x!}$ 람다($\lambda$)는 단위시간당 평균발생횟수 입니다. 한시간에 평균 60마리를 마주치므로, 1분에는 평균 1마리를 마주칩니다. 따라서 푸아송분포는 아래와 같습니다. $f(x)=\frac{e^{-1}}{x!}$ 이때 x는 1분동안 고양이를 마주치는 횟수입니다. 1분동안 2마리의 고양이를 마주칠 확률? x에 2를 넣으면 됩니다. 1분동안 3마리 이하의 고양이를 마주칠 확률? x 에 0,1,2,3 을 각각 넣고 더해주시면됩니다. 2021. 11. 1.
[푸아송분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 푸아송분포에 대한 통계량들을 표로 요약한 내용입니다. 정의 이항분포에서 시행횟수가 무수히 많아지고, 발생확률은 아주 작은 경우입니다. 이항분포의 평균인 np가 $\lambda$ 입니다. 단위시간당 사건의 평균 발생횟수입니다. 분포함수 $ \frac{\lambda^{x}e^{-\lambda}}{x!}$ 누적분포함수 $e^{-\lambda}\sum_{k=1}^{\left \lfloor x \right \rfloor}\frac{\lambda^{k}}{k!} $ 평균 $\lambda$ 분산 $\lambda$ 왜도 $\lambda^{-\frac{1}{2}}$ 첨도 $\frac{1}{\lambda}+3$ 적률생성함수 $e^{\lambda\left ( e^{t}-1 \right )}$ 특성함수 $e^{\lambda\.. 2021. 11. 1.
[통계 Q&A] 지수분포 문제 Q) 대기시간이 5분인 지수분포에서 10번 방문했을 때, 대기시간이 4분 이내가 8회 이상일 확률은? A) 대기시간이 5분이라는 것은, 1분에 사건이 평균 0.2회 발생하는 것을 의미합니다. 따라서 지수분포는 아래와 같습니다. $f(t)=0.2e^{-0.2t}$ 방문 시 대기시간이 4분 이내일 확률은 아래와 같이 구합니다. $P\left ( 0\leq t\leq 4 \right )=\int_{0}^{4}0.2e^{-0.2t}=\left [ -e^{-0.2t} \right ]_{0}^{4}=1-e^{-0.8}$ 10번 방문 중 대기시간 4분 이내가 8회 이상 발생할 확률은 아래와 같이 구합니다. 10번 방문 중 8회 발생 : $\binom{10}{8}\left [ 1-e^{-0.8} \right ]^{8}.. 2021. 10. 30.
레버리지 ETF가 위험한 이유 정말 알고 계신가요? (TQQQ,3LTS...) 레버리지 ETF는 어떤 주식 또는 ETF 수익률의 2배 혹은 3배가 되도록 설계된 펀드입니다. 예를들어 TQQQ는 QQQ라는 ETF 수익률의 세배, 3LTS는 테슬라 주식 수익률의 3배가 되도록 설계되어 있습니다. 3배 레버리지 ETF가 위험하다는 것은 다들 알고계실텐데요. 단순히 많이 오르는 만큼, 많이 떨어질 수도 있으니 위험하다고 생각하시는 분들도 계실겁니다. 하지만 그게 다가 아닙니다. 레버리지 ETF가 위험한 이유는 본주가 올랐다가 제자리로 돌아와도, 손해를 보게되기 때문입니다. 예를 들어봅시다. 본주의 가격이 a원이라고 합시다. 10%가 올라서, 1.1a원이 되었고, 다시 덜어져서 a원이 됐다고 합시다. 몇 %가 하락한 것일까요? 아래 등식을 이용하면 됩니다. 1.1a x (1-하락률)=a 하.. 2021. 10. 30.
[음이항분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 음이항분포는 성공횟수(k), 실패횟수(r), 전체 시행횟수(n)에서 무엇을 변수로 놓고 무엇을 상수로 놓느냐에 따라 다양하게 정의됩니다. 형태는 f(변수,상수) 입니다. ① f(n;r) : 실패가 r번 발생할 때까지 전체 발생횟수가 n회일 확률. ② f(n;k) : 성공이 k번 발생할 때까지 전체 발생횟수가 n회일 확률. ③ f(r;n) : 전체 시행횟수가 n일 때까지, 실패횟수가 r회일 확률. ④ f(k;n) : 전체 시행횟수가 n회이 때까지, 성공이 k회일 확률. ⑤ f(r;k) : 성공이 k번 발생할 때까지 실패횟수가 r회일 확률. ⑥ f(k;r) : 실패가 r번 발생할 때까지, 성공이 k회일 확률. 3,4번은 이항분포이므로 나머지만 남겨봅시다. ① f(n;r) : 실패가 r번 발생할 때까지 전체 .. 2021. 10. 29.
반응형