본문 바로가기
반응형

@ OO의 이해59

[통계 기호의 이해] 4. X 와 aX+b 의 발생 확률이 같은 이유 X의 확률밀도함수가 p(x) 인 경우에 X의 기댓값과 3X의 기댓값을 지난 시간에 구했었습니다. 결과는 아래와 같습니다. $E[X]=\sum_{i=1}^{n}x_{i}p(x_{i})$ $E[3X]=\sum_{i=1}^{n}3x_{i}p(x_{i})$ 여기서 이런 의문이 드는 분들이 계실겁니다. X가 3X로 바뀌었는데, 왜 p(x) 는 그대로인가. 오늘 그 의문을 해결해봅시다. 확률변수 X의 원소를 아래와 같이 놓겠습니다. $X=\left \{x_{1},x_{2},...,x_{n} \right \}$ $x_{1}$ 이 발생할 확률은 $p(x_{1})$ 입니다. $x_{2}$가 발생할 확률은 $p(x_{2})$ 입니다. 나머지 원소들에도 동일하게 성립합니다. 기댓값은 모든 사건과 각 사건이 발생할 확률의 합.. 2022. 10. 26.
[통계 기호의 이해] 3. E[X] 는 함수가 아닙니다 기댓값 기호 $E[X]$를 함수로 오해하시는 경우가 있습니다. 먼저 아래 질문에 답해보면서 오해하고 있는건 아닌지 확인해봅시다. Q) 확률변수 X의 확률 밀도함수를 $f(x)$ 라고 한다면, 확률변수 X의 기댓값은 아래와 같이 계산됩니다. $E[X]=\int_{-\infty}^{\infty}xf(x)dx$ 이때, 확률변수 3X의 기댓값을 아래와 같이 계산하는게 맞나요? $E[3X]=\int_{-\infty}^{\infty}3xf(3x)dx$ 정답은 '틀렸다' 입니다. 위와 같은 계산이 왜 틀렸는지 지금부터 알아봅시다. $E[X]$ 는 함수가 아니라 'X의 기댓값'을 기호로 나타낸 것입니다. X의 기댓값이라는 말을 매번 쓰기 귀찮으니 $E[X]$ 로 표현하기로 한 것입니다. X의 기댓값이 구해지는 과정을 .. 2022. 9. 30.
[통계 적률의 이해] 16. 특성함수가 항상 존재하는 이유 적률생성함수가 존재하지 않는 경우에는 특성함수를 사용할 수 있습니다. 특성함수는 모든 확률분포에 대해 존재하기 때문입니다. 오늘은 정말 그러한지를 증명해봅시다. 먼저 특성함수가 존재한다는 의미가 무엇인지 짚고 넘어가겠습니다. 특성함수가 존재한다는 것은 t에 대한 특성함수 값이 유한하다는 의미입니다. 확률변수 X의 확률밀도함수가 f(x) 일 때, 특성함수는 아래와 같이 정의됩니다. $\varphi_{X}(t)=E\left [ e^{itx} \right ]=\int_{-\infty}^{\infty}e^{itX}f(x)dx$ 양변에 절댓값을 씌워줍시다. $\left | \varphi_{X}(t) \right |=\left | \int_{-\infty}^{\infty}e^{itX}f(x)dx \right |$ .. 2022. 9. 23.
[통계 적률의 이해] 15. 특성함수 적률생성함수가 존재하지 않는 확률분포들이 있다는 것을 배웠습니다. 자주 사용되는 t분포도 적률생성함수가 없었습니다. 적률생성함수와 같은 역할을 하면서, 모든 확률분포에서 존재하는 함수가 발견되었습니다. 이 함수가 특성함수입니다. 특성함수는 적률생섬함수의 t 대신 it 를 넣은 함수입니다. 아래와 같이 정의됩니다. 그리스어 phi 를 기호로 사용합니다. $\varphi_{X}(t)=E\left [ e^{itX} \right ]=\int_{-\infty}^{\infty}e^{itx}f(x)dx$ 여기서 $\varphi $ 는 그리스어인데 fi 또는 fie 로 발음합니다. 적률생성함수는 아래와 같이 정의됐었습니다. $M_{X}(t)=E\left [ e^{tX} \right ]=\int_{-\infty}^{\i.. 2022. 9. 23.
[통계 기호의 이해] 2. P[X≤x] 형태의 부등식에 익숙해져야 하는 이유 우리는 지난시간에 아래 기호의 의미를 배웠습니다. $P[X=x]$ 이 기호는 확률변수 X가 어떤 값 x일 확률을 나타냅니다. 대문자 X는 확률 변수를 나타내구요. 소문자 x는 발생한 값을 나타냅니다. 그런데 이 표현은 모든 확률변수에 적용될 수 없습니다. 이 표현은 이산확률변수에만 적용 가능한 표현방법입니다. 연속확률변수는 x라는 값이 확률을 갖지 않습니다. 연속확률변수에서 각 값이 발생할 확률은 항상 0입니다. 연속확률변수는 확률 대신 확률 밀도 값을 갖습니다. 확률 밀도 값은 어떤 구간에 대해 적분했을 때 확률이 되는 값입니다. 표준 정규 분포를 예로 들겠습니다. 아래 그림을 봅시다. 표준정규분포 함수입니다. 표준정규분포의 함수값은 확률이 아닌 확률밀도입니다. 이 분포를 따르는 확률변수를 X라고 한다.. 2022. 9. 18.
[통계 적률의 이해] 14. 적률생성함수가 없는 분포도 있다 모든 확률분포에서 적률생성함수가 항상 존재하는 것은 아닙니다. 적률생성함수가 존재하지 않는 확률분포 도 있습니다. 오늘은 적률생성함수가 존재하지 않는 확률분포를 한가지 알아봅시다. 아래와 같은 확률분포인데요. Cauchy 분포의 일종입니다. $f(x)=\frac{1}{\pi}\frac{1}{x^2+1}$ Cauchy 분포의 일반형은 아래와 같습니다. $f(x;x_{0},\gamma)=\frac{1}{\pi \gamma \left [ 1+\left ( \frac{x-x_{0}}{\gamma} \right )^2 \right ]}$ 위에서 소개한 분포는 Cauchy 분포에서 $x_{0}$ 이 0이고, $\gamma$가 1인 경우입니다. 지금부터 아래 분포의 적률생성함수를 구해봅시다. $f(x)=\frac{1.. 2022. 9. 12.
[통계 적률의 이해] 13. 적률생성함수가 같으면 같은 분포일까 두 확률변수의 확률분포가 같으면, 적률생성함수는 확률분포를 적분하여 구하는 것이므로 적률생성함수도 당연히 같습니다. 반대로 두 확률변수의 적률생성함수가 같다고 합시다. 이때 두 확률변수의 확률분포는 같다고 할 수 있을까요? 대답은 yes 입니다. 어떻게 그럴 수 있는지 수학적으로 유도해 봅시다. 두 확률변수 X와 Y의 적률생성함수가 같다면 아래 등식이 성립합니다. $\int_{-\infty}^{\infty} e^{tx}f(x)dx=\int_{-\infty}^{\infty} e^{ty}f(y)dy$ 좌변과 우변의 변수를 z로 바꿔줍시다. 어차피 모든 구간에서 적분되는 것이므로 z로 바꿔도 결과가 같습니다. $\int_{-\infty}^{\infty} e^{tz}f_{X}(z)dz=\int_{-\infty}.. 2022. 9. 12.
[통계 기호의 이해] 1. P[X=x] 의 의미, 왜 대문자 소문자를 쓰나 통계와 관련된 책이나 자료들을 보면 P[X=x] 라는 기호를 많이 보게됩니다. 대문자 X와 소문자 x가 둘다 포함되어 있어서 헷갈려하시는 경우가 있어서 이 기호에 대해 설명하려고 합니다. X라는 확률변수가 있다고 합시다. 이 확률변수의 발생확률 아래와 같이 나타내 봅시다. $P[X]$ X가 3일 확률을 나타내봅시다. $P[3]$ 이렇게만 놓고 보면, 어떤 확률변수가 3일 확률인지를 알 수가 없습니다. 아래와 같이 표현하는 것이 더 알아보기 편합니다. $P[X=3]$ 위 식에서 X는 확률변수를 나타내구요. 3은 발생한 값을 나타냅니다. X의 확률함수를 $p(x)$라고 놓는다면 아래와 같이 나타낼 수 있습니다. $P[X=3]=p(3)$ 좌변의 P는 확률이라는 뜻이구요. 우변의 p는 함수의 이름입니다. 헷갈리.. 2022. 9. 9.
[통계 적률의 이해] 12. 정규분포의 첨도는 왜 3인가 우리는 10강에서 정규분포의 중심적률생성함수를 구했습니다. 아래와 같습니다. $M_{x-\mu}(t)=e^{\frac{\sigma^{2}t^{2}}{2}}$ 11강에서는 정규분포의 중심적률생성함수로 구한 2,3차 중심적률을 이용하여 정규분포의 왜도를 구했습니다. 지난시간에 구한 2,3차 중심적률과 왜도는 아래와 같습니다. $\mu_{2}=\sigma^{2}$ $\mu_{3}=0$ $\gamma_{1}=\frac{\mu_{3}}{\left ( \mu_{2} \right )^{\frac{3}{2}}}=0$ 오늘은 정규분포의 중심적률함수를 이용해서 정규분포의 첨도를 계산해보려고 합니다. 첨도를 중심적률로 나타내면 아래와 같습니다. $\kappa=\frac{\mu_{4}}{\mu_{2}^2}$ 4차 중심적률을 .. 2022. 8. 7.
[분위수의 이해] 1. 상자수염그림 쉽고 자세한 설명 상자수염그림은 아래와 같은 그래프를 말합니다. 살충 스프레이 종류와 곤충 수 데이터를 사용하여 그린 상자수염그림입니다. R이라는 통계프로그램에서 제공하는 내장데이터입니다. x축이 살충 스프레이 종류이고, y축이 곤충 수 입니다. 스프레이는 A,B,C,D,E,F 의 6종류입니다. 각 스프레이당 12번씩 실험을 했습니다. 곤충 수는 살아 남은 곤충 수 인지, 죽은 곤충 수 인지 나와있지 않아서 죽은 곤충 수라고 가정합시다. 데이터의 일부를 살펴보면 아래와 같습니다. > InsectSprays count spray 1 10 A 2 7 A 3 20 A 4 14 A 5 14 A 6 12 A 7 10 A 8 23 A 9 17 A 10 20 A 11 14 A 12 13 A 13 11 B 14 17 B 15 21 B .. 2022. 7. 9.
[대푯값의 이해] 1. 평균과 중앙값의 발견 평균과 중앙값이 발견된 경로를 생각해봅시다. 아마 어떤 자료를 요약하는 과정에서 그 자료를 대표하는 값이 필요했고, 평균과 중앙값을 생각해냈을 것입니다. 더 나아가서 자료가 흩어진 정도를 알기 위해 분산, 표준편차, 중앙값절대편차 등을 생각했을 겁니다. 이것이 우리가 일반적으로 생각할 수 있는 발견 경로입니다. 이 글에서 다루려는 이야기는 우리가 일반적으로 생각할 수 있는 경로가 아닌 '측정'이라는 특수한 상황에서 평균과 중앙값이 발견된 과정을 다루려고 합니다. 무언가를 측정하는 상황을 가정합시다. 어떤 물체의 길이를 측정한다고 합시다. 측정 길이에는 참값이 존재할 것이지만, 측정 오차 때문에 측정 할 때마다 값이 조금씩 달라질 겁니다. 측정의 결과 아래와 같이 다섯개의 값이 얻어졌다고 해봅시다. 10,.. 2022. 6. 14.
[신뢰도와 신뢰구간의 이해] 4. 신뢰도가 높으면 좋은걸까? 신뢰도는 높을 수록 좋은걸까요? 의문을 해결하기 위해 수능 문제를 하나 가져왔습니다. 문제에서 표본의 크기는 100이고, 표본평균이 245, 표본표준편차가 20 입니다. 95% 신뢰도로 신뢰구간을 계산하면 아래와 같습니다. 모표준편차를 모르기 때문에 표본표준편차를 대신 사용합시다. 여기서 발생하는 오차에 대해서는 나중에 다루기로 합시다. $\bar{X}_{1} -1.96\cdot \frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{X}_{1} +1.96\cdot \frac{\sigma}{\sqrt{n}}$ $245 -1.96\cdot \frac{20}{\sqrt{100}} \leq \mu \leq 245 +1.96\cdot \frac{20}{\sqrt{100}}$ $241.1 \.. 2022. 6. 3.
[통계 적률의 이해] 11. 정규분포의 왜도 구하기 지난시간에 정규분포의 중심적률생성함수를 구했습니다. 아래와 같습니다. $M_{x-\mu}(t)=e^{\frac{\sigma^{2}t^{2}}{2}}$ 오늘은 정규분포의 중심적률함수를 이용해서 정규분포의 왜도를 계산해보려고 합니다. 왜도를 중심적률로 나타내면 아래와 같습니다. $\gamma_{1}=\frac{\mu_{3}}{\left ( \mu_{2} \right )^{\frac{3}{2}}}$ $\mu_{2}$ 는 2차 중심적률, $\mu_{3}$는 3차 중심적률입니다. 중심적률생성함수를 한번 미분합시다. $\frac{dM_{x-\mu}(t)}{dt}=e^{\frac{\sigma^{2}t^{2}}{2}}\sigma^{2}t$ 한번 더 미분합시다. $\frac{d^{2}M_{x-\mu}(t)}{dt^{2}.. 2022. 5. 25.
[통계 적률의 이해] 10. 정규분포의 중심적률생성함수 지난 시간에 우리는 정규분포의 적률생성함수를 이용하여 평균과 분산을 구했습니다. 우리가 구했던 정규분포의 적률생성함수는 아래와 같습니다. $M_{X}(t)=E(e^{tX})=e^{ \mu t+\frac{ \sigma^2 t^2 }{2} }$ 이제 왜도를 구할 차례인데요. 1,2,3차 적률을 이용하여 왜도를 구하는 방법은 아래와 같습니다. $\gamma _{1}=\frac{ \mu'_{3}-3 \mu'_{1} \mu'_{2}+2 \left \{ \mu'_{1} \right \}^{3} }{\left [ \mu'_{2}-\left \{ \mu'_{1} \right \}^{2} \right ]^{\frac{3}{2}}}$ 중심적률을 이용하면 훨씬 간단하게 구할 수 있었습니다. $\gamma _{1}=\frac.. 2022. 5. 24.
[가설검정의 이해] #1. 통계적 가설검정을 이해하는데 좋은 아주 쉬운 예시 통계적 가설검정이 무엇인지 쉽게 감을 잡을 수 있는 아주아주 쉬운 예시입니다. 여기 동전이 하나 있습니다. 이 동전은 앞면과 뒷면이 나올 확률이 동일한 동전이라고 알려져 있습니다. 여러분에게 내기를 하나 제안하겠습니다. 이 동전을 던져서 앞면이 나오면 제가 여러분에게 10만원을 드리고, 뒷면가 나오면 여러분이 저에게 10만원을 주시는 겁니다. 여러분 입장에서는 뒷면이 나오면 -10만원이 되는겁니다. 동전 던지기를 20번 했고, 뒷면이 19번 나왔습니다. 여러분은 180만원을 잃으셨어요. 화가난 여러분은 집으로 돌아가서 컴퓨터를 켭니다. 동전을 20번 던져서 앞면이 19번 나올 확률을 계산합니다. $\binom{20}{19}\left ( \frac{1}{2} \right )^{20}$ 계산해보니 0.000.. 2021. 12. 30.
[통계 적률의 이해] 9. 정규분포의 적률생성함수로 평균,분산 구해보기 지난시간에 유도한 정규분포의 적률생성함수는 아래와 같습니다. $M_{X}(t)=E(e^{tX})=e^{ \mu t+\frac{ \sigma^2 t^2 }{2} }$ 적률생성함수를 이용하여 평균, 표준편차, 왜도, 첨도를 구해봅시다. 1. 평균 적률생성함수를 한번 미분하고 t에 0을 넣으면 됩니다. 적률생성함수를 한번 미분합시다. $\frac{dM_{X}(t)}{dt}=E(Xe^{tX})=e^{ \mu t+\frac{ \sigma^2 t^2 }{2} } \times \left (\mu+\sigma^{2}t \right )$ t에 0을 넣겠습니다. $\left.\begin{matrix} \frac{dM_{X}(t)}{dt} \end{matrix}\right|_{t=0}=E(X)=\mu$ 2. 분산 분산은 아.. 2021. 11. 4.
[통계 적률의 이해] 8. 정규분포의 적률생성함수 적률생성함수가 무엇인지 알게되었으니 실제 확률변수에 적용해봅시다. 가장 대표적인 분포인 정규분포를 따르는 확률변수에 적용하겠습니다. 적률생성함수의 정의는 아래와 같습니다. $M_{X}(t)=E\left [ e^{tX} \right ]=\int_{-\infty}^{\infty}e^{tx}f(x)dx$ 정규분포의 확률밀도함수는 아래와 같습니다. $f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x-\mu}{\sigma} \right )^{2}}$ 정규분포의 확률밀도함수를 적률생성함수 수식에 대입합시다. $M_{X}(t)=\int_{-\infty}^{\infty}e^{tx}\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2.. 2021. 11. 4.
[통계 적률의 이해] 7. 적률생성함수 수학 거의 없이 이해하기 지난 강의에서 수학을 많이 사용하여 적률생성함수를 설명했는데요. 혹시 수학에 어려움을 느끼는 분들이 계실 수도 있어서 이번 시간에는 수학을 최대한 적게 쓰며 적률생성함수를 설명해보겠습니다. 적률생성함수는 함수입니다. 변수는 t입니다. t에대한 함수에요. 아래와 같습니다. $M(t)$ 어떤 확률변수 X의 적률생성함수는 아래와 같이 정의됩니다. $M_{X}(t)=E\left [ e^{tX} \right ]$ 위 식을 이용하면 정규분포의 적률생성함수도 구할 수 있고 이항분포의 적률생성함수도 구할 수 있습니다. 적률생성함수를 한번 구해놓으면 유용하게 사용됩니다. 적률생성함수를 한번 미분에서 t에 0을 넣으면 X의 기댓값인 $E\left [ X \right ]$ 가 구해집니다. 두번 미분하고 t에 0을 넣으면 $.. 2021. 10. 27.
[통계 적률의 이해] 6. 적률생성함수란? 적률생성함수는 영어로 moment generating function 입니다. 줄여서 MGF라고 부르는데요. 말 그대로 적률을 생성해주는 함수입니다. 어떤 적률을 생성해주는걸까요? 우리는 지난시간까지 세가지 종류의 적률을 배웠습니다. - 적률 - 중심적률 - 표준화적률 적률생성함수는 이들 중 '적률'을 생성합니다. 물론 적률은 적분을 통해서 구할 수 있습니다만, 적률생성함수를 한번 구해놓으면 n차 적률을 아주 쉽게 구할 수가 있습니다. 아주 기발한 방법입니다. 적률생성함수는 아래와 같이 정의됩니다. $M_{X}(t)=E\left [ e^{tX} \right ]$ 연속확률변수라면 아래와 같이 구할 수 있습니다. $M_{X}(t)=E\left [ e^{tX} \right ]=\int_{-\infty}^{\i.. 2021. 9. 16.
[통계 적률의 이해] 5. 적률들 한눈에보기 우리는 지금까지 세가지 적률을 공부했습니다. 적률, 중심적률, 표준화적률입니다. 세 적률이 통계량인 평균,분산,왜도,첨도와 어떤 관계가 있는지도 공부했습니다. 지금까지 배운 내용들을 표로 정리해봅시다. 이름 기호 정의 기댓값 형태 통계량과의 관계 적률 $\mu_{n}'$ $\int_{-\infty}^{\infty}x^{n}f(x)dx$ $E\left [ X^{n} \right ]$ 평균 = $\mu_{1}'$ 중심적률 $\mu_{n}$ $\int_{-\infty}^{\infty}(x-\mu)^{n}f(x)dx$ $E\left [ \left ( X-\mu \right )^{n} \right ]$ 분산 = $\mu_{2}$ 표준화적률 $\tilde{\mu}_{n}$ $\frac{\mu_{n}}{\sigma^.. 2021. 9. 9.
(진단성능 분할표 용어) 3. 유병률, 정확도 진단기기의 성능을 판단하기 위해 만든 분할표와 관련하여 다양한 용어들이 정의되어 있습니다. 이 용어들을 총 다섯개의 강의에 걸쳐서 알아보려고 합니다. 단순히 용어만을 설명하는 강의구요. 더 깊은 의미와 관계에 대해서는 다른 강의에서 다루도록 하겠습니다. 1. 참양성,참음성,위양성,위음성 2. 민감도,특이도,위양성도,위음성도,양성예측도,음성예측도,허위발견률,허위 누락률 3. 유병률, 정확도 4. 양의 우도비, 음의 우도비 5. 상대위험도, 오즈비 지난 글에서 만든 표를 가져옵시다. 환자 정상 양성 True Positive (TP) False Positive (FP) Positive Predictive Value = TP/(TP+FP) False Discovery Rate = FP/(TP+FP) 음성 Fal.. 2021. 8. 26.
(진단성능 분할표 용어) 2. 민감도,특이도,위양성도,위음성도,양성예측도,음성예측도,허위발견률, 진단기기의 성능을 판단하기 위해 만든 분할표와 관련하여 다양한 용어들이 정의되어 있습니다. 이 용어들을 총 다섯개의 강의에 걸쳐서 알아보려고 합니다. 단순히 용어만을 설명하는 강의구요. 더 깊은 의미와 관계에 대해서는 다른 강의에서 다루도록 하겠습니다. 1. 참양성,참음성,위양성,위음성 2. 민감도,특이도,위양성도,위음성도,양성예측도,음성예측도,허위발견률,허위 누락률 3. 유병률, 정확도 4. 양의 우도비, 음의 우도비 5. 상대위험도, 오즈비 지난 글에서 만든 표를 가져옵시다. 환자 정상 합계 양성 True Positive (TP) False Positive (FP) TP+FP 음성 False Negative (FN) True Negative (TN) FN+TN 합계 TP+FN FP+TN TP+FP+F.. 2021. 8. 26.
(진단성능 분할표 용어) 1. 참양성,참음성,위양성,위음성 진단기기의 성능을 판단하기 위해 만든 분할표와 관련하여 다양한 용어들이 정의되어 있습니다. 이 용어들을 총 다섯개의 강의에 걸쳐서 알아보려고 합니다. 단순히 용어만을 설명하는 강의구요. 더 깊은 의미와 관계에 대해서는 다른 강의에서 다루도록 하겠습니다. 1. 참양성,참음성,위양성,위음성 2. 민감도,특이도,위양성도,위음성도,양성예측도,음성예측도,허위발견률,허위 누락률 3. 유병률, 정확도 4. 양의 우도비, 음의 우도비 5. 상대위험도, 오즈비 참양성,참음성,위양성,위음성과 같은 용어가 등장하는 상황은 크게 두가지가 있습니다. - 진단 기기 성능 - 질병 원인 예측 이 글에서는 진단기기의 성능과 관련하여 위 용어들을 설명하도록 하겠습니다. 어떤 질병을 진단하는 기기를 개발했고 500명의 피험자를 모집했다.. 2021. 8. 26.
양성예측도, 음성예측도 쉽게 이해하기 (진단성능 #2) 지난 글에서 만들었던 표를 가져옵시다. 환자 정상 합계 양성 True Positive (TP) False Positive (FP) TP+FP 음성 False Negative (FN) True Negative (TN) FN+TN 합계 TP+FN FP+TN TP+FP+FN+TN 민감도, 특이도, 위양성률,위음성률을 약어를 이용한 수식으로 나타내면 아래와 같습니다. $\mathrm{Sensitivity}=\frac{TP}{TP+FN}$ $\mathrm{Specificity}=\frac{FP}{FP+TN}$ $\mathrm{False \ positive \ rate}=\frac{FP}{FP+TN}$ $\mathrm{False \ negative \ rate}=\frac{FN}{TP+FN}$ 위 표에서 구할 수 .. 2021. 8. 23.
[통계 적률의 이해] 4. 표준화적률과 평균,분산,왜도 1. 적률이 뭔가요 2. 통계에서의 적률 3. 중심적률 4. 표준화적률 5. 적률생성함수 6. 정률생성함수는 어디다 쓸까? 7. 정규분포의 적률생성함수 적률과 중심적률을 배운 상태입니다. 적률과 중심적률의 정의는 아래와 같습니다. $\mu'_{n}=\int_{-\infty}^{\infty}x^{n}f(x)dx$ $\mu_{n}=\int_{-\infty}^{\infty}(x-\mu)^{n}f(x)dx$ 평균, 분산, 왜도를 적률과 중심적률을 이용하여 표현해보았습니다. 평균은 1차 적률입니다. $mean=\mu'_{1}$ 분산은 2차 중심적률입니다. $Variance=\mu_{2}$ 왜도는 2차 중심적률과 3차 중심적률을 이용하여 표현할 수 있습니다. $Skewness=\frac{ \mu_{3} }{\mu_.. 2021. 8. 20.
[통계 적률의 이해] 3. 중심적률과 평균,분산,왜도 1. 적률이 뭔가요 2. 통계에서의 적률 3. 중심적률 4. 표준화적률 5. 적률생성함수 지난시간에는 적률을 이용해서 평균,분산,왜도를 표현해보았습니다. 아래와 같습니다. $E(X)=\mu'_{1}$ $V(X)=E(X^{2})-E(X)^{2}=\mu'_{2}-\left \{ \mu'_{1} \right \}^{2}$ $\gamma _{1}=\frac{ \mu'_{3}-3 \mu'_{1} \mu'_{2}+2 \left \{ \mu'_{1} \right \}^{3} }{\left [ \mu'_{2}-\left \{ \mu'_{1} \right \}^{2} \right ]^{\frac{3}{2}}}$ $\mu'_{1}$ 은 1차적률, $\mu'_{2}$ 는 2차적률입니다. 분산 까지는 괜찮은데 왜도는 상당히 .. 2021. 8. 18.
[통계 적률의 이해] 2. 통계에서의 적률과 평균,분산,왜도 목차 1. 적률이 뭔가요 2. 통계에서의 적률 3. 중심적률 4. 표준화적률 5. 적률생성함수 지난 시간에 배운 n차 적률의 수학적 정의는 아래와 같습니다. $\mu_{n}=\int_{-\infty}^{\infty}(x-c)^{n}f(x)dx$ 통계에서 '적률'이라고 하면 c=0 인 적률을 말합니다. 위첨자를 붙여서 사용합니다. $\mu'_{n}=\int_{-\infty}^{\infty}x^{n}f(x)dx$ 통계에서는 적률 외에도 '중심 적률'과 '표준화 적률'도 정의해서 사용합니다. 다음 시간에 배우기로 하고 오늘은 적률을 공부해봅시다. 1차 적률 1차 적률을 구해보면 아래와 같습니다. $\mu'_{1}=\int_{-\infty}^{\infty}xf(x)dx$ 평균의 정의와 같습니다. 따라서 1차 적.. 2021. 8. 16.
[왜도의 이해] 5. 왜도와 누율 1. 왜도란 무엇인가? 2. 피어슨의 정의 3. 왜도의 부호 4. 왜도와 적률 5. 왜도와 누율 6. 평균, 중앙값, 최빈값의 위치 7. 왜도 0이면 항상 대칭일까? 8. 표본의 왜도 9. 또 다른 정의들 왜도를 누율로 표현해볼 것입니다. 누율이 무엇인지 모르는 분들은 누율의 이해 강의를 먼저 읽고 오시면 됩니다. 피어슨이 정의한 왜도는 아래와 같습니다. $\gamma _{1}=E \left [ \left ( \frac{X- \mu}{\sigma} \right )^{3} \right ]$ 아래와 같이 분자와 분모를 나눠서 써줍시다. $\gamma _{1}=\frac{E\left [(X-\mu)^{3} \right ]}{\sigma^{3}}$ 표준편차는 분산의 제곱근이므로 아래와 같이 바꿔쓸 수 있습니다... 2021. 8. 16.
[누율의 이해] 4. 3차 누율 1. 누율이란 무엇인가? 2. 누율생성함수 계산하기 3. 1차,2차 누율 4. 3차 누율 5. 고차 누율 6. 왜 굳이 정의했나? 7. 결합누율 1,2차 누율을 구할 때 사용한 누율생성함수는 적률생성함수의 테일러전개에서 3차 이상의 항을 고차항 처리하여 만들었습니다. 1,2차 항만을 사용할 것이기 때문에 3차 이상을 고차항 처리한 것인데요. 3차 누율을 구할 때는 4차 이상을 고차항 처리해야 합니다. 계산이 상당히 귀찮아집니다. 적률생성함수의 테일러 전개는 아래와 같습니다. $M_{X}(t)=E\left ( e^{Xt} \right )=\frac{1}{0!}+E\left [ X \right ]\frac{t}{1!}+E\left [ X^{2} \right ]\frac{t^{2}}{2!}+E\left [ X.. 2021. 8. 16.
[누율의 이해] 3. 1차,2차 누율 1. 누율이란 무엇인가? 2. 누율생성함수 계산하기 3. 1차,2차 누율 4. 3차 누율 5. 고차 누율 6. 왜 굳이 정의했나? 7. 결합누율 지난시간에 계산한 누율생성함수는 아래와 같습니다. 3차 이상의 항을 고차항처리하였습니다. $K_{X}(t)=E\left [ X \right ]t+\frac{t^{2}}{2}V\left [ X \right ]+O(t^{3})$ 1차 누율 1차 누율은 누율생성함수를 한번 미분하고 t에 0을 넣어서 구합니다. 먼저 누율생성함수를 한번 미분하면 아래와 같습니다. $\frac{dK_{X}(t)}{dt}=E\left [ X \right ]+V\left [ X \right ]t+O(t^{2})$ t에 0을 넣어봅시다. $\frac{dK_{X}(0)}{dt}=E\left [ .. 2021. 8. 13.
반응형