본문 바로가기
반응형

정규분포19

모집단이 정규분포를 따르면 표본평균은 항상 정규분포를 따를까? 모집단이 정규분포를 따른다면 표본평균은 항상 정규분포를 따르는지 알아봅시다. 결과부터 말씀드리면 'yes' 입니다. 1. 모집단의 확률변수 정규분포를 따르는 모집단의 원소를 확률변수 X라고 놓겠습니다. 이해되시는 분들은 2번으로 넘어가시면 됩니다. 모집단의 원소를 확률변수로 놓는 것에 익숙하지 않은 분들을 위해 간단한 예시로 설명하겠습니다. 아래와 같은 숫자 카드 5장으로 모집단을 만들어봅시다. 1,2,3,3,3 모집단의 원소를 변수 X로 놓을 수 있습니다. X는 1,2,3 이 될 수 있습니다. 이때 각 값에는 확률이 부여되어 있습니다. 각 확률은 아래와 같습니다. P[X=1]=1/5 P[X=2]=2/5 P[X=3]=3/5 따라서 모집단의 원소를 확률변수 X로 놓을 수 있습니다. 2. 정규분포를 따르는 .. 2023. 1. 14.
정규분포를 따르는 확률변수의 합의 분포 정규분포를 따르는 확률변수 X와 Y가 있다고 합시다. 각 확률변수의 분포는 아래와 같이 나타낼 수 있습니다. $X \sim N\left (\mu_{X},\sigma_{X}^2 \right )$ $Y \sim N\left (\mu_{Y},\sigma_{Y}^2 \right )$ 두 확률변수 X와 Y가 서로 독립이라고 가정하겠습니다. 우리가 굼금한 것은 X+Y의 분포입니다. X+Y의 분포는 특성함수를 이용해서 유도할 것입니다. 확률변수 X와 Y의 특성함수를 먼저 구해보면 아래와 같습니다. $\varphi_{X}(t)=E\left [ e^{itX} \right ]=e^{it\mu_{X}-\frac{\sigma_{X}^2t^2}{2}}$ $\varphi_{Y}(t)=E\left [ e^{itY} \right ].. 2023. 1. 14.
표본평균의 분포는 정말 정규분포가 될 수 있을까 (2) p 값 비교 표본평균의 분포를 정규분포로 가정하고 구한 p값과 실제 분포에서 구한 p값은 잘 일치할지 비교하는 표를 만들었습니다. 모집단이 1:1000인 경우 표본크기가 3이어도 잘 일치합니다. 놀랍네요. 표본 크기보다 오히려 모집단 크기에 영향을 많이 받는 모습입니다. 모집단이 적당히 크기만 하면 표본 크기는 크게 신경을 쓰지 않아도 될만큼 잘 일치합니다. library(dplyr) #1.모집단 설정 #ppltn=c(1,2,3,4,5,6,7,8,9,10) #ppltn=1:1000 #ppltn=rnorm(10) ppltn=rnorm(1000) m=mean(ppltn) s=sd(ppltn) #2. 표본 크기 설정 size=c(3,30,50,100,1000,3000) #3. 비교 p값 설정(우측꼬리기준으로) p=0.05.. 2022. 9. 16.
통계 가설검정 관련 그림들 (정규분포) #위 그래프의 R 소스코드 #표준정규분포 그래프 x=seq(-4,4,by=0.01) y=dnorm(x) plot(x,y,type="l",ann=FALSE,axes=FALSE) #임계값 설정(기각역) margin=qnorm(0.95) #축 및 값 추가, pos=c(0,0) 으로 설정해야 축과 그래프 사이 간격 없어짐 axis(1,at=c(-4,0,4), pos=c(0,0), label=c("",expression(mu),""),cex.axis=1.5) #위 그래프의 R 소스코드 #표준정규분포 그래프 x=seq(-4,4,by=0.01) y=dnorm(x) plot(x,y,type="l",ann=FALSE,axes=FALSE) #임계값 설정(기각역) margin=qnorm(0.95) #축 및 값 추가, pos.. 2022. 9. 1.
정규분포를 따르는 확률변수의 실수배 aX 의 분포 변수 X가 평균이 $\mu$이고, 분산이 $\sigma^{2}$인 정규분포를 따른다고 합시다. 기호로는 아래와 같이 나타냅니다. $X \sim N \left( \mu,\sigma^{2} \right)$ 변수 X에 상수를 곱한 aX는 어떤 분포를 따르는지 알아봅시다. a는 양수라고 가정합시다. aX를 확률변수 Y라고 놓겠습니다. $Y=aX$ Y의 누적분포함수는 아래와 같이 정의할 수 있습니다. $G(y)=P\left[ Y \leq y \right]$ aX=Y 를 이용하여 아래와 같이 변형합시다. $G(y)=P\left[ aX \leq y \right]$ a의 범위에 따라 둘로 나뉩니다. a가 양수인 경우 부등식의 양변을 a로 나눠줍니다. $G(y)=P\left[ X \leq \frac{y}{a} \righ.. 2022. 7. 16.
[통계 적률의 이해] 11. 정규분포의 왜도 구하기 지난시간에 정규분포의 중심적률생성함수를 구했습니다. 아래와 같습니다. $M_{x-\mu}(t)=e^{\frac{\sigma^{2}t^{2}}{2}}$ 오늘은 정규분포의 중심적률함수를 이용해서 정규분포의 왜도를 계산해보려고 합니다. 왜도를 중심적률로 나타내면 아래와 같습니다. $\gamma_{1}=\frac{\mu_{3}}{\left ( \mu_{2} \right )^{\frac{3}{2}}}$ $\mu_{2}$ 는 2차 중심적률, $\mu_{3}$는 3차 중심적률입니다. 중심적률생성함수를 한번 미분합시다. $\frac{dM_{x-\mu}(t)}{dt}=e^{\frac{\sigma^{2}t^{2}}{2}}\sigma^{2}t$ 한번 더 미분합시다. $\frac{d^{2}M_{x-\mu}(t)}{dt^{2}.. 2022. 5. 25.
[통계 적률의 이해] 10. 정규분포의 중심적률생성함수 지난 시간에 우리는 정규분포의 적률생성함수를 이용하여 평균과 분산을 구했습니다. 우리가 구했던 정규분포의 적률생성함수는 아래와 같습니다. $M_{X}(t)=E(e^{tX})=e^{ \mu t+\frac{ \sigma^2 t^2 }{2} }$ 이제 왜도를 구할 차례인데요. 1,2,3차 적률을 이용하여 왜도를 구하는 방법은 아래와 같습니다. $\gamma _{1}=\frac{ \mu'_{3}-3 \mu'_{1} \mu'_{2}+2 \left \{ \mu'_{1} \right \}^{3} }{\left [ \mu'_{2}-\left \{ \mu'_{1} \right \}^{2} \right ]^{\frac{3}{2}}}$ 중심적률을 이용하면 훨씬 간단하게 구할 수 있었습니다. $\gamma _{1}=\frac.. 2022. 5. 24.
[손으로 푸는 확률분포] 정규분포 (2) 과녁을 이용한 유도 정규분포를 유도하는 방법은 두 가지가 있습니다. 과녁 맞추기를 이용한 유도와 이항분포를 이용한 유도입니다. 두 유도방법 모두 '정규분포가 무엇인가' 라는 질문에 좋은 답변을 제공해줍니다. 오늘은 첫번째 방법인 '과녁 맞추기를 이용한 유도'를 알아봅시다. 우리가 어떤 물체의 길이를 측정하는 상황이라고 해봅시다. 우리가 측정할 때 마다 측정값은 조금씩 달라질 것입니다. 측정에는 항상 오차가 있기 때문입니다. 측정을 무한히 반복했다고 가정하고, 측정된 값들을 확률분포로 만들고 싶었습니다. 실제로 측정을 무한 번 하지는 않을 거구요. 그럴듯한 수학 모델을 만들어 볼 겁니다. 그럴듯한 수학 모델을 만들기 위해 물체의 길이를 측정하는 것과 비슷한 상황 하나를 생각해냈습니다. 바로 '과녁 맞추기' 입니다. 아래와 같.. 2022. 4. 1.
[손으로 푸는 통계 ver1.0] 79. aX가 정규분포를 다를 때, X도 정규분포를 따를까 변수 aX가 평균이 $\mu$이고, 분산이 $\sigma^{2}$인 정규분포를 따른다고 합시다. 기호로는 아래와 같이 나타냅니다. $aX \sim N \left( \mu,\sigma^{2} \right)$ aX의 확률밀도함수를 f(ax), 누적분포함수를 F(ax)라고 놓겠습니다. F(ax) 는 아래와 같이 정의됩니다. P[aX 2021. 11. 22.
이항분포, 정규분포, 푸아송분포의 관계 이항분포를 정규분포로 근사할 때도 n을 무한대로 보내고, 푸아송분포로 보낼 때도 n을 무한대로 보내니 혼란이 오시는 분들이 계실겁니다. 오늘은 이 문제를 해결해봅시다. 이항분포, 푸아송분포, 정규분포 함수는 아래와 같습니다. 이항분포 : $f(x)=\binom{n}{x} p^{x}(1-p)^{n-x}$ 푸아송분포 : $f(x)=\frac{\lambda^{x}e^{-\lambda}}{x!}$ 정규분포 : $f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x-\mu}{\sigma} \right )^{2}}$ 이항분포를 정규분포로 근사할 때는 p를 고정한 상태로 n을 무한대로 보냅니다. 예를 들면 앞면이 나오는 확률(p)는 고정되고, 동전을 던지는.. 2021. 11. 19.
[정규분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 정규분포에 대한 통계량들을 표로 요약한 내용입니다. 정의 - 평균에 대해 대칭이고, 평균에 가까울 수록 발생 확률이 높아지는 분포 - 주어진 표준편차에서 미분엔트로피를 최대화하는 분포 분포함수 $\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x-\mu}{\sigma} \right )^{2}}$ 누적분포함수 $\int_{-\infty}^{x}\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{t-\mu}{\sigma} \right )^{2}}dt=\frac{1}{2}\left [ 1+\mathrm{erf}\left ( \frac{x-\mu}{\sqrt{2}\sigma} \right ) \right ]$.. 2021. 11. 5.
[통계 적률의 이해] 9. 정규분포의 적률생성함수로 평균,분산 구해보기 지난시간에 유도한 정규분포의 적률생성함수는 아래와 같습니다. $M_{X}(t)=E(e^{tX})=e^{ \mu t+\frac{ \sigma^2 t^2 }{2} }$ 적률생성함수를 이용하여 평균, 표준편차, 왜도, 첨도를 구해봅시다. 1. 평균 적률생성함수를 한번 미분하고 t에 0을 넣으면 됩니다. 적률생성함수를 한번 미분합시다. $\frac{dM_{X}(t)}{dt}=E(Xe^{tX})=e^{ \mu t+\frac{ \sigma^2 t^2 }{2} } \times \left (\mu+\sigma^{2}t \right )$ t에 0을 넣겠습니다. $\left.\begin{matrix} \frac{dM_{X}(t)}{dt} \end{matrix}\right|_{t=0}=E(X)=\mu$ 2. 분산 분산은 아.. 2021. 11. 4.
[통계 적률의 이해] 8. 정규분포의 적률생성함수 적률생성함수가 무엇인지 알게되었으니 실제 확률변수에 적용해봅시다. 가장 대표적인 분포인 정규분포를 따르는 확률변수에 적용하겠습니다. 적률생성함수의 정의는 아래와 같습니다. $M_{X}(t)=E\left [ e^{tX} \right ]=\int_{-\infty}^{\infty}e^{tx}f(x)dx$ 정규분포의 확률밀도함수는 아래와 같습니다. $f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x-\mu}{\sigma} \right )^{2}}$ 정규분포의 확률밀도함수를 적률생성함수 수식에 대입합시다. $M_{X}(t)=\int_{-\infty}^{\infty}e^{tx}\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2.. 2021. 11. 4.
[손으로 푸는 확률분포] 정규분포 (1) 풀리지 않았던 의문 아마 여러분이 정규분포를 처음 접한 때는 고등학교 확률과 통계 시간일 것입니다. 고등학교 확률과 통계 시간에는 정규분포를 이렇게 가르칩니다. 연속확률변수 X의 확률밀도함수가 $f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x-\mu}{\sigma} \right )^{2}}$ 일 때 X의 확률분포를 정규분포라고 한다. 마치 하늘에서 정규분포가 뚝 하고 떨어진 것처럼 배웁니다. 그리고 바로 정규분포의 성질을 배웁니다. $\mu$ 는 평균이고, $\sigma$는 표준편차이다. 좌우 대칭이다. 평균에 가까울 수록 확률밀도가 크고 멀 수록 작다. 모양은 종모양이다. 우리는 이항분포를 배울 때 저렇게 배우지 않았습니다. 이항분포의 확률질량함수를 먼저 .. 2021. 9. 25.
한국인 6000명의 키와 몸무게는 정규분포 모양일까?? 우리가 살고있는 세상의 많은 현상들이 정규분포 모양을 따른다고 합니다. 한국인의 키와 몸무게도 정규분포를 따를까요? 정말 그런지 직접 확인해보았습니다다. 사이즈코리아(https://sizekorea.kr/)에서 인체치수데이터를 다운받았습니다. 사이즈코리아는 국민의 인체치수를 조사하고 보급하는 역할을 합니다. 16 ~ 69세 남녀 6,413명(남성 3,192명, 여성 3,221명)의 데이터입니다. 측정기간은 2015년 5월 ~ 2015년 12월 입니다. 전체 인원은 6413명입니다. 엑셀 데이터는 아래와 같습니다. 1) R Studio에서 데이터 불러오기 사이즈코리아에서 다운받은 파일은 엑셀형태입니다. R Studio 에서는 영어이름만 불러올 수 있기 때문에 파일 이름을 영어로 바꿔주었습니다. 아래와 같은.. 2020. 5. 9.
[손으로 푸는 통계] 20. 정규분포를 유도하며 알게 된 것들 고등학교에서 정규분포를 처음 배울 때 함수의 수식부터 배웠떤 기억이 있습니다. 이어서 정규분포의 성질들을 배웠습니다. 정규분포의 모양ㅇ느 종을 엎어놓은 모양이고, 표준편차가 작아질 수록 얇고 높아진다 등을 배웠습니다. 그 당시 정규분포의 유도과정이 궁금했었는데 왜 선생님에게 질문을 하지 않았었는지는 기억이 안납니다. 나름대로 내렸던 결론은 유도과정이 없고 여러 현상에서 발견되는 분포들을 수학적으로 fitting 하여 찾아냈을 것이라 생각했었습니다. 졸업 후 한참이 지난 20대 후반에 취미로 통계공부를 시작했고, 정규분포의 유도과정이 있다는 것을 알았습니다. 제가 찾은 방법은 두 가지였고 지난시간까지 두 방법 모두 다뤘습니다. 두 방법은 아래와 같습니다. 방법1. 과녁 맞추기를 이용한 유도 방법2. 이항분.. 2018. 4. 14.
[손으로 푸는 통계] 18. 정규분포함수 유도하기 (방법2. 이항분포 이용 1/2) 정규분포 함수를 유도하는 방법은 두가지가 있고 아래와 같습니다. 1) 과녁 맞추기를 이용한 유도 2) 이항분포를 이용한 유도 15,16강에서 1번 방법으로 정규분포를 유도하였습니다. 이번 강의부터 2번 방법으로 정규분포를 유도하겠습니다. 내용이 많아서 이번강의와 다음강의 둘로 나눠서 설명하겠습니다. 이항분포를 정규분포로 근사시키는 방법을 통해 정규분포를 유도하겠습니다. 이항분포 $B(n,p)$의 확률질량함수는 아래와 같습니다. $f(r)=_{n}C_{r}p^rq^{n-r}$ 확률변수를 r로 놓았습니다. 위 식에서 조합으로 표현된 부분을 팩토리얼 형태로 바꿔줍시다. $f(r)=\frac{n!}{r!(n-r)!}p^rq^{n-r}$ 양변에 자연로그를 취해줍니다. $\ln f(r)=\ln n!-\ln r! -.. 2018. 4. 12.
[손으로 푸는 통계] 14. 중심극한정리 증명 (#3. 표본평균의 적률생성함수) 중심극한정리 증명 (#3. 표본평균의 적률생성함수) 중심극한정리 증명의 마지막 시간입니다. 첫 시간에는 두 확률변수의 확률분포가 같을 조건을 배웠습니다. 두 확률변수의 적률생성함수가 같다면, 두 확률변수의 확률분포가 같았습니다. 두번째 시간에는 정규분포의 적률생성함수를 유도했습니다. 정규분포의 적률생성함수는 아래와 같습니다. $M_{X}(t)=E(e^{tx})=e^{ \mu t+\frac{+ \sigma^2 t^2 }{2} }$ 이번 시간에는 표본평균의 적률생성함수를 유도할 것입니다. 유도된 적률생성함수가 정규분포의 적률생성함수와 같다면, 표본평균의 분포와 정규분포가 같다고 할 수 있습니다. 표본평균의 분포가 정규분포를 따른다는 것을 보일 수 있는 것입니다. 목차 1. 표본평균의 적률생성함수 유도 2. .. 2018. 3. 24.
[손으로 푸는 통계] 13. 중심극한정리 증명 (#2. 정규분포의 적률생성함수) 중심극한정리 증명 (#2. 정규분포의 적률생성함수) 지난시간에 두 확률변수의 확률분포가 같을 조건을 배웠습니다. 두 확률변수의 적률생성함수가 같다면 두 확률변수의 확률분포가 같았습니다. 두 확률분포의 적률생성함수가 같음 → 두 확률변수의 확률분포가 같음. 이 원리를 이용하여 중심극한정리를 증명할 수 있습니다. 표본의 크기가 무한히 커질 때 표본평균의 적률생성함수를 구하고, 이를 정규분포의 적률생성함수와 비교합니다. 두 적률생성함수가 같다는 것을 보이면, 표본평균의 분포가 정규분포라는 것을 보일 수 있습니다. 이번글에서는 정규분포의 적률생성함수를 유도해보겠습니다. 다음 글에서 표본평균의 적률생성함수를 유도하고 둘을 비교할 것입니다. 정규분포의 적률생성함수 유도 정규분포를 따르는 확률변수 X가 있다고 합시다.. 2018. 3. 24.
반응형