본문 바로가기
반응형

분산12

분산 구하는 두 가지 방법 (제곱의평균-평균의제곱 유도) 평균 아래와 같은 자료가 있다고 합시다. $x_{1},x_{2},...,x_{n}$ 이 자료를 변수 X로 나타낸다고 합시다. $X=\left \{ x_{1},x_{2},...,x_{n} \right \}$ X의 평균은 아래와 같이 정의됩니다. $E[X]=\frac{x_{1}+x_{2}+\dots+x_{n}}{n}$ 시그마 기호로 나타내면 아래와 같습니다. $E[X]=\frac{x_{1}+x_{2}+\cdots+x_{n}}{n}=\frac{\sum_{i=1}^{n}x_{i}}{n}$ 편의상 변수 X의 평균을 $\mu$ 라고 놓겠습니다. $E[X]=\mu$ 분산 변수 X의 분산은 아래와 같이 정의됩니다. 편차의 제곱의 평균입니다. $V[X]=E\left [ \left ( X-\mu \right )^2 \ri.. 2022. 4. 27.
[손으로 푸는 통계 ver1.0] 83. 카이제곱분포의 분산 유도 n자유도 카이제곱분포를 따르는 확률변수의 분산을 유도해봅시다. n자유도 카이제곱분포 함수는 아래와 같습니다. $f(x)=\frac{1}{2^{\frac{n}{2}} \Gamma \left ( \frac{n}{2} \right ) } e^{-\frac{x}{2}} x^{\frac{n}{2}-1}$ 분산은 아래 수식을 이용해서 구하겠습니다. $V[X]=E[X^{2}]-E[X]^{2}$ E[X] 는 n이라는 것을 지난시간에 유도했습니다. 우변의 첫항만 계산하면 됩니다. 우변의 첫항은 아래와 같이 계산됩니다. $E[X^{2}]=\int_{0}^{\infty}x^{2}f(x)dx=\int_{0}^{\infty}x^{2}\frac{1}{2^{\frac{n}{2}} \Gamma \left ( \frac{n}{2} \.. 2022. 3. 7.
[음이항분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 음이항분포는 성공횟수(k), 실패횟수(r), 전체 시행횟수(n)에서 무엇을 변수로 놓고 무엇을 상수로 놓느냐에 따라 다양하게 정의됩니다. 형태는 f(변수,상수) 입니다. ① f(n;r) : 실패가 r번 발생할 때까지 전체 발생횟수가 n회일 확률. ② f(n;k) : 성공이 k번 발생할 때까지 전체 발생횟수가 n회일 확률. ③ f(r;n) : 전체 시행횟수가 n일 때까지, 실패횟수가 r회일 확률. ④ f(k;n) : 전체 시행횟수가 n회이 때까지, 성공이 k회일 확률. ⑤ f(r;k) : 성공이 k번 발생할 때까지 실패횟수가 r회일 확률. ⑥ f(k;r) : 실패가 r번 발생할 때까지, 성공이 k회일 확률. 3,4번은 이항분포이므로 나머지만 남겨봅시다. ① f(n;r) : 실패가 r번 발생할 때까지 전체 .. 2021. 10. 29.
[손으로 푸는 확률분포] 균등분포 (2) 평균과 분산 (2-1) 평균 확률변수 X가 균등분포를 따를 때, 확률밀도함수는 아래와 같다는 것을 지난시간에 유도했습니다. 균등분포를 따르는 확률변수 X는 연속확률변수입니다. 연속확률변수의 평균은 아래와 같이 구합니다. 균등분포함수에 적용해봅시다. 적분은 어렵지 않습니다. 적분해봅시다. 계산합시다. 인수분해합시다. 약분하면 아래와 같이 균등분포의 평균이 구해집니다. (2-2) 분산 연속확률변수의 분산은 아래와 같이 구합니다. 평균은 위에서 구해서 알고 있으므로, 확률변수의 제곱의 평균만 구하면 됩니다. 위 식에 균등분포의 확률밀도함수를 대입합니다. 적분은 어렵지 않습니다. 적분해봅시다. 계산합시다. 인수분해합시다. 약분하면 아래와 같습니다. 분산을 구하는 식에 넣어줍니다. 맨 오른쪽 항을 계산해줍니다. 통분합시다. .. 2020. 2. 26.
[손으로 푸는 확률분포] 다항분포 (4) 평균과 분산 (4) 평균과 분산 다항분포의 기댓값은 각 사건별로 구하거나 사건의 합집합의 기댓값을 구할 수 있습니다. 예를 들어 어떤 시행에서 세가지 사건이 발생할 수 있다고 하겠습니다. 사건 A, 사건 B, 사건C 입니다. 한번의 시행에서 각 사건이 발생할 확률은 $P_{A}$, $P_{B}$, $P_{C}$ 라고 합시다. n번의 시행에서 사건 A가 X번, 사건 B가 Y번, 사건 C가 Z번 발생할 확률은 아래와 같습니다. 다항분포의 기댓값을 구해볼건데요. 우리는 각 사건의 기댓값을 구할 수 있고, 여러 사건들의 교집합 또는 합집합의 기댓값을 구할 수 있습니다. 먼저 사건 A의 기댓값을 구해봅시다. 사건 A의 관점에서 보면, 어떤 시행의 결과는 사건 A가 발생하거나 사건 A가 발생하지 않거나의 두가지 입니다. 따라서.. 2020. 2. 7.
[손으로 푸는 확률분포] 음이항분포 (4-2) 분산 4-2) 통계량 - 분산 분산은 아래 수식을 이용하여 구할 수 있습니다. 평균은 이전 강의에서 계산한 결과를 넣어줍시다. 우리가 모르는 값은 평균의 제곱이기 때문에, 따로 떼어서 계산하겠습니다. p(x)에 음이항분포식을 적용해봅시다. x가 0일때는 값이 0이므로, x를 1부터 계산해도 됩니다. 이항분포 식을 풀어서 씁시다. x를 약분해줍니다. p하나를 꺼내고, 1-p와 r을 나누고 곱해서 아래와 같이 변형합니다. r+1=s 로, x-1=t 로 치환합니다. t+1을 전개합시다. 위 그림의 빨간부분을 조합식으로 바꿔봅시다. 위 수식의 파란부분은 실패횟수가 s이고, 성공횟수(변수)가 t인 음이항분포의 분포함수입니다. 따라서 왼쪽식은 음이항분포의 평균을 구하는 식이고, 오른쪽 식은 분포함수의 전체 합이므로 1이.. 2019. 7. 5.
[손으로 푸는 통계] 17. 이항분포의 평균과 분산 정규분포의 두가지 유도방법을 공부하고 있습니다. 두가지 유도방법은 아래와 같습니다. 1) 과녁 맞추기를 이용한 유도 2) 이항분포를 이용한 유도 지난시간까지 1번인 과녁 맞추기를 이용한 유도를 공부해보았습니다. 이제 2번인 이항분포를 이용하여 정규분포를 유도할 차례입니다. 이항분포를 이용하여 정규분포를 유도할 때 이항분포의 평균과 분산이 사용됩니다. 이번시간에는 이항분포의 평균과 분산을 구해봅시다. 이항분포는 $B(n,p)$ 라고 나타냅니다. B는 binomial distribution 의 첫글자를 딴 것입니다. n은 시행횟수이고 p는 특정 사건이 발생할 확률입니다. 동전던지기를 동전을 100번 던질 때 앞면이 나오는 횟수의 확률분포는 $B(100,0.5)$ 입니다. 이항분포 $B(n,p)$ 를 식으로 .. 2018. 4. 12.
[손으로 푸는 통계] 8. 1~7강 요약(세로영상) 1~7강까지 내용을 요약해봅시다. 먼저 1강에서는 대표적인 통계량인 평균, 분산, 표준편차에 대해 배웠습니다. 2강에서는 표본분산을 계산할 때 왜 n-1로 나누는 것인지를 배웠는데요. 이는 표본분산을 불편추정량으로 만들기 위함이었습니다. 불편추정량이 무엇을 의미하는지, 자유도는 무엇인지 공부했습니다. 3강에서는 표본평균의 평균이 모평균과 같다는 것을 유도했습니다. 표본평균의 평균이 모평균과 같기 때문에 표본평균은 불편추정량입니다. 4강에서는 표본분산의 평균이 모분산과 같다는 것을 유도했습니다. 따라서 표본분산도 불편추정량입니다. 5강에서는 표본평균의 분산이 모분산을 n으로 나눈 것과 같음을 유도했습니다. 이 내용은 고등학교에서도 배운 내용이지만, 유도하지는 않았었습니다. 6강에서는 두 변수가 독립인 경우.. 2018. 3. 24.
[손으로 푸는 통계] 7. 크기가 1인 표본평균의 평균과 분산이 모집단과 같은 이유 증명 3강에서 표본평균의 평균을 계산했던 수식을 가져와봅시다. $E(\bar{X})=E\left ( \frac{\sum_{i=1}^{n}x_{i}}{n}\right )$ $\frac{1}{n}$ 은 상수이므로 밖으로 꺼냅시다. $E(\bar{X})=\frac{1}{n} E\left ( \sum_{i=1}^{n}x_{i} \right )$ 우변의 괄호 안 수식을 풀어서 쓰면 아래와 같습니다. $E(\bar{X})=\frac{1}{n} E\left ( x_{1}+x_{2}+...+x_{n} \right )$ 여기서 우변의 각 항들이 표본들의 n번째 원소를 나타내는 변수입니다. 각 항을 크기가 1인 표본으로 생각할 수 있습니다. 크기가 1인 표본에서는 표본과 표본평균이 같기 때문에, 크기가 1인 표본평균이라는 변수.. 2018. 3. 24.
[손으로 푸는 통계] 6. E(XY)=E(X)E(Y) 의 성립조건과 증명 5강(표본평균의 분산이 모분산/n 인 이유)에서 수식을 유도할 때, 아래 등식을 사용했습니다. $E(XY)=E(X)E(Y)$ 두 변수 X,Y가 독립일 경우 등식이 성립합니다. 두 변수가 독립이라는 것은 한 변수의 발생 여부가 다른 변수에 영향을 주지 않는 것을 의미합니다. 오늘은 두 변수가 독립인 경우 왜 위 등식이 성립하는지 증명해보도록 하겠습니다. 먼저 간단한 예시로 성립한다는 것을 보여드리고, 일반화하도록 하겠습니다. 예시 서로 독립인 변수 X,Y가 있다고 합시다. X와 Y의 원소는 아래와 같습니다. $X=\left [ 1,2,3 \right ]$ $Y=\left [ 5,6 \right ]$ 이때 XY가 가질 수 있는 원소는 아래의 6가지입니다. $XY=\left [ 1\times5,2\times .. 2018. 3. 23.
[손으로 푸는 통계] 5. 표본평균의 분산이 모분산/n 인 이유(고등학생들 꼭 보세요) 우리는 지난 두개의 글에서 표본평균의 평균이 모평균과 같다는 것과, 표본분산의 평균이 모분산과 같다는 것을 보였습니다. $E(\bar{X})=\mu$ $E(S^{2})=\sigma^{2}$ 표본분산의 평균이 모분산과 같다는 것을 보일 때, 아래 성질을 사용했습니다. $V(\bar{X})=\frac{\sigma^2}{n}$ 이 성질은 고등학교에서 확률과 통계 시간에도 배우는 내용입니다. 증명은 하지 않았던 것으로 기억합니다. 주사위 던지기나, 동전 던지기 등의 간단한 예시로 위 등식이 성립하는 한가지 사례를 보였을겁니다. 오늘은 위 등식이 성립한다는 것을 증명해봅시다. 증명 방법1 표본평균의 분산은 아래와 같이 계산됩니다. 분산이 편차의 제곱의 평균이기 때문입니다. $V(\bar{X})=E\left [ \.. 2018. 3. 23.
[손으로 푸는 통계] 1. 평균, 편차, 분산, 표준편차 평균, 편차, 분산, 표준편차 통계학은 데이터를 다루는 학문입니다. 데이터를 모으고, 정리하고, 분석하고, 추측하고, 어떤 결론을 도출하는 것이 통계학의 역할입니다. 데이터를 요약해주는 특징들을 알 수 있다면 데이터를 파악하는데 도움이 됩니다. 데이터의 특징을 수치화한 값을 통계량이라고 합니다. 대표적인 통계량에는 '평균(mean)', '분산(variance)', '표준편차(standard deviation)' 등이 있습니다. 어떤 집단이 궁금한 상황을 가정해봅시다. 우리는 그 집단 전체가 궁금합니다. 전체집단을 모집단(Population)이라고 부릅니다. 이 모집단의 평균,편차,분산,표준편차와 같은 모집단의 특성을 모수(Parameter)라고 합니다. 하지만 전체집단을 모두 조사할 수는 없습니다. 그래.. 2018. 3. 23.
반응형