본문 바로가기
반응형

통계213

[수리통계학] #15. 전체포괄(Collectively Exhaustive), 상호배반(Mutually Exclusive), 분할(Partition) 전체포괄(collectively exhaustive) k개의 사건들 $A_{1},A_{2},...,A_{k}$가 있다고 합시다. 이 사건들의 합집합이 표본공간S와 같다면 이사건들의 모임이 '전체를 이룬다'고 합니다. 이때 아래 등식이 성립합니다. $\bigcup_{i=1}^{k}P(A_{i})=1$ 줄여서 exhaustive 라고도 부릅니다. exhaustive 의 의미를 알아봅시다. exhaust라는 단어에 더 익숙하실 것입니다. '기진맥진하게 만들다'라는 의미에 너무 익숙해져버려서 감이 잘 안오실 수 있는데요. exhaust 는 다 써버리다 라는 뜻도 있습니다. exhaustive 는 다 써버린, 하나도 빠뜨리지 않은, 철저한 이라는 뜻입니다. 어떤 집합의 모임이 표본공간을 다 써버린거죠. 상호배반(.. 2021. 2. 27.
[수리통계학] #14. 조건부확률, 곱셉공식 조건부확률의 정의 조건부확률은 어떤 사건 A가 일어났다는 전제 하에 사건 B가 일어날 확률입니다. 기호로는 아래와 같이 나타냅니다. $P(B|A)$ 사건 A가 일어났으므로, 사건 A가 새로운 표본공간이 됩니다. 이 표본공간에서 사건 B가 일어난다는 것은 사건 $A \cap B$ 가 일어난다는 의미입니다. 따라서 조건부확률은 아래와 같이 정의됩니다. $P(B|A)=\frac{P(A \cap B)}{P(A)}$ 곱셈법칙 (multiplication rule, 또는 곱셈공식) 조건부확률의 정의를 변형하면 아래와 같습니다. $P(A \cap B)=P(A)P(B|A)$ 이 수식의 의미를 생각해봅시다. A와 B가 둘다 발생한 확률은 A가 발행하고, A가 발생한 상황에서 B가 발생하면 된다 라고 해석할 수 있습니다... 2021. 2. 27.
대부분의 논문들을 신뢰할 수 없는 이유 (스텐포드 교수의 주장) 2005년 스텐포드 교수인 John loannidis 는 PLOS Medicine 저널에 아래와 같은 제목의 논문을 발표합니다. Why Most Published Research Findings Are False (왜 게제된 연구의 발견들이 대부분 거짓인가) 굉장히 자극적인 제목입니다. 그의 주장은 상당수의 논문들이 '재현 불가능한' 결과를 담고 있다는 것입니다. 재현 불가능하다는 것을 다른 말로 하면 '우연히 발생한 특정 사건'을 포착하였다는 것입니다. 이해를 돕기 위해 극단적인 예를 들어봅시다. 어떤 약의 효능을 입증하기 위해 비교군고 대조군 50명씩, 10000쌍에서 임상시험을 하고 이 중 우연히 약의 효과(유의차)가 발생한 사례를 논문에 게재하는 것입니다. 당연히 10000번 실험하면 우연히 차이.. 2021. 2. 27.
[수리통계학] #13. 포함 배제의 원리 (Inclusion–exclusion principle) 확률에서의 포함배제의 원리는 9강과 10강에서 살펴본 합집합의 확률공식을 일반화한 것입니다. 포함배제의 공식(Inclusion–exclusion formula)이라고도 부릅니다. 집합이 2개인 경우 아래 등식이 성립합니다. $P\left ( A\cup B \right )=P\left ( A \right )+P\left ( B \right )-P\left (AB \right )$ 집합이 세개인 경우는 아래 등식이 성립합니다. $P(A \cup B \cup C)=P(A)+P(B)+P(C)-P(A \cap B)-P(A \cap C)-P(B \cap C)+P(A \cap B \cap C)$ 집합이 4개인 경우는 어떨까요? $\begin{align} \\&P(A \cup B \cup C \cup D)=P(A)+P.. 2021. 2. 26.
[수리통계학] #12. 부울의 부등식 (Boole's inequality) P는 집합함수고 집합 $A_{n}$은 어떤 사건들이라고 합시다. 이때 아래 부등식이 성립합니다. $P\left ( \bigcup_{i=1}^{\infty }A_{i} \right )\leq \sum_{i=1}^{\infty }P\left ( A_{i} \right )$ 이 부등식을 부울부등식이라고 합니다. 부울대수(논리대수)를 창안한 조지 부울의 이름을 따서 만들어진 부등식입니다. 먼저 좌변을 보면 $A_{1},A_{2},...$ 집합들의 합집합의 확률입니다. 우변은 각 집합들의 확률의 합입니다. 우변은 교집합들이 중복되어 계산될 것이니 당연히 좌변보다 클 것입니다. 교집합이 없을 경우는 같을 거구요. 직관적으로 받아들일 수 있는 내용의 증명은 생략합니다. 집합이 2개인 경우의 부울의 부등식은 아래와 같.. 2021. 2. 26.
[수리통계학] #11. 단조증과 단조감소 집합의 확률 단조증가 또는 단조감소하는 집합의 확률에는 아래와 같은 성질들이 성립합니다. 1) 단조증가 집합의 확률 집합 $C_{n}$을 단조증가집합이라고 합시다. 이때 아래 등식이 성립합니다. $\lim_{n\rightarrow \infty}P(C_{n})=P(\lim_{n \rightarrow \infty}C_{n})=P\left ( \bigcup_{n=1}^{\infty} C_{n} \right)$ 2) 단조감소 집합의 확률 $\lim_{n\rightarrow \infty}P(C_{n})=P(\lim_{n \rightarrow \infty}C_{n})=P\left ( \bigcap_{n=1}^{\infty} C_{n} \right)$ 직관적으로 이해되는 내용의 증명은 생략하겠습니다. 2021. 2. 26.
[수리통계학] #10. 합집합의 확률 공식을 수식으로 증명(집합3개) 집합이 3개인 경우 합집합의 확률공식은 아래와 같습니다. $P(A \cup B \cup C)=P(A)+P(B)+P(C)-P(A\cap B)-P(B\cap C)-P(A\cap C)+P(A\cap B\cap C)$ 고등학교 때는 벤다이어그램을 이용해서 유도했을겁니다. 이번에는 수식을 이용해서 유도해봅시다. 교집합기호는 생략하겠습니다. A,B,C 의 합집합은 아래와 같이 나타낼 수 있습니다. $P(A \cup B \cup C)=P((A \cup B) \cup C)$ 집합 2개인 경우의 합집합 확률공식을 적용합시다. $P(A \cup B \cup C)=P(A \cup B)+P(C)-P((A \cup B) \cap C)$ 우번의 첫째항에 한번더 적용합시다. $P(A \cup B \cup C)=P(A)+P(B)-P.. 2021. 2. 26.
[수리통계학] #9. 합집합의 확률 공식을 수식으로 증명(집합2개) 집합이 2개인 경우 합집합의 확률 공식은 아래와 같습니다. $P\left ( A\cup B \right )=P\left ( A \right )+P\left ( B \right )-P\left ( A\cap B \right )$ 고등학교 때는 벤다이어그램을 이용해서 유도했을겁니다. 이번에는 수식을 이용해서 유도해봅시다. 교집합기호는 생략하겠습니다. A와 B의 합집합은 아래와 같이 나타낼 수 있습니다. $P\left ( A\cup B \right )=P\left ( AB^{c} \cup AB \cup A^{c}B \right )$ 우변의 세 집합이 서로 배반이므로 아래와 같이 변형이 가능합니다. $P\left ( A\cup B \right )=P\left ( AB^{c} \right )+P\left ( AB.. 2021. 2. 26.
[수리통계학] #8. 확률분포의 수학적 정의 (확률의 공리) 확률분포를 수학적으로 정의해봅시다. S를 표본공간, A를 사건이라고 합시다. P를 사건 A에서 실수(real number)로 대응시키는 함수라고 합시다. 이때, 함수 P가 아래 세가지 공리(조건)을 만족한다면, 함수 P는 확률분포입니다. Axiom 1: 모든 A에 대해 $P(A)\geq 0$ 이다. Axiom 2: $P(S)=1$ 이다. Axiom 3: 만약 $A_{1},A_{2},...$ 가 서로 배반이라면 아래 등식이 성립한다. $P\left ( \bigcup_{i=1}^{\infty }A_{i} \right )=\sum_{i=1}^{\infty }P\left ( A_{i} \right )$ 읽어보면 아시겠지만 세가지 공리는 당연한 것들입니다. 확률은 0보다 크고, 확률의 합은 1이고, 서로 배반이면.. 2021. 2. 26.
[수리통계학] #7. 실험, 시행, 표본공간, 사건, 원소 1) 실험 (experiment) 무한히 반복할 수 있는 임의의 절차를 '실험' 이라고 합니다. 영어로는 experiment 입니다. 예를들면 주사위 던지기, 동전던지기 등이 있습니다. 2) 시행 (trial) 실험을 실제로 수행하는 것을 시행이라고 합니다. 영어로는 trial 입니다. 실험과 시행을 같은 의미로 쓰기도 합니다. 3) 표본공간 (sample space) 표본공간은 실험을 시행하여 나올 수 있는 모든 가능한 결과의 집합입니다. 주사위를 던진다고 하면 {1,2,3,4,5,6}이 표본공간이고, 동전을 던진다고 하면 {H,T} 이 표본공간입니다. 동전을 두개 던질 때의 표본공간은 아래와 같습니다. {HH,TT,HT,TH} 4) 사건 (event) 사건은 표본공간의 부분집합입니다. 사건은 우리가 .. 2021. 2. 26.
[수리통계학] #6. 순열과 조합 순열과 조합은 고등학교에서 이미 배운 내용입니다. 다시 설명하는 이유는 기호가 달라졌기 때문입니다. 1) 순열 고등학교에서 순열을 배울 때는 아래와 같이 나타냈었습니다. $_{n}P_{r}=\frac{n!}{(n-r)!}$ 수리통계학에서는 순열을 아래와 같은 기호로 나타냅니다. $P_{r}^{n}=\frac{n!}{(n-r)!}$ 2) 조합 고등학교에서 조합을 배울 때는 아래와 같이 나타냈었습니다. $_{n}C_{r}=\frac{n!}{r!(n-r)!}$ 수리통계학에서는 조합을 아래와 같은 기호로 나타냅니다. $\binom{n}{r}=\frac{n!}{r!(n-r)!}$ 2021. 2. 24.
[수리통계학] #5. 집합의 단조증가, 단조감소 아래와 같은 집합열이 있다고 합시다. $A_{n}$은 집합입니다. $A_{1},A_{2},...$ 영어로 sequence of set 인데, 원문의 의미는 받아들여 지는데 한글로 번역하려니 애매하네요. 집합배열? 집합열? 등으로 번역될 것 같은데, 집합열이라고 부르겠습니다. 이러한 집합열이 '단조증가' 하거나 '단조감소'할 수 있습니다. 단조증가와 감소가 무엇인지 설명드리겠습니다. 1) 단조증가(monotone increasing) 단조증가는 집합이 갈수록 같거나 커진다는 뜻입니다. nondecreasing과 같은 의미입니다. 첨자가 높은 집합이 낮은 집합을 포함합니다. 아래와 같은 관계가 성립됩니다. $A_{1} \subset A_{2} \subset ...$ 또한 아래와 같은 등식을 도출할 수 있습니.. 2021. 2. 22.
[수리통계학] #4. 교환법칙, 결합법칙, 분배법칙 영단어 집합과 관련된 영단어를 알아봅시다. 집합의 연산인 교집합, 합집합에서는 교환,결합,분배법칙이 성립합니다. 이 용어들의 영단어를 알아봅시다. 1) 교환법칙 : Commutative property(Communitivity) Commutative 는 가환성의(교환 가능한)이라는 의미입니다. 2) 결합법칙 : Associative property (=Associativity) Associative 는 연합의, 연상의 라는 의미입니다. 2) 분배법칙 : Distributive laws Distributive 는 분배의, 분배에 관한 이라는 의미입니다. 2021. 2. 19.
[수리통계학] #3. 합집합,교집합,여집합,배반집합,부분집합 영단어 집합과 관련된 영단어를 알아봅시다. 단어를 알아야 영어로 된 수학 강의를 보거나 자료를 읽을 때 수월하게 이해할 수 있습니다. 1) 합집합 : union 2) 교집합 : intersection 3) 여집합 : complement 4) 배반집합 : disjoint, mutually exclusive 5) 부분집합 : subset 2021. 2. 19.
[수리통계학] #2. 조건제시법과 콜론(:) 조건제시법을 나타내는 방법입니다. 고등학교때는 bar( | ) 를 사용했는데요. 제가 참고한 세개의 문헌 모두 콜론(:)을 사용했습니다. 몇가지 조건제시법 사용 예시를 보여드릴테니 표현방식에 익숙해져봅시다. 일부러 여러 책에 나온 다양한 표현방법을 넣었습니다. 조건제시법은 괴롭히려고 만든게 아니라 편하려고 만든 표현법입니다. 익숙해지는데 에너지가 들긴 하지만 한번 익숙해지면, 설명하려면 긴 이야기를 짧게 나타낼 수 있습니다. 킹받네와 비슷합니다. 1) $\left \{ \omega \in \Omega : \ \omega \in A \ or \ \omega \in B \ or \ \omega \in both \right \}$ 여기서 Ω는 표본공간입니다. Ω의 원소 ω 중에서, A의 원소이거나 B의 원소이.. 2021. 2. 19.
[수리통계학] #1. 여러 개의 집합의 합집합과 교집합 표현식 합집합과 교집합의 표현식을 알아봅시다. 편하려고 만든 기호입니다. 길게 쓰기 싫어서 짧게 줄인 것이죠. 별거 없습니다. 대신 익숙해져야 한눈에 알아볼 수 있습니다. 아래와 같이 n개의 집합이 있다고 합시다. $A_{1},A_{2},\cdots ,A_{n}$ 1) 여러 집합의 합집합 표현방식 위 집합들의 합집합은 아래와 같은 기호로 나타냅니다. $A_{1} \cup A_{2} \cup \cdots \cup A_{n}=\bigcup_{i=1}^{n}A_{i}$ 집합이 무수히 많은 경우는 아래와 같이 무한대 기호를 사용하여 나타냅니다. $A_{1} \cup A_{2} \cup \cdots=\bigcup_{i=1}^{\infty}A_{i}$ 2) 여러 집합의 교집합 표현방식 위 집합들의 교집합은 아래와 같은 기.. 2021. 2. 19.
[수리통계학] 프롤로그 취미(?) 또는 자기계발의 일환으로 통계학 공부를 시작했었고, 현재는 통계의본질, 통계의 도구들이라는 유튜브 채널을 운영하고 있습니다. t검정의 원리가 궁금해서 시작한 공부라서 t검정을 이해하는 것이 목적인 '손으로 푸는 통계'라는 강의와 여러가지 확률분포를 공부해보는 '손으로 푸는 확률분포' 라는 강의를 주로 진행하고 있습니다. 통계의 본질 채널에서 진행합니다. 통계의 도구들에서는 엑셀, R, 파이썬 등으로 통계분석 및 시각화하는 방법을 강의하고 있습니다. 통계를 공부하면서 통계와 관련된 수학적인 도구들을 더 많이 갖춰야 겠다는 생각이 자연스레 들어서, 수리통계학 공부를 시작하려고 합니다. 강의를 듣거나 교제를 수동적으로 따라가며 읽는 것을 못하는 성격이라, 수리통계학 역시 제 방식대로 공부해보려고 합.. 2021. 2. 19.
[손으로 푸는 통계 ver2.0] 프롤로그 #3. t검정을 이해하기 위한 목차 만들기 지난 글에서 t검정을 '진짜'이해한다는게 무엇인지 말씀드렸습니다. t검정 이라는 산을 정복하기 위해서는 정상에 도달 할 수 있는 '경로'를 정해야합니다. 이 경로는 책 혹은 강의의 목차를 의미합니다. 지금부터 앞으로 이어질 강의의 목차를 만들어봅시다. 마지막 단원은 t검정입니다. 마지막 단원의 번호를 X라고 놓겠습니다. X부터 하나씩 빼며 목차를 만들고, 마지막에 첫번째 강의를 1로 만드는 X를 대입하면 됩니다. X단원. t검정 t검정을 하기 위해서는 t분포를 유도해야합니다. X단원. t검정 X-1단원. t분포 유도 t분포를 유도하려면 카이제곱분포와 정규분포를 먼저 유도해야합니다. X단원. t검정 X-1단원. t분포 유도 X-2단원. 카이제곱분포 유도 X-3단원. 정규분포 유도 정규분포를 유도한 뒤에 Z.. 2021. 1. 20.
[손으로 푸는 통계 ver2.0] 프롤로그 #2. t검정을 '진짜' 이해한다는 것 t검정을 이해하고 싶었습니다. 저는 비전공자 직장인이고, 지난 글에서 t검정을 이해하기 위해 『손으로 푸는 통계』 라는 강의를 시작했다고 말씀드렸습니다. 우리가 오르려는 산 정상에는 t검정이 있고, 정상까지 어떻게 올라갈지 그 루트(route)를 정하기 전에 먼저 t검정을 이해한다는게 무엇인지 이야기해보려고 합니다. 수학적으로 정의된 어떤 대상을 이해하는데는 세가지 단계가 있습니다. (제가 수학/공학/통계학 등을 공부하며 알게된 것이고 사람마다 의견이 다를 수 있습니다.) 1단계) 사용할 줄 아는것 2단계) 원리를 아는 것 3단계) 유도할 줄 아는 것 t검정으로 예를 들어봅시다. t검정을 1단계 수준으로 이해한다는 것은 엑셀,SPSS,R을 이용해서 t검정을 수행하여 p값을 구할 줄 아는 것입니다. 구해진.. 2021. 1. 16.
로그정규분포는 무엇이고 왜 사용하는가 로그정규분포는 무엇인가 로그정규분포는 로그를 씌우면 정규분포를 따르는 변수의 분포입니다. 일반적으로 자연로그의 경우를 말합니다. ln(X)가 정규분포를 따르는 X의 분포인 것입니다. Francis Galton의 이름을 따서 Galton 분포 라고도 불립니다. 확률밀도함수는 아래와 같습니다. $$ f(x)=\frac{1}{x\sigma \sqrt{2\pi}}exp\left ( -\frac{\left ( lnx-\mu \right )^{2}}{2\sigma ^{2}} \right ) $$ 반대로 변수 X가 정규분포를 따른다면, exp(X) 는 로그정규분포를 따릅니다. 왜 사용하는가 로그정규분포의 변수는 항상 '양수'값만을 가집니다. 따라서 정규분포가 음수값을 가짐으로 인해 발생하는 문제에 대한 대안이 될 수.. 2021. 1. 5.
20세기 후반 가장 위대한 3명의 통계학자 「통계의 아름다움(리찌엔,출판사:제이펌)」이라는 책을 읽고 있는데 20세기 후반 가장 위대한 3명의 통계학자가 나오는 대목이 있었다. 조지 박스, 존 투키, 데이비드 콕스라고 했다. 아래는 위키에서 찾은 내용을 간단히 요약한 것이다. 조지박스는 1919년에 태어났다. 영국사람이고 런던대학교를 나왔다. 그 유명한 칼 피어슨의 아들의 제자다. 그 유명한 로널드 피셔의 둘째 딸인 조안 피셔와 결혼했다. 미국으로 건너가 위스콘신 대학교 메디슨캠퍼스에 통계확과를 무려 설립했다. 존 튜키는 1915년에 태어났다. 미국 사람이고, 브라운대학 학부 프린스턴대학에서 박사 학위를 받았다. 학창시절 프랑스어와 같은 특수한 과목 이외의 나머지 과목은 어머니께 배웠다(홈스쿨링 한듯). 무려 box-plot 을 만든 사람이다. .. 2021. 1. 1.
0!은 어떻게 1로 정의된걸까 팩토리얼은 한자어로 계승(階乘)이라고 부릅니다. 차례(계)자에 곱할(승)자를 사용합니다. 차례대로 곱한다는 의미입니다. n!은 아래와 같이 정의됩니다. n!=1x2x3x ... xn 팩토리얼은 통계학에서 자주 등장합니다. 순열계산에 팩토리얼이 사용되기 때문입니다. n!을 경우의 수로 해석하면, n개의 서로 다른 무언가를 일렬로 나열하는 경우의 수 입니다. n의 범위는 자연수가 아니라, 음이 아닌 정수입니다. 0도 올 수 있다는 말입니다. 0!은 1로 정의됩니다. 도데체 왜 0!을 1로 정의한걸까요? 1) 팩토리얼의 성질 이용 n!=n(n-1)! 입니다. 따라서 3!=3x2! 2!=2x1! 1!=1x0! 입니다. 1x0!이 1이므로, 0!은 1이 됩니다. 2) 감마함수 이용 (n-1)!을 0과 음의 정수를.. 2020. 12. 28.
[도전! 데이터 분석 - 암cancer] #1. 프롤로그, 데이터 수집 프롤로그 최근에 몸이 많이 아팠습니다. 이유없이 아팠던 것은 아니고 제가 살아온 결과였습니다. 밤늦게 먹고, 급하게 먹고, 밀가루 튀김 한없이 먹고, 달고 자극적인 것을 좋아한 결과였습니다. 아프고 나니 몸에 대한 소중함을 다시금 알게 되었고, 지금 부터는 잘 관리해야 겠다는 마음이 생겼습니다. 그래서 나이별로 많이 걸리는 암을 조사하고, 앞으로 다가올 암을 미리 예방하려고 합니다. 예를들어 제가 30대 이고, 40대에 많이 걸리는 암이 A암이라면 A암에 걸리는 조건과 반대로 살려는 것입니다. 데이터수집 국가통계포털(KOSIS)에 찾아보니 필요한 데이터가 있었습니다. 아래 경로로 다운 받았습니다. [주제별 통계]-[보건]-[암등록통계]-[24개 암종/성/연령(5세)별 암발생자수,발생률] 1999~2017.. 2020. 12. 23.
[손으로 푸는 통계 ver1.0] 50. 표본분산의 분포 유도 (15) 오일러 극한값의 변형 오일러가 발견한 극한값을 오늘날의 감마함수가 되기 직전의 형태로 변형해봅시다. 오일러가 발견한 극한값은 아래와 같습니다. 지난시간에는 이 수식을 증명했고, 오늘은 이 수식을 변형할 것입니다. $$ n!=\left [ \left ( \frac{2}{1} \right )^{n} \cdot \frac{1}{n+1} \right ] \left [ \left ( \frac{3}{2} \right )^{n} \cdot \frac{2}{n+2} \right ] \left [ \left ( \frac{4}{3} \right )^{n} \cdot \frac{3}{n+3} \right ]\cdots $$ 극한을 이용하여 표현하면 아래와 같습니다. $$ n!=\lim_{m\rightarrow \infty } \left [ .. 2020. 12. 21.
[손으로 푸는 통계 ver1.0] 49. 표본분산의 분포 유도 (14) 오일러가 발견한 극한값 우리는 팩토리얼함수인 f(n)=(n-1)! 을 실수영역으로 확장하려는 시도를 하고 있습니다. 이를 위해 아래 조건을 만족하는 함수를 찾아야 합니다. 1) n이 자연수 일 때, f(n)=(n-1)! 2) f(n)=(n-1)! 로 찍은 점을 부드럽게 연결 이제 이 함수를 찾아봅시다. 함수를 찾는 과정은 그닥 매끄럽지 않습니다. 매끄럽지 않은 이유는, 과정에서 '하늘에서 떨어진'듯한 수식들이 등장하는데, 그 수식들의 발견과정을 알 수 없기 때문입니다. 발견과정을 알 수 없는 이유는 기록이 없기 때문입니다. 만약 사후세계가 있고 오일러를 만날 수 있다면 그제야 알 수 있을겁니다. 유도 과정이 간단하면 논리적인 인과관계를 갖도록 재구성을 해볼텐데, 아쉽게도 아직 그럴 능력이 없습니다. 최대한 간극을 매워보도록 합.. 2020. 12. 15.
통계학의 분류 통계학은 크게 기술통계학과 추측통계학으로 나뉨. 추측통계학은 추정과 가설검정으로 나뉨. 기술통계학 : 데이터의 기록, 데이터의 정리, 데이터의 특징 요약 추측통계학 : 추정 또는 가설검정 추정은 점추정과 구간추정으로 나뉨. 가설검정은 평균비교, 비율비교, 회귀분석 등으로 나뉨 2020. 12. 1.
[손으로 푸는 확률분포] 지수분포 (6) 분산 (6) 분산 지수분포의 분산을 구해봅시다. 지수분포의 분산은 아래와 같이 구할 수 있습니다. 적분변수가 시간이므로 0부터 무한대 사이의 값을 갖습니다. E(T)는 지난 강의에서 구했습니다. 확률변수의 제곱의 평균항만 구하면 됩니다. 적분형태로 표현하면 아래와 같습니다. 지수분포 함수를 대입하면 아래와 같습니다. 부분적분을 적용합시다. 파란 항은 아래와 같이 변형할 수 있습니다. 파란항이 평균과 같으므로 아래와 같이 계산됩니다. 빨간항은 아래와 같이 계산됩니다. 분수형태로 변형합시다. 로피탈 정리를 이용하면 극한값이 0임을 알 수 있습니다. 결과를 V(T)식에 대입합시다. 이항분포의 분산은 아래와 같이 계산됩니다. 2020. 11. 23.
[손으로 푸는 확률분포] 지수분포 (5) 평균 (5) 평균 지수분포의 평균을 구해봅시다. 지수분포의 평균은 아래와 같이 구할 수 있습니다. 적분변수가 시간이므로 0부터 무한대 사이의 값을 갖습니다. 지수분포 함수를 대입하면 아래와 같습니다. 부분적분을 적용합니다. 마지막 항도 적분해줍시다. 적분상수가 무한대인 경우는 아래와 같이 극한형태로 표현할 수 있습니다. 파란 부분의 극한은 0으로 수렴한다는 것을 쉽게 알 수 있습니다. 따라서 아래와 같이 정리할 수 있습니다. 빨간 부분의 극한이 문제인데요. 아래와 같이 분수형태로 나타내봅시다. 형태를 간단하게 하기 위해 람다를 분자에 곱하고 나눠줍니다. 빨간 limit 안의 부분은 아래와 같은 극한문제와 같습니다. 이제 아래 극한을 구하면 됩니다. 직관적으로는 0이라는 것을 알 수 있습니다. exponenti.. 2020. 11. 16.
[손으로 푸는 확률분포] 지수분포 (4) 예시 : 카페 대기시간 (4) 예시 : 카페 대기시간 지수분포에는 아래와 같은 예시들이 있습니다. - 전자 제품의 5년간 고장횟수가 평균 1회일 때, 1년 안에 고장날 확률 - 평균 대기시간은 10분인 어느 카페에 갔을 때, 기다리는 시간이 10분~20분 사이일 확률 오늘은 두번째 예시입니다. 먼저 람다(λ) 를 구해야야합니다. 프아송분포에서 람다는 딘위시간동안의 평균 발생횟수였습니다. 첫번째 예시는 평균횟수가 드러나 있지만, 두번째 예시는 그렇지 않습니다. 위 정보를 이용하여 구할 있습니다. 대기시간이 10분이라는 것은 10분에 1명꼴로 주문을 한다고 할 수 있습니다. 10분간 평균 주문 횟수가 1회라는 것입니다. 단위시간을 1분으로 놓으면 평균 주문횟수는 0.1회가 됩니다. 따라서 람다는 0.1 입니다. 이때의 지수분포는 .. 2020. 11. 3.
[통계 오류의 이해] 2. 1종오류는 어떻게 계산할까 1종오류는 유의수준(significant level)에 따라 정해집니다. 가설검정을 할 때 유의수준을 설정하게 되는데, 유의수준을 정한다는 것은 '1종오류를 얼마까지 감수할 것인가'를 정하는 것입니다. 유의수준이 무엇인지 먼저 알아봅시다. 예를 들어봅시다. 스마트스토어에 팔기 위해 핸드폰 케이스를 개발했다고 합시다. 공장이 없어서 외주생산을 맡겼습니다. 핸드폰 케이스의 두께는 10mm 인데, 공장에서는 실제 생산 시 평균 10mm이고 표준편차는 0.2mm 라고 했습니다. 표준편차가 0.2정도면 괜찮다고 판단했습니다. 이를 확인하기 위해 50개의 샘플을 받았습니다. 두께를 측정해보니 평균이 10.1mm가 나왔습니다. 얼핏 보기에는 괜찮은 것 같은데, 공장의 주장이 사실인지 거짓인지 통계적으로 판단해보기로 .. 2020. 10. 28.
반응형