본문 바로가기
반응형

통계 기초11

[확률과통계 기초] 3-13. 이항분포 배우기 전에 베르누이분포 먼저 우리는 지난시간에 이항분포에서 '이항'이 어떤 의미인지 배웠습니다. 이항은 두개의 항이라는 뜻입니다. 이항분포가 무엇인지 배울 차례인데요. 그 전에 베르누이분포를 먼저 배우겠습니다. 이유는 다음 강의에서 알게되실겁니다. 시행과 사건 기억하시나요? 세번째 시간에 배웠던 시행, 표본공간, 사건의 정의를 가져옵시다. 시행 : 무한히 반복될 수 있고, 잘 정의된 결과 집합을 갖는 행위 표본공간 : 어떤 시행에서 발생할 수 있는 모든 결과를 모아놓은 집합 사건 : 어떤 시행의 결과들의 집합. 확률이 할당되어 있음. 표본공간의 부분집합. 시행,표본공간,사건을 쉽게 기억하는 방법은 주사위 던지기 예시로 기억하는 것입니다. 시행은 주사위던지기이고, 표본공간은 1부터6 까지의 집합이고, 사건은 짝수의 눈이 나오는 사건이.. 2024. 1. 3.
[확률과통계 기초] 3-10. P[X=x] 와 p(x)의 차이 확률변수 X의 확률질량함수의 정의는 아래와 같습니다. $P\left [ X=x_{i} \right ]=p_{i} \ \ (i=1,2,...,n)$ 위 식의 좌변에서 P[ ] 는 대괄호 안의 사건이 발생할 확률을 나타냅니다. 좌변은 $X=x_{i}$ 일 확률이라는 뜻입니다. 예를 들어봅시다. 주사위를 한번 던질 때 나오는 눈의 값을 확률변수 X라고 한다면, X의 확률질량함수는 아래와 같습니다. $P\left [ X=x \right ]=\frac{1}{6} \ \ (x=1,2,...,6)$ 위와 같은 표현을 더 간단히 나타낼 수 있습니다. 함수이름를 사용하는 것입니다. 함수 이름은 원하는 것을 사용하면 되는데 주로 p나 f를 사용합니다. 확률변수 X의 확률질량함수를 p(x)라고 한다면, p(x)의 의미는 '.. 2023. 12. 8.
[확률과통계 기초] 3-7. 연속확률변수에서 확률이 정의되지 않는 이유 이산확률변수에서는 변수가 가질 수 있는 값의 개수가 무한한데도 변수가 어떤 값을 가질 확률이 정의되는 경우가 있었습니다. 아래와 같이 확률변수가 커지면 확률이 0으로 수렴하는 경우가 대표적인 예시입니다. $P\left [ X=x \right ]=\left ( \frac{1}{2} \right )^x$ 연속확률변수도 확률변수가 가질 수 있는 값의 개수가 무한합니다. 이산확률변수와 달리 연속확률변수에서는 확률변수가 어떤 값을 가질 확률이 확률이 항상 정의되지 않습니다. 왜 그런지 같이 생각해봅시다. 연속확률변수가 확률을 갖는다고 가정하고 아래와 같은 그래프를 그려봅시다. 양 끝 값은 0이라고 합시다. 구간 안에 있는 값들이 발생할 확률이 0이 아닌 어떤 구간을 하나 정의합시다. 이 구간의 발생 확률의 최솟값.. 2023. 8. 4.
[확률과통계 기초] 3-3. 확률함수와 확률분포 우리가 계속 사용하고 있는 동전 두개 던지는 예시를 가져옵시다. 동전을 두개 던져서 앞면이 나오는 횟수를 확률변수로 놓을 수 있었습니다. 확률변수를 X로 놓으면 X가 가질 수 있는 값은 아래와 같습니다. X={0,1,2} 확률변수 X가 각 값을 가질 확률은 아래와 같습니다. $P[X=0]=\frac{1}{4}$ $P[X=1]=\frac{1}{2}$ $P[X=2]=\frac{1}{4}$ 확률변수 X가 가질 수 있는 값들과, 각 값을 가질 확률 사이에 대응관계가 존재합니다. 이 대응관계를 표로 나타내면 아래와 같습니다. X 0 1 2 합계 $P[X=x]$ $\frac{1}{4}$ $\frac{1}{2}$ $\frac{1}{4}$ 1 이와 같은 대응관계를 '확률분포'라고 부릅니다. 이 대응관계를 p(x)라는 .. 2023. 7. 2.
[확률과통계 기초] 2-7. 사건의 독립 예시 사건의 독립과 관련된 예제를 두가지 풀어봅시다. 예제1. 주사위를 던질 때 2 이하의 눈이 나오는 사건을 A, 짝수의 눈이 나오는 사건을 B라고 하자. 사건 A와 B가 서로 독립인지 판단하시오. 풀이) 사건 A와 B가 발생할 확률은 각각 아래와 같습니다. $P(A)=\frac{1}{3}$ $P(B)=\frac{1}{2}$ 사건 A와 B가 동시에 발생할 확률은 아래와 같습니다. $P(A\cap B)=\frac{1}{6}$ $P(A\cap B)=P(A)P(B)$ 가 성립하므로 두 사건은 독립입니다. 예제2. 동전 한개와 주사위 한 개를 동시에 던질 때, 동전은 앞면이 나오고 주사위는 홀수가 나올 확률을 구하시오. 풀이) 이번 문제는 위 문제와 다르게 독립임을 확인하는게 아니라 독립 조건을 사용하면 됩니다. .. 2023. 5. 6.
[손으로 푸는 통계 ver1.0] 64. 표본분산의 분포 유도 (29) 감마 1/2 계산하기 감마함수 적분형을 이용하여 $\Gamma \left ( \frac{1}{2} \right)$ 을 계산해봅시다. 지난 60강에서 $\frac{1}{2}!$이 $\frac{\sqrt{\pi}}{2}$ 인 것을 증명했었는데요. 이 결과와도 비교해봅시다. 감마함수 적분형은 아래와 같습니다. $\Gamma (z)=\int_{0}^{\infty}t^{z-1}e^{-t}dt$ $\Gamma (\frac{1}{2})$ 계산하기 위해 z에 1/2 을 대입합시다. $\Gamma \left ( \frac{1}{2} \right)=\int_{0}^{\infty}t^{-\frac{1}{2}}e^{-t}dt$ t를 $x^{2}$으로 치환합시다. $\begin{align} t&=x^{2}\\ dt&=2xdx \end{align}$.. 2021. 8. 1.
변수 A,B,C 의 상관관계 변수 A와 변수 B가 강한 상관관계가 있고, 변수 B와 변수 C가 강한 상관관계가 있다고 하자. 이때 변수 A와 C 사이에는 반드시 상관관계가 있을까? 대답은 아니오이다. 간단한 반례를 들어보자. 김,이,박 세 사람이 있다고 하자. 세 사람의 주식 보유량은 아래와 같다. 김 : 삼성전자10주, 엘지전자10주 이 : 삼성전자10주, 셀트리온10주 박 : 셀트리온10주, 네이버10주 삼성전자라는 같은 보유주식이 있으므로, 김의 수익률과 이의 수익률은 강한 상관관계가 있다. 셀트리온이라는 같은 보유주식이 있으므로 이와 박의 수익률도 강한 상관관계가 있다. 그러나 김과 박의 보유주식은 전혀 겹치지 않는다. 따라서 김과 박의 수익률에 반드시 상관관계가 있다고 말할 수 없다. 2021. 3. 17.
[통계] 줄기-잎 그림 예시 줄기 잎 그림이 무엇인지 이해하고, 장점이 무엇인지를 알 수 있도록 준비한 예제입니다. 어떤 반 20명 학생들의 수학 점수가 아래와 같다고 합시다. 78, 72, 50, 95, 75, 51, 43, 80, 64, 83, 79, 32, 38, 55, 44, 86, 94, 30, 80, 44 이 점수를 줄기-잎 그림으로 나타내면 아래와 같습니다. 줄기 잎 도수 3 02 2 4 344 3 5 015 3 6 4 1 7 2589 4 8 0036 4 9 45 2 줄기-잎 그림을 이용하면 줄기의 변량을 한 눈에 파악할 수 있고, 도수도 한눈에 파악할 수 있습니다. 2021. 3. 16.
[손으로 푸는 확률분포] 푸아송분포 (2-2) 미분방정식으로 유도 ② 유도 (2-2) 미분방정식으로 유도 ② 유도 지난시간에 세개의 식을 유도했습니다. 본격적으로 푸아송분포를 유도합시다. 길냥이 예제를 이어서 사용하겠습니다. 아래와 같은 확률을 정의해봅시다. 이 확률은 t+Δt 라는 시간동안 길냥이를 x번 만날 확률입니다. 이 확률은 아래와 같이 다른 두 확률의 곱으로 표현할 수 있습니다. t+Δt 라는 시간동안 길냥이를 x번 만날 확률은 t라는 시간동안 x번 만나고 이후 Δt라는 시간동안 0번 만날 확률과 t라는 시간동안 x-1번 만나고 이후 Δt라는 시간동안 1번 만날 확률의 합과 같습니다. 1,2번식(맨 위 빨간식)을 대입하여 정리합시다. 전개하겠습니다. 이항하여 아래와 같이 정리합시다. Δt로 양변을 나눠줍시다. Δt를 0으로 보내면 아래와 같은 미분방정식이 됩니다. 이.. 2019. 11. 7.
[손으로 푸는 확률분포] 푸아송분포 (2-2) 미분방정식으로 유도 ① 준비 (2-2) 미분방정식으로 유도 ① 준비 지난시간에는 이산확률분포를 이용하여 포아송분포를 유도했는데요. 이번에는 미분방정식을 세워서 포아송분포를 유도해보겠습니다. 푸아송분포 첫번째 시간에 소개한 예시를 떠올려봅시다. 24시간 동안 길냥이를 만날 확률분포를 포아송분포의 예로 들었습니다. 길냥이를 만나는 사건이 최대 1번 일어날 수 있을 만큼 작은 시간을 Δt 라고 놓읍시다. Δt 라는 시간 동안 길냥이를 만날 사건이 1번 일어날 확률을 아래와 같이 놓겠습니다. 이 확률은 Δt에 비례할 것입니다. Δt가 길 수록 길냥이를 만날 확률이 높아질 것이기 때문입니다. 따라서 아래와 같이 놓을 수 있습니다. 비례상수를 k라고 합시다. 이때, Δt 동안 길냥이를 만나지 않을 확률은 아래와 같습니다. 전체확률이 1이므로 .. 2019. 11. 5.
[손으로 푸는 통계] 10. 테일러 급수 유도하기 (중심극한정리 재료 #1) 중심극한정리를 증명하는 과정에서 테일러급수가 사용됩니다. 오늘은 테일러급수를 유도해보도록 하겠습니다. 테일러급수 설명 테일러급수는 브룩 테일러(Brook Taylor)가 1715년에 처음 소개했습니다. 테일러급수는 무한급수입니다. 어떤 함수를 다항함수로 만들어진 무한급수로 바꿔줍니다. 어떤 함수 $f(x)$에 테일러급수를 적용하면 아래와 같습니다. $f(x)=f(a)+\frac{f'(a)}{1!}(x-a)+\frac{f''(a)}{2!}(x-a)^{2}+\frac{f'''(a)}{3!}(x-a)^{3}+...$ 임의의 점 a에서의 미분값을 이용해서 함수 값을 계산할 수 있게 해줍니다. a근처에서의 함수값을 구할 경우 고차항(H.O.T)들의 크기가 아주 작아지기 때문에, 고차항들을 날려버리고 함수의 근사값.. 2018. 3. 24.
반응형