본문 바로가기
반응형

확률14

[확률과통계 기초] 3-12. 이항분포에서 '이항' 이 무슨 뜻일까 이번 시간부터 이항분포를 공부할 것입니다. 확률분포는 이산확률분포와 연속확률분포로 나뉘는데, 이항분포는 이산확률분포에 속합니다. '이항'이라는 말을 들으셨을 때 어떤 것이 떠오르셨나요? 방정식이 떠오르셨을 겁니다. 방정식에서 항을 옮기는 것을 '이항'이라고 불렀으니까요. 이항분포의 '이항'은 방정식의 '이항'과 다른 의미입니다. 방정식에서의 이항은 영어로 transposition 이고, 한자로 移項 인데 이동할 (이), 항 (항) 입니다. 이항분포에서 이항은 영어로 binomial 이고, 한자로 二項 입니다. 두개의 항이라는 뜻입니다. 따라서 이항분포를 직역하면 '두개의 항으로 된 분포'라는 뜻입니다. 두개의 항으로 된 분포라는게 어떤 의미인지는 다음시간 부터 알아봅시다. 2023. 12. 27.
[확률과통계 기초] 3-3. 확률함수와 확률분포 우리가 계속 사용하고 있는 동전 두개 던지는 예시를 가져옵시다. 동전을 두개 던져서 앞면이 나오는 횟수를 확률변수로 놓을 수 있었습니다. 확률변수를 X로 놓으면 X가 가질 수 있는 값은 아래와 같습니다. X={0,1,2} 확률변수 X가 각 값을 가질 확률은 아래와 같습니다. $P[X=0]=\frac{1}{4}$ $P[X=1]=\frac{1}{2}$ $P[X=2]=\frac{1}{4}$ 확률변수 X가 가질 수 있는 값들과, 각 값을 가질 확률 사이에 대응관계가 존재합니다. 이 대응관계를 표로 나타내면 아래와 같습니다. X 0 1 2 합계 $P[X=x]$ $\frac{1}{4}$ $\frac{1}{2}$ $\frac{1}{4}$ 1 이와 같은 대응관계를 '확률분포'라고 부릅니다. 이 대응관계를 p(x)라는 .. 2023. 7. 2.
[확률과통계 기초] 3-1. 확률변수 세번째 단원인 통계 단원의 첫 시간입니다. 확률변수에 대해서 배울건데요. 확률변수는 통계에서 아주 중요한한 내용입니다. 통계학은 확률변수들을 분석하는 과목이라고 할 수 있을 정도입니다. 우리는 수학에서 이미 변수라는 것을 접했는데요. 수학에서의 변수를 먼저 복습해보고 확률변수에 대해 배워봅시다. 수학에서의 변수 수학에서는 정해지지 않은 어떤 값을 표현하기 위해 변수를 사용합니다. 아래와 같은 일차 함수가 있다고 합시다. $f(x)=2x^{2}$ 이 함수에서 변수는 x입니다. 실수에서 정의된 함수라면, x에는 모든 실수가 올 수 있습니다. 혹은 변수를 유한하게 제한할 수도 있습니다. 변수 x를 아래 집합의 원소로 제한해봅시다. x={1,2,3,4,5} 이제 x는 1,2,3,4,5 중 하나의 값을 갖는 변수.. 2023. 5. 29.
정규분포를 따르는 확률변수의 합의 분포 정규분포를 따르는 확률변수 X와 Y가 있다고 합시다. 각 확률변수의 분포는 아래와 같이 나타낼 수 있습니다. $X \sim N\left (\mu_{X},\sigma_{X}^2 \right )$ $Y \sim N\left (\mu_{Y},\sigma_{Y}^2 \right )$ 두 확률변수 X와 Y가 서로 독립이라고 가정하겠습니다. 우리가 굼금한 것은 X+Y의 분포입니다. X+Y의 분포는 특성함수를 이용해서 유도할 것입니다. 확률변수 X와 Y의 특성함수를 먼저 구해보면 아래와 같습니다. $\varphi_{X}(t)=E\left [ e^{itX} \right ]=e^{it\mu_{X}-\frac{\sigma_{X}^2t^2}{2}}$ $\varphi_{Y}(t)=E\left [ e^{itY} \right ].. 2023. 1. 14.
이산 vs 연속확률변수 (3) 확률 밀도가 등장한 맥락 연속확률변수는 실수 구간에서 정의된 확률변수입니다. 아래 구간에서 임의로 하나의 실수 값을 출력해주는 기계를 만들었다고 합시다. $0 \leq X \leq 3$ 각 숫자가 나올 확률은 동일하다고 합시다. 이때 숫자들이 각각 발생할 확률을 갖는다면 확률 전체의 합이 1이 될 수 없습니다. 확률 전체의 합이 무한대가 됩니다. 따라서 각 숫자들은 확률을 가질 수 없습니다. 대신 범위는 확률을 가질 수 있습니다. 예를들어 $0 \leq X \leq 1$ 은 전체 영역의 1/3이므로, 발생 확률이 1/3입니다. 기호로 나타내면 아래와 같습니다. $P[0 \leq X \leq 1]=\frac{1}{3}$ 이때 누적적분포함수는 아래와 같이 구할 수 있습니다. $P[0 \leq X \leq x]=\frac{1}{3}x.. 2022. 10. 14.
[통계 기호의 이해] 1. P[X=x] 의 의미, 왜 대문자 소문자를 쓰나 통계와 관련된 책이나 자료들을 보면 P[X=x] 라는 기호를 많이 보게됩니다. 대문자 X와 소문자 x가 둘다 포함되어 있어서 헷갈려하시는 경우가 있어서 이 기호에 대해 설명하려고 합니다. X라는 확률변수가 있다고 합시다. 이 확률변수의 발생확률 아래와 같이 나타내 봅시다. $P[X]$ X가 3일 확률을 나타내봅시다. $P[3]$ 이렇게만 놓고 보면, 어떤 확률변수가 3일 확률인지를 알 수가 없습니다. 아래와 같이 표현하는 것이 더 알아보기 편합니다. $P[X=3]$ 위 식에서 X는 확률변수를 나타내구요. 3은 발생한 값을 나타냅니다. X의 확률함수를 $p(x)$라고 놓는다면 아래와 같이 나타낼 수 있습니다. $P[X=3]=p(3)$ 좌변의 P는 확률이라는 뜻이구요. 우변의 p는 함수의 이름입니다. 헷갈리.. 2022. 9. 9.
[통계 Q&A] 평균과 기댓값이 헷갈립니다. Question) 평균을 구할 때 어떨 땐 총량으로 나누는 방식으로 하고, 어떨땐 확률이랑 변수를 곱하는데. 두개가 같은건지. xp(x)는 왜 평균을 의미하는지 궁금합니다. Answer) 평균은 원소의 전체합 나누기 원소의 개수로 정의되고 이건 받아들이기 쉬울겁니다. 문제는 기댓값인데요. 확률변수의 기댓값이라는게 등장하고 나서 이해하기가 어려워집니다. 우리가 흔히 알고 있는 산술평균에서 확률변수의 기댓값으로 개념이 확장되어야 합니다. 기댓값을 이해하고 나서 평균과 연결하시면 됩니다. 평균도 기댓값으로 해석할 수 있습니다. 기댓값 확률변수는 값과 확률을 모두 갖습니다. 예를 들어봅시다. 동전을 한개 던지는 실험에서 앞면이 나오면 500원, 뒷면이 나오면 1000원을 받는다고 합시다. 동전 한번 던진 결과로.. 2021. 3. 30.
[수리통계학] #24. 확률변수의 정의 확률변수는 영어로 random variable 입니다. 사실 random variable 이라는 단어에는 '확률'이 이라는 말이 없습니다. 확률변수의 교과서적인 정의를 먼저 이야기하고 나서 예시를 통해 설명을 하겠습니다. 정의 (Definition) 확률변수는 표본공간(S)에서 실수로 정의된 함수이다. $X:S\rightarrow \mathbb{R}$ 표본공간의 원소 c에 대하여 실수값 X(c)를 대응시킨다. 실험을 했고 사건이 발생했습니다. 각 사건을 어떤 '실수 값'에 대응시키는 함수가 확률변수입니다. 예시를 통해 확률변수를 이해해봅시다. 확률변수를 정의할 때는 실험이 먼저 정의되어야 합니다. 실험을 정하고, 확률변수를 정의하면 됩니다. 예제1) 동전을 세번 던질 때, 앞면이 나온 수 실험 : 동전 .. 2021. 3. 2.
확률을 해석하는 두가지 관점 (빈도주의 vs 베이지안) 사건 A가 발생할 확률을 P(A)라고 할 때, P(A)를 해석하는 두가지 관점이 있습니다. 1. 확률을 "빈도"로 해석 (빈도주의) 시행을 반복했을 때, A가 참인 경우의 장기적인 비율. 쉽게 말하면 시행을 무한히 반복한다고 가정했을 때 A가 나온 비율의 수렴값. 더 쉽게 말하면 동전을 무한히 던졌을 때 앞면이 나온 비율. 2. 확률을 "믿음의 정도"로 해석 (베이지안) P(A)는 A가 참일것이라는 관찰자의 믿음의 정도. 쉽게 말하면 시행에서 A가 나올 것이라 믿는 믿음의 정도. 더 쉽게 말하면 동전을 던질 때 앞면이 나올 것이라는 확신이 어느정도 있는가를 수치화 시킨 것. 두 관점은 추론에 대한 두 학파를 만들어냄. 빈도주의 학파(frequentist school)와 베이지안 학파(bayesian sc.. 2020. 12. 28.
[조건부확률의 이해] Law of iterated expection (조건부 평균의 평균에 관한 법칙) 조건부 평균의 성질 중 아래 성질을 유도해봅시다. E(E(X|Y))=E(X) Law of Iterated Expectations 라고 부릅니다. X와 Y는 확률변수입니다. 두 확률변수가 독립인 경우와 종속인 경우로 나눠서 이해해봅시다. 예시를 통해 이해해하고 일반화합시다. 1) 두 확률변수가 독립 X는 주사위를 던졌을 때 눈의 수를 변수로 하는 확률변수라고 합시다. Y는 동전을 던졌을 때, 앞면을 0, 뒷면을 1로 하는 확률변수라고 합시다. 먼저 E(X|Y) 를 구해봅시다. 하나의 값으로 나오지 않고, 이 평균 자체가 변수입니다. 왜냐하면 Y가 0일 때와 Y가 1일 때로 나눠지기 때문입니다. Y가 0이 나와도, 주사위 눈금에 영향을 주지 않기 때문에 E(X)와 같습니다. E(X|Y=0)=E(X) Y가 1.. 2020. 10. 12.
[조건부확률의 이해] 3. 조건부평균 맛보기 제목을 조건부평균 맛보기라고 붙인 이유는 이번 시간에 조건부평균을 유도할 것이 아니기 때문입니다. 조건부평균 유도를 시도하며, 개념을 확장할 필요성에 대해 이야기해볼 것입니다. 시난시간에 배운 첫번째 예제로 갑시다. 사건 X : 주사위를 던져서 3의 눈이 나옴 사건 Y : 주사위를 던져서 홀수의 눈이 나옴 위 예제에서 E(X|Y) 는 어떻게 구할까요?? 5분정도 시도해보시기 바랍니다. 저는 막막했습니다. 조건부확률도 이해했고, 기댓값도 이해했는데 여전히 막막했습니다. 그 이유를 밝혀봅시다. 먼저 E(X)를 이용하여 기댓값이 어떻게 구해지는지 리뷰해봅시다. X는 확률변수이고, 1,2,3을 갖는다고 합시다. 각각의 확률은 1/3로 놓겠습니다. 기대값은 아래와 같이 구합니다. E(X)=1x(1/3)+2x(1/.. 2020. 10. 8.
[조건부확률의 이해] 2. 조건부확률이 무엇인가? 조건부확률은 하나의 사건이 이미 발생한 상황에서, 다른 사건이 발생할 확률입니다. 문자를 이용해 표현하면 사건 Y가 발생한 상황에서, 사건 X가 발생할 확률입니다. 수식으로 표현하면 아래와 같습니다. P(X|Y) : Y라는 사건이 발생했을 때, X라는 사건이 발생할 확률 예를들어 봅시다. 1) 주사위 예시 사건 X : 주사위를 던져서 3의 눈이 나옴 사건 Y : 주사위를 던져서 홀수의 눈이 나옴 P(X|Y)는 아래와 같이 정의됩니다. P(X|Y) = 홀수의 눈이 나온 것 까진 아는 상황, 이때 3의 눈이 나올 확률. 홀수의 눈 1,3,5 중에서 3이 나올 확률이므로, 1/3입니다. 사건 X와 Y의 교집합의 원소수를 사건 Y의 원소수로 나눠준 값과 동일합니다. 2) 성별과 직업 예시 방안에 남자 10명, .. 2020. 10. 7.
[조건부확률의 이해] 1. 조건부확률, 무엇을 공부할 것인가? 조건부 확률에 대해 공부하는 강의입니다. 주된 내용은 조건부 평균과 관련된 공식을 유도하는 것입니다. 제가 찾은 공식들은 아래와 같습니다. 이외 다른공식이 있다면, 알려주시면 추가하겠습니다. (1) E[a|Y ] = a (2) E[c(X)|X]=c(X) for any function c(X) (2) E[a(X)Y+b(X)|X]=a(X)E(Y|X)+b(X) (3) E(X|Y)=E(X) if X and Y are independent (4) E[E[X|Y ]] = E[X] (5) E(Y|X)=E[E(Y|X,Z)|X] (6) If E(Y|X)=E(Y) , Cov(X,Y)=0 (7) E[aX + bZ|Y ] = aE[X|Y ] + bE[Z|Y ] (8) E[X|Y ] ≥ 0 if X ≥ 0. (9) E[Xg(Y.. 2020. 10. 7.
[손으로 푸는 확률분포] 음이항분포 (2) 예시 2) 예시 어떤 농구선수의 자유투 성공률이 30%라고 해봅시다. 이 농구선수가 3번의 실패가 나오기까지 발생한 성공이 x번인 확률이 음이항분포입니다. x가 0일 때부터 구해봅시다. 성공 없이 실패만 세번 하면 됩니다. x가 1일 때는 어떨까요. 실패를 3번 할 동안 성공이 1번 나오면 됩니다. 마지막에 실패로 끝나는 것이므로 아래와 같은 경우들이 가능합니다. 실패/실패/성공/실패 실패/성공/실패/실패 성공/실패/실패/실패 위와 같은 경우가 발생할 확률을 구해봅시다. 이번에는 x가 2일 때 발생 가능한 경우를 구해봅시다. 실패/실패/성공/성공/실패 실패/성공/실패/성공/실패 .... 경우가 많아서 세기가 귀찮습니다. 규칙을 찾아야 합니다. 마지막에는 실패로 끝나야 하니까. 실패횟수에서 하나를 빼놓습니다. .. 2019. 7. 5.
반응형