반응형 전체 글648 [수리통계학] #40. 이변량 확률분포 (결합확률분포) 우리는 24강에서 확률변수가 무엇인지 배웠습니다. 확률변수는 표본공간의 원소를 실수에 대응시키는 함수입니다. 26~27강에서는 확률분포함수를 배웠습니다. 확률분포는 확률변수를 확률에 대응시키는 함수입니다. 오늘은 이변량 확률분포를 배울 것인데요. 이변량 확률분포는 확률변수의 쌍을 확률에 대응시키는 함수입니다. 예를 들어봅시다. 주사위를 두개 던지는 시행에서 표본공간은 아래와 같습니다. S=HH,HT,TH,TTS=HH,HT,TH,TT 두 확률변수 X1X1과 X2X2 를 아래와 같이 정의합시다. X1X1 : 앞면이 나온 횟수 X2X2 : 뒷면이 나온 횟수 순서쌍 (X1,X2)(X1,X2) 의 집합을 D라고 한다면, D는 아래와 같습니다. $D=\left \{ (2,1),(1,1),(0,2) \righ.. 2023. 2. 13. [확률과통계 기초] 2-5. 확률의 곱셈정리 직관적으로 이해하기 확률의 곱셈정리가 아래 두가지 수식이라는 것을 지난시간에 배웠습니다. P(A∩B)=P(A)P(B|A)P(A∩B)=P(A)P(B|A) P(A∩B)=P(B)P(A|B)P(A∩B)=P(B)P(A|B) 수학적으로는 유도했지만 와닿지 않을 수도 있어서 직관적으로도 이해하려고 합니다. 어떤 학교에 학생이 100명이라고 합시다. 전체 학생은 남,녀로 분류할 수 있고 다시 문,이과로 분류할 수 있습니다. 벤다이어그램으로 나타내면 아래와 같습니다. 이 학교에서 학생 한명을 뽑을 때, 남학생이면서 이과일 확률은 아래와 같이 나타낼 수 있습니다. P(이과 ∩ 남) 이과이면서 남학생일 확률은 남학생을 뽑고, 그 남학생들 중에서 이과를 뽑을 확률과 같습니다. 아래와 같습니다. P(이과 ∩ 남) = P(남) X P(이과 | 남) 위 식이 확률의 곱셈정리입니다. 다.. 2023. 1. 20. [확률과통계 기초] 2-4. 확률의 곱셈정리 확률의 곱셈정리는 사건 A 와 B가 동시에 일어날 확률에 대한 정리입니다. 사건은 집합이었죠? 두 사건이 동시에 일어난다는 것이 무슨 의미일까요? 사건 A와 B를 벤다이어그램으로 표현해봅시다. 두 사건이 동시에 일어난다는 것은 위 벤다이어그램의 교집합이 발생한다는 것입니다. 따라서 사건 A 와 B가 동시에 일어날 확률은 아래와 같이 표현됩니다. P(A∩B)P(A∩B) 위 식은 조건부 확률을 이용해서 다른 두 확률의 곱으로 나타낼 수 있는데요. 위 식을 조건부확률을 이용해서 다른 두 확률의 곱으로 나타내는 것이 확률의 곱셈정리입니다. 아래와 같은 두가지 방법이 있습니다. 1) 사건 B가 발생했을 때 A가 발생할 확률를 이용 P(A|B)=P(A∩B)P(B)P(A|B)=P(A∩B)P(B) 위 식을 $P(A \.. 2023. 1. 20. 카이제곱분포 글 하나로 끝내버리기 1. 어디에 사용되나? 1) 카이제곱분포는 t분포 유도에 사용됩니다. t분포 유도에는 확률변수 ns2σ2ns2σ2 가 사용되는데, 이 확률변수가 n자유도 카이제곱분포를 따르기 때문입니다. s2s2은 표본분산, σ2σ2은 모분산입니다. 2) 카이제곱검정에 사용됩니다. 2. 어떻게 생겼나요? 카이제곱분포도 t분포처럼 '자유도'에 따라 모양이 결정됩니다. t분포에서 자유도는 표본크기에서 1을 뺀 값이었는데요. 카이제곱분포 자유도의 의미는 뒤에서 설명하겠습니다. k자유도 카이제곱분포 함수는 아래와 같습니다. $f(x)=\frac{1}{2^{\frac{k}{2}}\Gamma\left ( \frac{k}{2} \right ) }x^{\frac{k}{2}-1}e^{-\frac{x}.. 2023. 1. 14. 모집단이 정규분포를 따르면 표본평균은 항상 정규분포를 따를까? 모집단이 정규분포를 따른다면 표본평균은 항상 정규분포를 따르는지 알아봅시다. 결과부터 말씀드리면 'yes' 입니다. 1. 모집단의 확률변수 정규분포를 따르는 모집단의 원소를 확률변수 X라고 놓겠습니다. 이해되시는 분들은 2번으로 넘어가시면 됩니다. 모집단의 원소를 확률변수로 놓는 것에 익숙하지 않은 분들을 위해 간단한 예시로 설명하겠습니다. 아래와 같은 숫자 카드 5장으로 모집단을 만들어봅시다. 1,2,3,3,3 모집단의 원소를 변수 X로 놓을 수 있습니다. X는 1,2,3 이 될 수 있습니다. 이때 각 값에는 확률이 부여되어 있습니다. 각 확률은 아래와 같습니다. P[X=1]=1/5 P[X=2]=2/5 P[X=3]=3/5 따라서 모집단의 원소를 확률변수 X로 놓을 수 있습니다. 2. 정규분포를 따르는 .. 2023. 1. 14. 정규분포를 따르는 확률변수의 합의 분포 정규분포를 따르는 확률변수 X와 Y가 있다고 합시다. 각 확률변수의 분포는 아래와 같이 나타낼 수 있습니다. X∼N(μX,σ2X)X∼N(μX,σX2) Y∼N(μY,σ2Y)Y∼N(μY,σY2) 두 확률변수 X와 Y가 서로 독립이라고 가정하겠습니다. 우리가 굼금한 것은 X+Y의 분포입니다. X+Y의 분포는 특성함수를 이용해서 유도할 것입니다. 확률변수 X와 Y의 특성함수를 먼저 구해보면 아래와 같습니다. φX(t)=E[eitX]=eitμX−σ2Xt22φX(t)=E[eitX]=eitμX−σX2t22 $\varphi_{Y}(t)=E\left [ e^{itY} \right ].. 2023. 1. 14. t분포 글 하나로 끝내버리기 1. 어디에 사용되나요? t분표는 t검정에 사용됩니다. t검정이 분산분석의 사후분석, 상관분석, 회귀분석 과정에도 사용되기 때문에 t분포가 이러한 검정에서 사용된다고 할 수 있습니다. 2. 어떻게 생겼나요? t분포 함수의 수식은 아래와 같습니다. f(t)=Γ(ν+12)√νπ Γ(ν2)(1+t2ν)−(ν+12)f(t)=Γ(ν+12)νπ Γ(ν2)(1+t2ν)−(ν+12) t분포의 모양을 결정하는 파라미터는 νν 하나밖에 없습니다. νν는 자유도입니다. 표본 크기가 n 인 경우 자유도 νν는 n-1입니.. 2023. 1. 14. 대응표본 t검정 글 하나로 끝내버리기 1. 언제 쓰는 건가요? (수정해야됨) 대응표본 t검정은 서로 대응인 두 집단의 평균을 비교할 때 사용됩니다. 두 집단이라고 표현했지만 사실 같은 대상입니다. 대응표본 t검정은 동일한 집단을 대상으로 전/후 비교를 할 때 사용됩니다. 예를 들어 30명을 모집해서 다이어트약을 먹기 전과 후 몸무게를 비교할 때 사용합니다. 대응표본 t검정을 어떻게 수행하는지 먼저 간단히 이해해봅시다. 처리 전과 후 집단의 차를 구합니다. 예를들면 아래와 같습니다. 다이어트 약을 먹기 전과 후의 몸무게 데이터입니다. 이 차이를 가지고 1표본 t검정을 수행합니다. 이 차이가 0인지 아닌지를 알아보는 것이 목적입니다. 이 차이들이 평균이 0인 모집단에서 뽑힌 표본이라고 가정하고 일표본 t검정을 수행하는 것입니다. 2. 독립변수와.. 2023. 1. 13. 독립표본 t검정 글 하나로 끝내버리기 1. 언제 쓰는 건가요? 독립표본 t검정은 서로 독립인 두 집단의 평균을 비교할 때 사용합니다. 예를 들면 서울 시민 남자의 키와 여자의 키 비교가 있습니다. 2. 독립변수와 종속변수 독립변수와 종속변수 관점으로도 생각해봅시다. 서울 시민의 남녀 키 비교에서 독립변수는 성별입니다. 성별이 달라졌을 때 키가 달라지는지 알고 싶은 것이기 때문입니다. 따라서 독립변수는 '범주형 자료'입니다. 종속변수는 키 이므로 종속변수는 '수치형 자료'입니다. t검정에서의 독립변수와 종속변수는 아래와 같습니다. 독립변수 : 범주형 종속변수 : 수치형 2. 조건 1) 두 집단이 서로 독립이어야 합니다. 2) 모집단이 정규분포를 따라야 합니다. 정규성검정을 통해서 확인합니다. 만약 정규성을 만족하지 않는 경우 비모수 검정인 윌.. 2023. 1. 13. 일표본 t검정 글 하나로 끝내버리기 1. 언제 쓰는 건가요? 일표본 t검정은 모집단의 평균이 알려져 있는 상황에서, 정말 그 사실이 맞는지 확인할 때 사용합니다. 예를 들어 어떤 과자 포장지에 내용물 무게가 30g이라고 나와있다고 합시다. 30g이 정말 맞는지 확인하고 싶은 경우 표본을 뽑아 일표본 t검정을 합니다. 여기서 표본을 뽑는다는건 과자 50봉지 정도를 구입한다는 의미입니다. 2. 조건 1) 데이터는 연속형 자료여야 합니다. t검정은 t분포를 사용하는데, t분포는 모집단이 정규분포를 따른다는 것을 전제로 유도된 분포입니다. 정규분포는 연속형 변수에서 유도된 분포이기 때문에 모집단이 연속형 데이터인 경우에만 t검정을 사용할 있는 것이 원칙적으로는 맞습니다. 2) 모집단이 정규분포를 따라야 합니다. 이유는 1번에서 설명했습니다. 3... 2023. 1. 13. 평균이 좋은 대푯값이 아닌 경우 대푯값에는 평균, 중앙값, 최빈값이 있습니다. 가장 많이 쓰는 대푯값은 평균입니다. 더 정확히 말하면 '산술 평균'인데요. 평균이 항상 가장 좋은 대푯값인 것은 아닙니다. 오늘은 평균을 대푯값으로 사용하는 것이 적절하지 않은 경우들을 알아봅시다. 1. 극단값이 있는 경우 어느 회사의 평균 연봉이 1억2400만원이라고 합시다. 삼성전자의 평균연봉과 맞먹을 만큼 높습니다. 정말 좋은 회사인 것 같죠? 실상은 아래와 같습니다. 직원이 다섯명이고 연봉은 아래와 같다고 합니다. 3000만원 3000만원 3000만원 3000만원 50000만원 평균값인 1억2400 만원과 비슷한 직원은 한 명도 없습니다. 이런 경우는 평균값보다 최빈값이나 중앙값이 더 집단을 잘 대표할 것입니다. 2. 양쪽으로 치우친 경우 (쌍봉형).. 2023. 1. 12. 표본의 크기 결정 방법 수식 설명 및 유도 1. 설명 표본의 크기를 결정하는 수식은 아래와 같습니다. \frac{Z^2\sigma^2}{e^2} Z는 신뢰수준에 따라 결정되는 값입니다. 신뢰수준이 95%라면 1.96, 99%라면 2.58이 됩니다. e는 허용오차입니다. σσ 는 모표준편차입니다. 허용 오차는 상황에 맞게 각자 정해야합니다. 나는 오차를 얼마까지 허용할 것이라고 결정하고, 표본 크기를 정하는 것입니다. 2. 유도 허용오차를 고렿나 표본 크기는 모평균을 추정하는 신뢰구간 수식에서 유도할 수 있습니다. 95% 신뢰구간을 이용하여 유도해보겠습니다. 95% 신뢰구간은 아래와 같습니다. $\bar{X}-1.96\frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{X}+1.96\frac{\sigma}{\sqr.. 2023. 1. 11. [확률과통계 기초] 2-3. 조건부 확률 설명 및 공식유도 어떤 시행의 표본공간이 S 라고 합시다. 표본공간의 부분집합인 사건 A와 B가 있다고 합시다. 이때 조건부 확률은 아래와 같습니다. '사건 B가 발생했을 때 A가 발생할 확률' 수식으로는 아래와 같이 나타냅니다. P(A|B)P(A|B) 조건부 확률이 어떻게 계산되는지 알아봅시다. 표본공간과 사건 모두 집합이므로 벤다이어그램으로 나타낼 수 있습니다. 사건 B가 이미 발생한 상황이므로, 표본공간은 B가 됩니다. 이때 A가 발생하는 사건은 아래 그림의 노란색 부분입니다. B가 발생했을 때 A가 발생할 확률을 구해보면 아래와 같습니다. P(A|B)=n(A∩B)n(B)P(A|B)=n(A∩B)n(B) 우변을 각각 확률로 변형해봅시다. 우변의 분자와 분모를 n(S) 로 나눠줍니다. $P(A|B)=\frac{\fra.. 2023. 1. 10. [확률과통계 기초] 2-2. 확률의 덧셈정리 확률의 덧셈정리는 사건 A 또는 B가 발생할 확률에 대한 정리입니다. 사건 A 가 일어날 확률이 P(A)P(A) 이고, 사건 B가 일어날 확률이 P(B)P(B)라고 두겠습니다. 사건 A 또는 B를 먼저 기호로 나타내봅시다. 사건은 뭐죠? 사건은 '집합'입니다. 집합에서 '또는' 영어로 or 은 합집합입니다. 사건 A또는 B를 기호로 나타내면 아래와 같습니다. A∪BA∪B A 또는 B가 발생할 확률은 아래와 같이 나타냅니다. P(A∪B)P(A∪B) 위 식을 변형하면 확률의 덧셈정리가 유도되는데요. 한 번 유도해봅시다. 표본공간을 S라고 놓으면 P(A∪B)P(A∪B)는 아래와 같이 나타낼 수 있습니다. 지난 시간에 배운 확률의 정의입니다. P(A∪B)=n(A∪B)n(S)P(A∪B)=n(A∪B)n(S).. 2023. 1. 8. [확률과통계 기초] 2-1. 사건이 발생할 확률 확률에 대해서는 다들 어느정도 익숙한 상태일 것입니다. 문제를 하나 풀어봅시다. 주사위를 하나 던져서 홀수의 눈이 나올 확률이 얼마인가요? 네 1/2 입니다. 1/2은 어떻게 나온 값일까요? 주사위를 하나 던질 때 나올 수 있는 눈의 수가 6가지 이고, 홀수의 눈의 수는 3가지니까 3을 6으로 나눈 값이 확률이 됩니다. (홀수의 눈이 나오는 경우의 수) / (전체 경우의 수) 위 확률을 한번 일반화시켜봅시다. 주사위라는 예시 없이 확률을 설명하려는 것입니다. 어떤 개념을 일반화 시켜 놓으면 의사소통에서의 오해도 줄어들고, 응용과 확장도 편해집니다. 확률을 일반화 시켜서 설명하려면 용어들을 정의할 필요가 있습니다. 예를 들면 '주사위를 던진다는 것'을 일반화 해서 부를 용어가 필요하겠죠? 또는 홀수의 눈이.. 2023. 1. 8. 이전 1 2 3 4 5 6 7 8 ··· 44 다음 반응형