본문 바로가기
반응형

@Q&A12

[통계 Q&A] 푸아송분포 문제1 (식당 손님 문제) Q) 어느 식당에 손님이 한시간에 평균 4명이 옵니다. 3시간 동안 10명 이상이 올 확률은 얼마인가요? A) 푸아송분포의 수식은 아래와 같습니다. $p(x)=\frac{\lambda^{x}e^{-\lambda}}{x!}$ 람다($\lambda$)는 단위시간당 평균발생횟수 입니다. 위 문제에서 단위시간을 1시간으로 놓으면 람다는 4입니다. 단위시간을 3시간으로 놓으면 람다는 12입니다. 단위시간을 3시간으로 놓고 푸아송분포를 구하면 아래와 같습니다. $p(x)=\frac{12^x e^{-12}}{x!}$ 10명 이상이 올 확률은 아래와 같습니다. $P[X \geq 10]=p(10)+p(11)+p(12)+\cdots$ 무한히 많은 항을 계산해야 합니다. 여사건의 확률을 이용합시다. 아래와 같습니다. $P[.. 2023. 4. 10.
[통계 Q&A] 통계 개념질문 5개 Q) 통계 개념질문 답해주세요 A) 1. 양측검정의 유의확률은 단측검정 보다 2배 크다. 맞습니다. 양측검정의 유의확률은 0.025와 비교해야하기 때문에, 0.05를 기준으로 하면 두배 커져야 합니다. 따라서 단측검정의 유의확률보다 두배 커집니다. 자세한 설명은 아래 글 참고하세요. https://hsm-edu.tistory.com/850 2. 유의확률이 1종 오류보다 작아야 연구가설을 받아들일 수 있다. 맞습니다. 1종오류는 유의수준인 0.05입니다. 유의확률이 1종오류보다 작아야 귀무가설이 기각되고 대립가설이 채택됩니다. 3. T검정은 2개 독립변수 평균 차이를 검정하는 것이다. 틀렸습니다. t검정에는 '독립표본 t검정'과 '대응표본 t검정'이 있습니다. 이 중 독립표본 t검정이 두 독립변수 평균차이.. 2022. 12. 10.
[통계 Q&A] 표본을 하나만 뽑았는데 어떻게 분포를 가정할 수 있나요? (중심극한정리) Q) 표본을 하나만 뽑았는데 어떻게 분포를 가정할 수 있나요? A) 표본을 뽑지 않아도 분포는 가정할 수 있습니다. 정말 자주 받는 질문입니다. 많은 분들이 헷갈려 하시는 내용이고 왜 헷갈려하시는지 이해가 됩니다. 헷갈리는 상황을 먼저 설명하겠습니다. 모집단의 평균이 $\mu$라고 알려져 있는데요. 사실인지 확인하기 위해 표본을 뽑아 통계검정을 하려고 합니다. 크기가 n인 표본을 뽑았구요. 표본의 평균은 $\bar{X}_{1}$, 분산은 $s^2$입니다. 이때 표본의 크기 n이 충분히 크면 중심극한정리를 적용할 수 있습니다. 표본의 크기 n이 충분히 크면 표본평균의 분포가 아래 분포를 따른다는 것이 중심극한정리입니다. $\bar{X} \sim N\left (\mu,\frac{\sigma^2}{n} \ri.. 2022. 9. 7.
[통계 Q&A] 다항분포 문제를 비복원추출로 풀어주세요 Q) 다항분포 문제를 비복원추출로 풀어주세요 A) 질문자님께서 말씀하신 다항분포 문제는 아래와 같습니다. 상자가 있습니다. 상자 안에는 100개의 공이 들어있는데요. 빨간공이 20개, 파란공이 30개, 노란공이 50개 들어있습니다. 이 상자에서 복원추출로 공을 10번 뽑을 때, 빨간공이 5개, 파란공이 2개, 노란공이 3개 나올 확률을 구해봅시다. 복원추출로 풀면 정답은 아래와 같습니다. $P\left( x,y,z; \ n ; \ 0.2,0.3,0.5 \right)=\frac{n!}{x!y!z!}0.2^x 0.3^y 0.5^z$ $P\left( 5,2,3; \ n ; \ 0.2,0.3,0.5 \right)=\frac{10!}{5!2!3!}0.2^5 0.3^2 0.5^3$ 비복원추출인 경우를 계산해봅시다... 2022. 8. 22.
[통계 Q&A] 유의 수준이 5%일때, 양측검정이면 유의수준이 2.5% 인가요? Q) 유의 수준이 5%일때, 양측검정이면 유의수준이 2.5% 인가요? A) 아닙니다. 양측검정이어도 유의수준은 5% 입니다. 모집단에서 표본을 하나 뽑는 상황을 가정합시다. 모집단의 평균은 $\mu$이고 분산은 $\sigma^2$ 입니다. 크기가 50인 표본을 하나 뽑았습니다. 방금 뽑은 표본의 평균을 $\bar{X}_{1}$이라고 놓겠습니다. 표본의 크기가 50인 표본들은 아래 분포를 따릅니다 . $\bar{X} \sim N \left ( \mu, \frac{\sigma^2}{50} \right )$ 표본을 뽑지 않아도 알 수 있는 사실입니다. 수학적으로 유도되었고 이를 중심극한정리라고 부릅니다. 표본평균 $\bar{X}_{1}$ 은 이 분포 위의 한 점입니다. 그림으로 나타내면 아래와 같습니다. 모집.. 2022. 8. 21.
[통계 Q&A] 표본표준편차와 표본평균의 표준편차는 다른것인가? Q) 표본표준편차와 표본평균의 표준편차는 다른것인가? A) 네 다릅니다. 모집단에서 표본을 뽑는 상황을 가정해봅시다. 평균이 $\mu$이고 분산이 $\sigma^2$인 모집단에서 표본을 뽑았습니다. 이 표본을 표본 1이라고 합시다. 표본의 원소는 (1,2,3) 이 뽑혔습니다. 그림으로 나타내면 아래와 같습니다. 표본표준편차 표본1의 평균을 구해보면 아래와 같습니다. $E[X_{1}]=\frac{1+2+3}{3}=2$ 표본1의 분산은 아래와 같이 구합니다. 분산은 표본 원소의 제곱의 평균 빼기 평균의 제곱을 계산하면 됩니다. $V[X_{1}]=\frac{1+4+9}{3}-2^2=\frac{2}{3}$ 표본1의 표준편차는 분산에 루트를 씌워서 구하면 됩니다. $\sigma[X_{1}]=\sqrt{\frac{.. 2022. 8. 21.
[통계 Q&A] 적률생성함수 만들때 어떻게 X만 대체해도 되나요? Q) 적률생성함수 만들때 어떻게 X만 대체해도 되나요? 질문을 이해하기 위해 약간의 배경설명을 하겠습니다. 확률변수 X의 평균은 아래와 같이 구합니다. $E\left [ X \right ]=\int_{-\infty}^{\infty}x f(x) dx$ 적률생성함수는 X자리에 $e^{tX}$ 를 넣어서 구합니다. $E\left [ e^{tX} \right ]=\int_{-\infty}^{\infty}e^{tx} f(x) dx$ 이때 왜 우변의 x 하나만 $e^{tX}$ 로 교체할 수 있냐는 질문입니다. f(x)안에도 x가 있고, dx에도 x가 있으니 다 교체해야하는 것 아닌가라는 의문이 드신 것 같아요. A) E[ ] 는 함수가 아닙니다. 그냥 기호입니다. '대괄호 안에 있는 확률변수의 기댓값' 이라고 매번.. 2022. 5. 4.
[통계 Q&A] 상관계수 구하기 Q) 아래 데이터의 피어슨상관계수를 구해주세요. A) 표본의 상관계수는 아래 식을 이용하여 구하면 됩니다. $$r_{xy}=\frac{\sum_{i=1}^{n}\left ( x_{i}-\bar{x} \right )\left ( y_{i}-\bar{y} \right )} {\sqrt{\sum_{i=1}^{n}\left ( x_{i}-\bar{x} \right )^{2}}\sqrt{\sum_{i=1}^{n}\left ( y_{i}-\bar{y} \right )^{2}}}$$ $\bar{x}$는 x의 평균, $\bar{y}$ 는 y의 평균입니다. $\bar{x}=\frac{7+3+5+7+2+1+5+4+4}{9}=4.2$ $\bar{y}=\frac{11+14+13+26+8+3+6+12+11}{9}=11.6$ 피.. 2021. 11. 1.
[통계 Q&A] 푸아송분포 문제 Q) 한시간 동안 평균 60마리 고양이 마주침. 1분동안 2마리의 고양이를 마주칠 확률? 1분동안 3마리 이하의 고양이를 마주칠 확률? A) 먼저 푸아송분포의 분포함수는 아래와 같습니다. $f(x)=\frac{\lambda^{x}e^{-\lambda}}{x!}$ 람다($\lambda$)는 단위시간당 평균발생횟수 입니다. 한시간에 평균 60마리를 마주치므로, 1분에는 평균 1마리를 마주칩니다. 따라서 푸아송분포는 아래와 같습니다. $f(x)=\frac{e^{-1}}{x!}$ 이때 x는 1분동안 고양이를 마주치는 횟수입니다. 1분동안 2마리의 고양이를 마주칠 확률? x에 2를 넣으면 됩니다. 1분동안 3마리 이하의 고양이를 마주칠 확률? x 에 0,1,2,3 을 각각 넣고 더해주시면됩니다. 2021. 11. 1.
[통계 Q&A] 지수분포 문제 Q) 대기시간이 5분인 지수분포에서 10번 방문했을 때, 대기시간이 4분 이내가 8회 이상일 확률은? A) 대기시간이 5분이라는 것은, 1분에 사건이 평균 0.2회 발생하는 것을 의미합니다. 따라서 지수분포는 아래와 같습니다. $f(t)=0.2e^{-0.2t}$ 방문 시 대기시간이 4분 이내일 확률은 아래와 같이 구합니다. $P\left ( 0\leq t\leq 4 \right )=\int_{0}^{4}0.2e^{-0.2t}=\left [ -e^{-0.2t} \right ]_{0}^{4}=1-e^{-0.8}$ 10번 방문 중 대기시간 4분 이내가 8회 이상 발생할 확률은 아래와 같이 구합니다. 10번 방문 중 8회 발생 : $\binom{10}{8}\left [ 1-e^{-0.8} \right ]^{8}.. 2021. 10. 30.
[통계 Q&A] 표본추출 문제 대표유형 풀이 Question) 어떤 전구 생산 공장에서 생산되는 전구의 수명은 평균 1000시간, 표준편차 60시간으로 알려져 있다. 이 공장에서 36개의 전구를 추출해 시험했을 때 평균 수명이 975시간 미만일 확률을 구하시오. Answer) 전구 전체를 모집단으로 놓겠습니다. 모집단의 평균이 1000, 표준편차가 60으로 알려져 있다고 합니다. 자 여기서, 표본을 뽑지 않아도 알 수 있는 것이 있습니다. 세가지입니다. 1) 표본평균의 평균은 모평균이다. 2) 표본평균의 분산은 모분산/n이다. 3) n이 충분히 크다면 표본평균의 분포는 정규분포를 따른다. (중심극한정리인데 모르시는 분들은 손으로 푸는 통계 9강~14강을 들으시면 됩니다. ) n이 충분히 크다고 가정하면 표본평균의 분포는 아래와 같습니다. $\bar.. 2021. 3. 30.
[통계 Q&A] 평균과 기댓값이 헷갈립니다. Question) 평균을 구할 때 어떨 땐 총량으로 나누는 방식으로 하고, 어떨땐 확률이랑 변수를 곱하는데. 두개가 같은건지. xp(x)는 왜 평균을 의미하는지 궁금합니다. Answer) 평균은 원소의 전체합 나누기 원소의 개수로 정의되고 이건 받아들이기 쉬울겁니다. 문제는 기댓값인데요. 확률변수의 기댓값이라는게 등장하고 나서 이해하기가 어려워집니다. 우리가 흔히 알고 있는 산술평균에서 확률변수의 기댓값으로 개념이 확장되어야 합니다. 기댓값을 이해하고 나서 평균과 연결하시면 됩니다. 평균도 기댓값으로 해석할 수 있습니다. 기댓값 확률변수는 값과 확률을 모두 갖습니다. 예를 들어봅시다. 동전을 한개 던지는 실험에서 앞면이 나오면 500원, 뒷면이 나오면 1000원을 받는다고 합시다. 동전 한번 던진 결과로.. 2021. 3. 30.
반응형