본문 바로가기
반응형

@Q&A/통계 Q&A8

[통계 Q&A] 푸아송분포 문제1 (식당 손님 문제) Q) 어느 식당에 손님이 한시간에 평균 4명이 옵니다. 3시간 동안 10명 이상이 올 확률은 얼마인가요? A) 푸아송분포의 수식은 아래와 같습니다. $p(x)=\frac{\lambda^{x}e^{-\lambda}}{x!}$ 람다($\lambda$)는 단위시간당 평균발생횟수 입니다. 위 문제에서 단위시간을 1시간으로 놓으면 람다는 4입니다. 단위시간을 3시간으로 놓으면 람다는 12입니다. 단위시간을 3시간으로 놓고 푸아송분포를 구하면 아래와 같습니다. $p(x)=\frac{12^x e^{-12}}{x!}$ 10명 이상이 올 확률은 아래와 같습니다. $P[X \geq 10]=p(10)+p(11)+p(12)+\cdots$ 무한히 많은 항을 계산해야 합니다. 여사건의 확률을 이용합시다. 아래와 같습니다. $P[.. 2023. 4. 10.
[통계 Q&A] 통계 개념질문 5개 Q) 통계 개념질문 답해주세요 A) 1. 양측검정의 유의확률은 단측검정 보다 2배 크다. 맞습니다. 양측검정의 유의확률은 0.025와 비교해야하기 때문에, 0.05를 기준으로 하면 두배 커져야 합니다. 따라서 단측검정의 유의확률보다 두배 커집니다. 자세한 설명은 아래 글 참고하세요. https://hsm-edu.tistory.com/850 2. 유의확률이 1종 오류보다 작아야 연구가설을 받아들일 수 있다. 맞습니다. 1종오류는 유의수준인 0.05입니다. 유의확률이 1종오류보다 작아야 귀무가설이 기각되고 대립가설이 채택됩니다. 3. T검정은 2개 독립변수 평균 차이를 검정하는 것이다. 틀렸습니다. t검정에는 '독립표본 t검정'과 '대응표본 t검정'이 있습니다. 이 중 독립표본 t검정이 두 독립변수 평균차이.. 2022. 12. 10.
[통계 Q&A] 다항분포 문제를 비복원추출로 풀어주세요 Q) 다항분포 문제를 비복원추출로 풀어주세요 A) 질문자님께서 말씀하신 다항분포 문제는 아래와 같습니다. 상자가 있습니다. 상자 안에는 100개의 공이 들어있는데요. 빨간공이 20개, 파란공이 30개, 노란공이 50개 들어있습니다. 이 상자에서 복원추출로 공을 10번 뽑을 때, 빨간공이 5개, 파란공이 2개, 노란공이 3개 나올 확률을 구해봅시다. 복원추출로 풀면 정답은 아래와 같습니다. $P\left( x,y,z; \ n ; \ 0.2,0.3,0.5 \right)=\frac{n!}{x!y!z!}0.2^x 0.3^y 0.5^z$ $P\left( 5,2,3; \ n ; \ 0.2,0.3,0.5 \right)=\frac{10!}{5!2!3!}0.2^5 0.3^2 0.5^3$ 비복원추출인 경우를 계산해봅시다... 2022. 8. 22.
[통계 Q&A] 적률생성함수 만들때 어떻게 X만 대체해도 되나요? Q) 적률생성함수 만들때 어떻게 X만 대체해도 되나요? 질문을 이해하기 위해 약간의 배경설명을 하겠습니다. 확률변수 X의 평균은 아래와 같이 구합니다. $E\left [ X \right ]=\int_{-\infty}^{\infty}x f(x) dx$ 적률생성함수는 X자리에 $e^{tX}$ 를 넣어서 구합니다. $E\left [ e^{tX} \right ]=\int_{-\infty}^{\infty}e^{tx} f(x) dx$ 이때 왜 우변의 x 하나만 $e^{tX}$ 로 교체할 수 있냐는 질문입니다. f(x)안에도 x가 있고, dx에도 x가 있으니 다 교체해야하는 것 아닌가라는 의문이 드신 것 같아요. A) E[ ] 는 함수가 아닙니다. 그냥 기호입니다. '대괄호 안에 있는 확률변수의 기댓값' 이라고 매번.. 2022. 5. 4.
[통계 Q&A] 상관계수 구하기 Q) 아래 데이터의 피어슨상관계수를 구해주세요. A) 표본의 상관계수는 아래 식을 이용하여 구하면 됩니다. $$r_{xy}=\frac{\sum_{i=1}^{n}\left ( x_{i}-\bar{x} \right )\left ( y_{i}-\bar{y} \right )} {\sqrt{\sum_{i=1}^{n}\left ( x_{i}-\bar{x} \right )^{2}}\sqrt{\sum_{i=1}^{n}\left ( y_{i}-\bar{y} \right )^{2}}}$$ $\bar{x}$는 x의 평균, $\bar{y}$ 는 y의 평균입니다. $\bar{x}=\frac{7+3+5+7+2+1+5+4+4}{9}=4.2$ $\bar{y}=\frac{11+14+13+26+8+3+6+12+11}{9}=11.6$ 피.. 2021. 11. 1.
[통계 Q&A] 푸아송분포 문제 Q) 한시간 동안 평균 60마리 고양이 마주침. 1분동안 2마리의 고양이를 마주칠 확률? 1분동안 3마리 이하의 고양이를 마주칠 확률? A) 먼저 푸아송분포의 분포함수는 아래와 같습니다. $f(x)=\frac{\lambda^{x}e^{-\lambda}}{x!}$ 람다($\lambda$)는 단위시간당 평균발생횟수 입니다. 한시간에 평균 60마리를 마주치므로, 1분에는 평균 1마리를 마주칩니다. 따라서 푸아송분포는 아래와 같습니다. $f(x)=\frac{e^{-1}}{x!}$ 이때 x는 1분동안 고양이를 마주치는 횟수입니다. 1분동안 2마리의 고양이를 마주칠 확률? x에 2를 넣으면 됩니다. 1분동안 3마리 이하의 고양이를 마주칠 확률? x 에 0,1,2,3 을 각각 넣고 더해주시면됩니다. 2021. 11. 1.
[통계 Q&A] 지수분포 문제 Q) 대기시간이 5분인 지수분포에서 10번 방문했을 때, 대기시간이 4분 이내가 8회 이상일 확률은? A) 대기시간이 5분이라는 것은, 1분에 사건이 평균 0.2회 발생하는 것을 의미합니다. 따라서 지수분포는 아래와 같습니다. $f(t)=0.2e^{-0.2t}$ 방문 시 대기시간이 4분 이내일 확률은 아래와 같이 구합니다. $P\left ( 0\leq t\leq 4 \right )=\int_{0}^{4}0.2e^{-0.2t}=\left [ -e^{-0.2t} \right ]_{0}^{4}=1-e^{-0.8}$ 10번 방문 중 대기시간 4분 이내가 8회 이상 발생할 확률은 아래와 같이 구합니다. 10번 방문 중 8회 발생 : $\binom{10}{8}\left [ 1-e^{-0.8} \right ]^{8}.. 2021. 10. 30.
[통계 Q&A] 평균과 기댓값이 헷갈립니다. Question) 평균을 구할 때 어떨 땐 총량으로 나누는 방식으로 하고, 어떨땐 확률이랑 변수를 곱하는데. 두개가 같은건지. xp(x)는 왜 평균을 의미하는지 궁금합니다. Answer) 평균은 원소의 전체합 나누기 원소의 개수로 정의되고 이건 받아들이기 쉬울겁니다. 문제는 기댓값인데요. 확률변수의 기댓값이라는게 등장하고 나서 이해하기가 어려워집니다. 우리가 흔히 알고 있는 산술평균에서 확률변수의 기댓값으로 개념이 확장되어야 합니다. 기댓값을 이해하고 나서 평균과 연결하시면 됩니다. 평균도 기댓값으로 해석할 수 있습니다. 기댓값 확률변수는 값과 확률을 모두 갖습니다. 예를 들어봅시다. 동전을 한개 던지는 실험에서 앞면이 나오면 500원, 뒷면이 나오면 1000원을 받는다고 합시다. 동전 한번 던진 결과로.. 2021. 3. 30.
반응형