본문 바로가기
반응형

@ OO의 이해/통계 기호의 이해4

[통계 기호의 이해] 4. X 와 aX+b 의 발생 확률이 같은 이유 X의 확률밀도함수가 p(x) 인 경우에 X의 기댓값과 3X의 기댓값을 지난 시간에 구했었습니다. 결과는 아래와 같습니다. $E[X]=\sum_{i=1}^{n}x_{i}p(x_{i})$ $E[3X]=\sum_{i=1}^{n}3x_{i}p(x_{i})$ 여기서 이런 의문이 드는 분들이 계실겁니다. X가 3X로 바뀌었는데, 왜 p(x) 는 그대로인가. 오늘 그 의문을 해결해봅시다. 확률변수 X의 원소를 아래와 같이 놓겠습니다. $X=\left \{x_{1},x_{2},...,x_{n} \right \}$ $x_{1}$ 이 발생할 확률은 $p(x_{1})$ 입니다. $x_{2}$가 발생할 확률은 $p(x_{2})$ 입니다. 나머지 원소들에도 동일하게 성립합니다. 기댓값은 모든 사건과 각 사건이 발생할 확률의 합.. 2022. 10. 26.
[통계 기호의 이해] 3. E[X] 는 함수가 아닙니다 기댓값 기호 $E[X]$를 함수로 오해하시는 경우가 있습니다. 먼저 아래 질문에 답해보면서 오해하고 있는건 아닌지 확인해봅시다. Q) 확률변수 X의 확률 밀도함수를 $f(x)$ 라고 한다면, 확률변수 X의 기댓값은 아래와 같이 계산됩니다. $E[X]=\int_{-\infty}^{\infty}xf(x)dx$ 이때, 확률변수 3X의 기댓값을 아래와 같이 계산하는게 맞나요? $E[3X]=\int_{-\infty}^{\infty}3xf(3x)dx$ 정답은 '틀렸다' 입니다. 위와 같은 계산이 왜 틀렸는지 지금부터 알아봅시다. $E[X]$ 는 함수가 아니라 'X의 기댓값'을 기호로 나타낸 것입니다. X의 기댓값이라는 말을 매번 쓰기 귀찮으니 $E[X]$ 로 표현하기로 한 것입니다. X의 기댓값이 구해지는 과정을 .. 2022. 9. 30.
[통계 기호의 이해] 2. P[X≤x] 형태의 부등식에 익숙해져야 하는 이유 우리는 지난시간에 아래 기호의 의미를 배웠습니다. $P[X=x]$ 이 기호는 확률변수 X가 어떤 값 x일 확률을 나타냅니다. 대문자 X는 확률 변수를 나타내구요. 소문자 x는 발생한 값을 나타냅니다. 그런데 이 표현은 모든 확률변수에 적용될 수 없습니다. 이 표현은 이산확률변수에만 적용 가능한 표현방법입니다. 연속확률변수는 x라는 값이 확률을 갖지 않습니다. 연속확률변수에서 각 값이 발생할 확률은 항상 0입니다. 연속확률변수는 확률 대신 확률 밀도 값을 갖습니다. 확률 밀도 값은 어떤 구간에 대해 적분했을 때 확률이 되는 값입니다. 표준 정규 분포를 예로 들겠습니다. 아래 그림을 봅시다. 표준정규분포 함수입니다. 표준정규분포의 함수값은 확률이 아닌 확률밀도입니다. 이 분포를 따르는 확률변수를 X라고 한다.. 2022. 9. 18.
[통계 기호의 이해] 1. P[X=x] 의 의미, 왜 대문자 소문자를 쓰나 통계와 관련된 책이나 자료들을 보면 P[X=x] 라는 기호를 많이 보게됩니다. 대문자 X와 소문자 x가 둘다 포함되어 있어서 헷갈려하시는 경우가 있어서 이 기호에 대해 설명하려고 합니다. X라는 확률변수가 있다고 합시다. 이 확률변수의 발생확률 아래와 같이 나타내 봅시다. $P[X]$ X가 3일 확률을 나타내봅시다. $P[3]$ 이렇게만 놓고 보면, 어떤 확률변수가 3일 확률인지를 알 수가 없습니다. 아래와 같이 표현하는 것이 더 알아보기 편합니다. $P[X=3]$ 위 식에서 X는 확률변수를 나타내구요. 3은 발생한 값을 나타냅니다. X의 확률함수를 $p(x)$라고 놓는다면 아래와 같이 나타낼 수 있습니다. $P[X=3]=p(3)$ 좌변의 P는 확률이라는 뜻이구요. 우변의 p는 함수의 이름입니다. 헷갈리.. 2022. 9. 9.
반응형