통계와 관련된 책이나 자료들을 보면 P[X=x] 라는 기호를 많이 보게됩니다. 대문자 X와 소문자 x가 둘다 포함되어 있어서 헷갈려하시는 경우가 있어서 이 기호에 대해 설명하려고 합니다.
X라는 확률변수가 있다고 합시다. 이 확률변수의 발생확률 아래와 같이 나타내 봅시다.
$P[X]$
X가 3일 확률을 나타내봅시다.
$P[3]$
이렇게만 놓고 보면, 어떤 확률변수가 3일 확률인지를 알 수가 없습니다. 아래와 같이 표현하는 것이 더 알아보기 편합니다.
$P[X=3]$
위 식에서 X는 확률변수를 나타내구요. 3은 발생한 값을 나타냅니다. X의 확률함수를 $p(x)$라고 놓는다면 아래와 같이 나타낼 수 있습니다.
$P[X=3]=p(3)$
좌변의 P는 확률이라는 뜻이구요. 우변의 p는 함수의 이름입니다. 헷갈리시면 우변을 $f(3)$으로 놓으셔도 됩니다.
3이라는 특정한 값에서의 확률이 아니라, 임의의 값에서 나타내려고 한다면 문자를 사용해야 합니다. X가 어떤 수 k일 확률은 아래와 같이 나타냅니다.
$P[X=k]=p(k)$
그런데 문자는 한정되어 있기 때문에 아껴 써야됩니다. k말고 스몰 x를 쓰기로 합니다.
$P[X=x]=p(x)$
위 식을 다시 설명해보면, 라지 X는 확률변수를 나타내구요. 스몰 x는 발생한 값을 말합니다. $p(x)$도 x에 어떤 숫자가 대입되면 누구의 함수인지를 알 수 없기 때문에 아래와 같이 나타내 줄 수 있습니다.
$P[X=x]=p_{X}(x)$
예를 들어 확률변수 X가 B(n,p) 인 이항분포를 따른다면 확률은 아래와 같이 나타낼 수 있습니다.
$P[X=x]=_{n}C_{x}p^{x}(1-p)^{n-x}$
#통계 강의
'@ OO의 이해 > 통계 기호의 이해' 카테고리의 다른 글
[통계 기호의 이해] 4. X 와 aX+b 의 발생 확률이 같은 이유 (1) | 2022.10.26 |
---|---|
[통계 기호의 이해] 3. E[X] 는 함수가 아닙니다 (1) | 2022.09.30 |
[통계 기호의 이해] 2. P[X≤x] 형태의 부등식에 익숙해져야 하는 이유 (0) | 2022.09.18 |
댓글