본문 바로가기
@ OO의 이해/통계 기호의 이해

[통계 기호의 이해] 2. P[X≤x] 형태의 부등식에 익숙해져야 하는 이유

by bigpicture 2022. 9. 18.
반응형

우리는 지난시간에 아래 기호의 의미를 배웠습니다. 

 

$P[X=x]$

 

이 기호는 확률변수 X가 어떤 값 x일 확률을 나타냅니다. 대문자 X는 확률 변수를 나타내구요. 소문자 x는 발생한 값을 나타냅니다. 그런데 이 표현은 모든 확률변수에 적용될 수 없습니다. 이 표현은 이산확률변수에만 적용 가능한 표현방법입니다. 연속확률변수는 x라는 값이 확률을 갖지 않습니다. 연속확률변수에서 각 값이 발생할 확률은 항상 0입니다. 연속확률변수는 확률 대신 확률 밀도 값을 갖습니다. 확률 밀도 값은 어떤 구간에 대해 적분했을 때 확률이 되는 값입니다. 표준 정규 분포를 예로 들겠습니다. 

 

아래 그림을 봅시다. 

 

표준정규분포 함수입니다. 표준정규분포의 함수값은 확률이 아닌 확률밀도입니다. 이 분포를 따르는 확률변수를 X라고 한다면, X가 어떤 구간 사이일 확률을 구할 수 있습니다. 예를 들어 X가 -1.96이상 1.96 이하일 확률은 아래 그림과 같이 나타낼 수 있습니다. 

 

확률 기호를 이용하여 나타내면 아래와 같습니다. 

 

$P[-1.96 \leq X \leq 1.96]$

 

위 구간의 넓이는 0.95이므로 위 식에 나타내면 아래와 같습니다. 

 

$P[-1.96 \leq X \leq 1.96]=0.95$

 

확률기호의 부등호 표현이 가장 많이 사용되는 형태는 아래와 같습니다. 

 

$P[X \leq x]$

 

확률변수 X가 어떤 값 x보다 작거나 같을 확률입니다. 

 

이 확률은 누적분포함수의 함수값과 같습니다. 확률변수 X의 누적분포함수는 아래와 같이 정의됩니다. 

 

$F_{X}(x)=P[X \leq x]$

 

이산확률변수의 누적분포함수도 위와 동일하게 정의됩니다. 따라서 위 기호는 이산확률변수, 연속확률변수 모두 사용 가능합니다. 

 

통계학을 공부하시다가 $P[X \leq x]$ 이런 기호가 보이시면 '누적분포함수'라고 이해하시면 됩니다. 

 

#강의 영상

 

반응형

댓글