본문 바로가기
@ 통계 교양/통계 Tips (영상)

확률에 왜 질량과 밀도라는 말이 붙어있나 (확률밀도함수, 확률질량함수)

by bigpicture 2020. 9. 27.
반응형

아래 목차로 설명하겠습니다. 

1. 확률밀도함수와 확률질량함수
2. 질량과 밀도 (3,2,1차원)
3. 비교


확률밀도함수(PDF, probability density function)와 확률질량함수(PMF, probability mass function)라는 이름에는 확률과는 거리가 먼 용어들이 붙어있습니다. '질량(mass)'과 '밀도(density)'라는 단어인데요. 물리시간에나 나올 법한 단어들입니다. 

아마 대부분의 분들이 "밀도에는 뭔가를 곱해야 질량이 되는거니까. 함수값 그 자체가 확률인 경우를 '질량', 함수값에 뭔가를 곱해서 넓이를 구하는 경우를 '밀도'라고 놓았구나" 라는 애매하지만 모르는 것은 아닌 상태일거라 생각합니다. 

질량과 밀도의 관계가, 확률질량함수와 확률밀도함수의 관계로 어떻게 연결되는지 명확히 이해하는 목적입니다. 

먼저 확률밀도함수와 확률질량함수의 개념부터 살펴봅시다. 혹시 잊어버린 분들을 위해 간단히만 설명하겠습니다. 고등학교 '확률과통계' 과목에서 이 두가지 함수를 배웁니다. 두 함수의 설명은 다음과 같습니다. 

확률질량함수 : 이산확률변수 X의 분포를 나타내는 함수로, 함수 값이 곧 확률이다. 
확률밀도함수 : 연속확률변수 X의 분포를 나타내는 함수로, 함수의 넓이가 확률이다. 

왼쪽 그래프는 주사위를 던질 때 나오는 눈을 확률변수로 하는 확률분포함수입니다. 확률질량함수입니다. 오른쪽 그래프는 표준정규분포를 따르는 확률변수의 확률분포함수입니다. 확률밀도함수입니다. 

 

각 함수에서 확률이 구해지는 예를 들어봅시다. 먼저 확률변수 X가 이산확률변수이고, X가 1부터 6까지의 정수 값을 가진다고 해봅시다. 확률질량함수를 P(X)라고 놓겠습니다. 이때 X가 0이상 2이하의 값을 가질 확률은 아래와 같이 구합니다. 

$P[0 \leq X \leq 2]=P[0]+P[1]+P[2]$

이번에는 확률변수 X가 연속확률변수이고, X가 0부터 4까지의 실수 값을 갖는다고 해봅시다. 확률밀도함수를 f(X)라고 놓겠습니다. 이때 X가 0이상 2이하의 값을 가질 확률은 아래와 같이 구합니다. 

$P[0 \leq X \leq 2]=\int_{0}^{2}f(x)dx$

표로 정리하면 아래와 같습니다. 

 

  확률
이산확률변수 $P[0 \leq X \leq 2]=P[0]+P[1]+P[2]$
연속확률변수 $P[0 \leq X \leq 2]=\int_{0}^{2}f(x)dx$

 

##R source code of figures

par(mfrow=c(1,2))

x=c(1,2,3,4,5,6)
y=rep(1/6,6)
plot(x,y,ylim=c(0,1),
        main="Dice probability distribution",
        type="h")

x=seq(-5,5,0.1)
y=dnorm(x)
plot(x,y,main="Nomal distribution",type="l")

 

2. 질량과 밀도 (3,2,1차원)

어떤 물체의 질량을 m, 부피를 V, 밀도ρ 라고 합시다. 질량과 부피와 밀도의 관계는 아래와 같습니다. 

 

$\rho =\frac{m}{V}$

 

양변에 부피를 곱하면 아래와 같이 변형할 수 있습니다. 

 

$m=\rho V$

 

그런데 위와 같은 계산은 이 물체의 밀도가 전체적으로 균일할 때만 가능합니다. 만약 밀도가 물체 내부의 위치마다 다르다면 어떨까요? 밀도가 물체 내부의 함수로 정의됩니다. 

 

$\rho =\rho(x,y,z)$

 

따라서 질량은 아래와 같은 적분으로 표현됩니다. 

 

$m=\iiint \rho(x,y,z)dV$

 

차원을 하나 낮춰봅시다. 3차원 물체에서 2차원 평판이 됩니다. 

 

$m=\iint \rho(x,y)dA$

 

3차원 공간에 밀도함수를 그릴 수 있게 됐습니다. x,y 좌표에 위치, z좌표가 밀도를 나타내게 됩니다. 

 

차원을 하나 더 낮춰봅시다. 2차원 평판에서 1차원 선이 됩니다. 

 

$m=\int \rho(x)dx$

 

길이가 4인 직선이 있다고 해봅시다. 이 직선의 밀도가 위치에 따라 다르다고 합시다. 0일때 밀도가 2이고, 선형으로 커져서 4일 때 6이라고 하겠습니다. 아래와 같이 그래프로 나타낼 수 있습니다. 

 

0에서 2까지의 질량을 구하고 싶다면, 아래 면적을 구하면 됩니다. 

 

적분식으로 나타내면 아래와 같습니다. 

$m[0 \leq X \leq 2]=\int_{0}^{2}\rho (x)dx$

이번에는 질점을 정의해봅시다. 

0부터 4까지, 1간격으로 총 5개의 질점이 있는 것입니다. 각각의 질량을 4라고 하겠습니다. 

이 경우는 함수값이 곧 질량입니다. 0부터 2까지의 질량을 구하려 각각의 질량을 더해주면 됩니다. 

$m[0 \leq X \leq 2]=m[0]+m[1]+m[2]=4+4+4=12$

표로 정리하면 아래와 같습니다. 

 

  질량
1차원 질점 $m[0 \leq X \leq 2]=m[0]+m[1]+m[2]=4+4+4=12$
1차원 직선 $m[0 \leq X \leq 2]=\int_{0}^{2}\rho (x)dx$

 

##R source code of figures, density function

x_axis=seq(0,10,length=100)y_axis=seq(0,10,length=100)
dev.new()
plot(x_axis,y_axis,      type="n",xlab="x",ylab="d(x)"     ,main="Density function",     #asp=2     )
x=c(0,4)y=c(2,6)
points(x,y,type="l",col="red",lwd=2)
polygon(c(0,2,2,0),c(0,0,4,2),        col=adjustcolor("yellow",alpha=0.7),border=NA)

##R source code of figures, mass function

x_axis=seq(0,10,length=100)
y_axis=seq(0,10,length=100)

dev.new()

plot(x_axis,y_axis, 
     type="n",xlab="x",ylab="m(x)"
     ,main="mass function",
     #asp=2
)

x=c(0,0,1,1,2,2,3,3,4,4)
y=c(0,4)

points(x[1:2],y,type="l",col="red")
points(x[3:4],y,type="l",col="red")
points(x[5:6],y,type="l",col="red")
points(x[7:8],y,type="l",col="red")
points(x[9:10],y,type="l",col="red")

 

3. 비교

첫번째 글의 확률을 구하는 수식과 두번째 글의 질량을 구하는 수식을 하나의 표로 합쳐봅시다. 

 

  확률 질량  
이산확률변수 $P[0 \leq X \leq 2]=P[0]+P[1]+P[2]$ $m[0 \leq X \leq 2]=m[0]+m[1]+m[2]=4+4+4=12$ 1차원 질점
연속확률변수 $P[0 \leq X \leq 2]=\int_{0}^{2}f(x)dx$ $m[0 \leq X \leq 2]=\int_{0}^{2}\rho (x)dx$ 1차원 직선


이산확률변수에서 확률을 구하는 수식과 1차원 질점에서 질량을 구하는 수식이 동일합니다. 연속확률변수에서 확률을 구하는 수식은 1차원 직선에서 질량을 구하는 수식과 동일합니다. 이런 이유로 물리학의 질량과 밀도라는 용어를 통계에 사용하게 된 것 같네요.

 

 

#강의 영상

반응형

댓글