본문 바로가기
@ 통계 교양/통계 Tips

로그정규분포는 무엇이고 왜 사용하는가

by bigpicture 2021. 1. 5.
반응형

로그정규분포는 무엇인가

 

로그정규분포는 로그를 씌우면 정규분포를 따르는 변수의 분포입니다. 일반적으로 자연로그의 경우를 말합니다. ln(X)가 정규분포를 따르는 X의 분포인 것입니다. Francis Galton의 이름을 따서 Galton 분포 라고도 불립니다. 


확률밀도함수는 아래와 같습니다. 

$$
f(x)=\frac{1}{x\sigma \sqrt{2\pi}}exp\left ( -\frac{\left ( lnx-\mu  \right )^{2}}{2\sigma ^{2}} \right )
$$


반대로 변수 X가 정규분포를 따른다면, exp(X) 는 로그정규분포를 따릅니다. 

 


왜 사용하는가


로그정규분포의 변수는 항상 '양수'값만을 가집니다. 따라서 정규분포가 음수값을 가짐으로 인해 발생하는 문제에 대한 대안이 될 수 있습니다. 예를들어 무게,밀도,높이,에너지,길이 등은 항상 양수 값만 갖습니다. 

 

단지 그 이유 때문에 쓴다고?

 

물론 아닙니다. 단지 양의 값만을 갖는다는 이유로사용할 수는 없죠. 로그정규분포의 사용이유에 대해 설명하기 위해, Multiplicative Central Limit Theorem 를 설명드리겠습니다. 우리말로는 "곱셈의 중심극한정리" 라고 번역할 수 있습니다. MCLT 라고 부르겠습니다. MCLT의 설명은 아래와 같습니다. (Gibrat's law라고도 부릅니다)

"iid인 양의 확률변수 X에서 표본 크기 n이 무한대로 가면, 표본기하평균이 로그정규분포를 따른다"

많은 자연현상들은 일정한 비율이 곱해지며 변화되는 성질이 있기 때문에 위에서 언급한 로그노멀분포를 띌 것으로 기대할 수 있습니다. 

이러한 성질을 고려하지 않더라도, 이미 로그노멀 분포를 따르는 수많은 사례들이 있습니다. 

사례들이 잔뜩 담긴 위키피디아 링크를 남깁니다. 5.Occurrence and applications 를 보시면 됩니다. 위에 설명드린 내용도 위키를 쉽게 설명한 것입니다. 

 

en.wikipedia.org/wiki/Log-normal_distribution

 

아래는 위키에 나온 몇가지 예시입니다. 

- 체스게임의 길이
- 세포의 크기
- 콜로이드화학에서 입자 크기

반응형

댓글