본문 바로가기
ETC

통계학의 역사(스티븐 스티글러) 요약 #3

by bigpicture 2019. 11. 20.
반응형

통계학의 역사(스티븐 스티글러) 요약 #3


통계학의 역사에 대한 이미지 검색결과


(p.18-22)


통계학의 역사라고 번역된 이 책의 원래 제목은 아래와 같다.


The History of Statistics : The Measurement of Uncertainty before 1900


직역하면 '통계의 역사 : 1900 이전에 이루어진 불확실성의 측정' 이다. 불확실성을 측정한다는 것은 불확실성을 정량적으로 표현한다는 것을 의미한다. 통계학의 역사는 불확실성을 정량화하려는 시도들이었나 보다.


왜 불확실성을 정량화하려고 시도했을까? 불확실한 것은 그냥 불확실한 대로 두면 안되나?


책에 의하면 18,19세기 천문학자들이나 측지학 연구자들은 관측 대상에게 '참 값'이 있다고 생각했다. 불확실성은 참값을 측정하려는 시도에서 발생하는 오차라고 생각한 것이다. 이 오차는 측정 방법이 정밀해지면 줄어들다가 사라질 것이라 믿었다. 


이렇게 출발한 통계학은 시간이 지나며 그 적용 범위가 자연과학을 넘어서게 된다. 키를 측정하거나, 자살률을 측정할 때의 불확실성은 '오차'라고 할 수 없다. 책에서는 '평균 자살률보다 높거나 낮으면 오차인가?'라는 물음을 한다. 이전의 관점인 '참값'과 '오차'라는 개념의 한계가 나타난 것이다. 이러한 문제를 해결해 가는 시기가 19세기 였고, 이 책에 그 이야기들이 등장한다고 한다. 두껍지만 끝까지 읽고 싶어진다. 


불확실성에 대한 개념을 확장하자. (확장된)불확실성의 측정은 규칙이 없는 것처럼 보이는 곳에서 규칙을 발견하려는 시도라고 이해하면 된다. 정말 '오차' 때문에 우연히 발생한 불확실성일 수도 있고, 어떤 원인이 있을 수도 있다. 또 그 우연에 있는 법칙을 찾게 될 수도 있다. 이렇게 열린 개념으로 받아들이면 된다. 


책이 다루는 시대는 18세기~19세기이다. 이 시기는 '가설 검증'이라는 말이 등장하기 전이다. 그 유명한 '피셔까지 충분히 다룰 수 있었을 텐데, 일부러 뺀 것으로 보인다고 역자는 추론한다. 이 책은 단순히 시대 순으로 역사를 나열한 책이 아니라, 저자가 던지는 두가지 큰 질문에 스스로가 답변을 던지는 책이라는 추론이다. 두가지 질문은 아래와 같다. 이 두 질문은 책 서문에 나온다. 


1. 최소제곱법은 1805년에 등장했고 그 후 잘 쓰였는데도, 최소제곱법과 아주 가까운 친척인 회귀분석은 무엇 때문에 19세기 말이 되어서야 태어나게 되었는가?


2. 19세기에 확률과 통계는 왜 사회과학 분야에서 제대로 활용되지 못했는가?


결론부터 말하자면 '개념상의 장벽' 때문이라고 한다. 저자는 통계학자들이 이 장벽을 어떻게 극복했는지 설명한다. 


아직 이 책은 시작되지 않았다. 번역하신 분의 글을 읽고 있는 중이다. 번역하신 분이 쓰신 글이 33페이지나 남아 있는데, 33페이지 동안 통계학 역사의 흐름과 통계학 역사 연구자들을 소개하신다고 한다. 


이 책이 비전공자들이 읽기는 다소 어렵다고 하시면서, 번역됐으면 좋겠다는 두개의 책이 있어 적는다. 


1) Hacking, I. The Taming of Chance, Cambridge University Press,1990

2) Porter, T.M., The Rise of Statistical Thinking: 1820~1990, Princeton University Press, 1986


요약일 : 2019/11/20


참고문헌

1) 통계학의 역사 (스티븐 스티글러 지금, 조재근 옮김)

반응형

댓글