본문 바로가기
반응형

@ 통계 교양/통계의 오류,역설, 거짓말5

상한가와 하한가가 한 번씩 발생하면 이득일까 손해일까? 상한가와 하한가가 한 번씩 발생하면 이득일까 손해일까? 100원짜리 주식 한 주가 있습니다. 이 주식에 상한가와 하한가가 한번씩 발생한다는 것을 수식으로 표현하면 아래와 같습니다. 상한가는 주식가격이 30% 상승하는 것이고, 하한가는 주식 가격이 30% 하락하는 것입니다. 100x(1.3)x(0.7) 곱셈이기 때문에 순서는 상관없습니다. 오늘 상한가가 발생하고 내일 하한가가 발생하는 것과, 오늘 하한가가 발생하고 내일 상한가가 발생하는 것의 결과는 같습니다. 계산결과는 아래와 같습니다. 1x(1.3)x(0.7)=91 9% 하락입니다. 상한가와 하한가의 무게는 같지 않습니다. 하한가가 더 치명적입니다. 상한가가 10번, 하한가를 10번 발생하면 어떻게 될까요? 100*(1.3)^10*(0.7)^10 = 3.. 2020. 7. 25.
'몇배'라는 것에 속지 말자 (상대수치의 오류) '몇배'라는 것에 속지 말자 (상대수치의 오류) 두개의 약이 있다. 가격은 아래와 같다. A약 - 10000원B약 - 17000원 약사는 이렇게 말한다. "A약의 가격이 7000원 싸긴 한데, 부작용이 2배 큽니다. 효과는 둘다 동일합니다." 아마 이 이야기를 들은 대부분의 사람들은 7000원 더 주고 B약을 살 것이다. 알고 보니 A약은 부작용이 10만명중 2명 발생했고, B약은 10만명중 1명 발생했다. A약의 부작용 발생률은 0.002%이고, B약은 0.001% 인 것이다. 이 사실을 알았다면 어느 약을 사겠는가. 고민이 된다면 가격차이를 늘려보겠다. 아마 많은 사람들이 A약을 살 것이다. 약사가 거짓말을 한 것은 아니다. 단지 진실을 덜 말했을 뿐이다. 건강식품의 구성물에도 이런 수법이 적용됩니다.. 2020. 5. 24.
표본추출에서 '임의화'를 제대로 했다는 착각 표본추출에서 '임의화'를 제대로 했다는 착각 표본을 추출할 때 중요한 것은 '임의화'입니다. 표본추출에 주관적 기호나 경험이 들어갈 경우, 모집단을 잘대표하는 표본이 아니라 한쪽으로 치우친 표본이 뽑힐 것입니다. 이 글에서는 임의화라고 착각할 수 있는 한가지 사례를 소개하려고 합니다. 우리가 신약개발을 하는 연구원이라고 생각해봅시다. 이 약의 효능을 알아보기 위해 동물실험을 진행하려고 합니다. 실험용 쥐를 대상으로 할 것인데요. 실험실에서 키우고 있는 1000마리의 쥐 중에서 50마리를 뽑으려고 합니다. 연구원이 직접 쥐를 보고 뽑게하면, 연구원의 기호가 개입될 수 있다고 판단했습니다. 이런 문제를 해결하기 위해 연구원의 눈을 가리고 쥐를 뽑기로 했습니다. 그렇게 50마리의 쥐를 뽑았고, '임의화'를 잘.. 2020. 2. 8.
그래프를 꼭 그려봐야 하는 이유(엔스콤의 사인방) 이 그룹들의 통계량이 같다고??? (엔스컴의 사인방) 973년, 엔스컴은 "Graphs in Statistical Analysis"라는 제목의 논문을 출간합니다. SPSS가 1968년에 펀치카드 형식으로 처음 등장했고, 엑셀이 1987에 처음 등장했습니다. 엔스컴이 논문을 게재한 1973년은 오늘날처럼 그래프를 클릭 몇번으로 그릴 수 있는 시대는 아니었을 겁니다. 논문의 서두에는 이런 이야기가 있습니다. "출간되는 대부분의 책들과 대부분의 프로그램들은 그래프에 너무 신경을 쓰지 않는다. 우리 중 대다수는 아래와 같은 사상에 주입당했다." (1) 수치계산은 정확하지만 그래프는 거칠다(대충이다,상세하지 않다). (2) 어떤 데이터의 정확한 통계분석에는 오직 한 세트의 계산이 존재한다. (3) 데이터를 실제로.. 2019. 12. 1.
데이터를 과장하는 방법(y축 절단, y축 축소, 넓이과장) 통계의 역설,오류,거짓말데이터를 과장하는 방법(y축 절단, 넓이과장) 신문 기사들의 그래프를 보면 데이터 자체를 조작하지는 않지만, 눈속임을 사용해서 데이터를 과장하는 것을 많이 볼 수 있습니다. 이러한 사례들을 살펴보고자 합니다. 언론이나, 광고 등에서 제시하는 그래프에 속지 않도록 통계 해석능력을 길렀으면 합니다. 1) y축 잘라내기(막대그래프) 2018년도에 비해 2019년도의 불법 공매도가 증가했다는 것을 강조하고 싶었나 봅니다. 5와 10은 두배인데, 마치 세배 이상 차이나는 것처럼 그래프를 그렸습니다. (출처 : https://www.mk.co.kr/news/stock/view/2019/10/890840/) 그래프를 아래와 같이 편집한 것으로 생각됩니다. 2) y축 축소(꺾은선그래프) 2019.. 2019. 10. 10.
반응형