반응형 분류 전체보기648 데이터를 과장하는 방법(y축 절단, y축 축소, 넓이과장) 통계의 역설,오류,거짓말데이터를 과장하는 방법(y축 절단, 넓이과장) 신문 기사들의 그래프를 보면 데이터 자체를 조작하지는 않지만, 눈속임을 사용해서 데이터를 과장하는 것을 많이 볼 수 있습니다. 이러한 사례들을 살펴보고자 합니다. 언론이나, 광고 등에서 제시하는 그래프에 속지 않도록 통계 해석능력을 길렀으면 합니다. 1) y축 잘라내기(막대그래프) 2018년도에 비해 2019년도의 불법 공매도가 증가했다는 것을 강조하고 싶었나 봅니다. 5와 10은 두배인데, 마치 세배 이상 차이나는 것처럼 그래프를 그렸습니다. (출처 : https://www.mk.co.kr/news/stock/view/2019/10/890840/) 그래프를 아래와 같이 편집한 것으로 생각됩니다. 2) y축 축소(꺾은선그래프) 2019.. 2019. 10. 10. [통계 적률의 이해] 1. 적률이 뭔가요? 목차 1. 적률이 뭔가요 2. 통계에서의 적률 3. 중심적률 4. 표준화적률 5. 적률생성함수 적률은 수학에서 정의된 개념입니다. 함수의 모양을 수학적으로 표현하는 하나의 척도입니다. 수학에서 정의된 적률이 물리학과 통계학에서 사용되는 것입니다. 처음부터 의도한 것은 아니지만 만들어 놓고 보니 적률이 물리적인, 통계적인 어떤 개념과 일치했던 것입니다. 물리학에서는 질량(0차적률), 질량중심(1차적률), 관성모멘트(2차적률)로 사용됩니다. 통계학에서는 평균(1차적률), 분산(2차적률), 왜도(3차 적률), 첨도(4차 적률)로 사용됩니다. 더 정확이 이야기하면, 결과적 일치라고 할 수 있습니다. 수학에서 적률을 정의하고 그 후에 물리와 통계에서 가져다 썼다고 보는 것은 이해의 편의를 위한 해석에 가깝습니다... 2019. 9. 21. [손으로 푸는 베이즈통계] 4. 베이즈정리 기본형 유도 (3) 재료2 : 확률의 곱셈정리(Rule of Multiplication) 손으로 푸는 베이즈통계4. 베이즈정리 기본형 유도 (3) 재료2 : 확률의 곱셈정리(Rule of Multiplication) 지난시간에 배운 조건부확률은 아래와 같습니다 . 사건 B가 발생했을 때, 사건A가 발생할 확률입니다. 위 식의 양변에 P(B)를 곱하면 아래와 같습니다. ......① 이번에는 사건 A와 B를 반대로 써봅시다. 사건 A가 발생했을 때, 사건B가 발생할 확률입니다. 위 식의 양변에 P(A)를 곱하면 아래와 같습니다. ......② 위 식 1과 2를 확률의 곱셉정리라고 부릅니다. 교집합을 '곱'으로 표현했기 때문입니다. (합집합을 합으로 표현한 정리는 확률의 덧셈정리입니다.) 2019. 9. 18. [베이즈통계] 3. 베이즈정리 기본형 유도 (2) 재료1 : 조건부확률(Conditional probability) 손으로 푸는 베이즈통계3. 베이즈정리 기본형 유도 (2) 재료1 : 조건부확률(Conditional probability) 조건부확률은 어떤 사건이 일어난 상황에서, 다른 확률이 일어날 확률입니다. 두 사건 A와 B가 있습니다. (전사건은 S라고 합시다.) 사건 B가 일어났을 때 사건 A가 일어날 확률이 조건부확률입니다. 기호로는 아래와 같이 표현합니다. 이 확률을 유도해봅시다. 사건 B가 일어난 상황이므로, 전체사건이 사건 B로 축소됩니다. 이런 상황에서 사건 A는 사건 A와 B의 교집합입니다. 그림으로 표현하면 아래와 같습니다. 따라서 확률은 아래와 같이 계산됩니다. 이번에는 우변의 분자와 분모를 전사건의 수로 나눠봅시다. 따라서 아래와 같은 결론을 얻습니다. 사건 B가 일어났을 때, 사건 A가 일어.. 2019. 9. 18. [베이즈통계] 2. 베이즈정리 기본형 유도 (1) 유도을 위한 재료 손으로 푸는 베이즈통계2. 베이즈정리 기본형 유도 (1) 유도을 위한 재료 이번 강의부터는 베이즈 정리를 유도할 것입니다. 베이즈정리를 유도하기 위해서는 아래와 같은 선행지식이 필요합니다. - 조건부확률(Conditional probability)- 확률의 곱셈정리(Rule of Multiplication)- 전체확률의 법칙(Law of total probability) 조건부확률과 확률의 곱셈정리는 고등학교 '확률과 통계'과목에서 배웠습니다. 3,4,5강에서 위 내용을 설명하고 6강에서 베이즈정리를 유도하겠습니다. 2019. 9. 18. [손으로 푸는 확률분포] 푸아송분포 (1) 소개 (1) 소개 푸아송 분포에 붙은 '푸아송'은 사람의 이름입니다. 시메옹 푸아송의 이름을 따서 만들었습니다. 시메옹 푸아송이 발견했기 때문입니다. 시메옹 푸아송은 1791년 프랑스에서 태어났습니다. 그의 직업은 공학자, 수학자, 물리학자였습니다. 기계나 재료를 전공한 분들이라면 반드시 들어보았을 푸아송비(poisson's ratio)도 이분이 만들었습니다. 에펠탑에 이름이 새겨진 72명의 과학자중 한명이라고 합니다. 푸아송분포는 이항분포의 특수한 경우로 생각할 수 있습니다. 이항분포에서 시행횟수가 무수히 많아지고, 발생확률은 아주 작은 경우입니다. 한가지 의문이 듭니다. 그럼 그냥 이항분포로 계산하면 되지, 왜 굳이 푸아송분포가 필요한거야? 이 의문을 해결해봅시다. 거리를 돌아다니다가 길냥이를 본적이 있을.. 2019. 9. 14. [손으로 푸는 확률분포] 음이항분포 (6) 이름의 유래 (6) 이름의 유래 음이항분포에서 '음'은 양수/음수에서의 '음'입니다. 영어로는 negative 입니다. 왜 이런 이름이 붙었는지 알아봅시다. 이항분포 함수는 아래와 같이 생겼습니다. 앞에 조합형태로 곱해져 있는 값을 '이항계수'라고 부릅니다. 한편 음이항분포 함수는 아래와 같은 모양입니다. 음이항분포의 계수를 변형해보겠습니다. 먼저 펙토리얼 형태로 써봅시다. 분자에서 (r-1)!를 약분하면 아래와 같습니다. 우변 분자의 인수 개수가 x개입니다. 따라서 아래와 같이 변형할 수 있습니다. -1을 x개를 두번 곱해준 것과 같습니다. 결과적으로 1을 곱한 것이라 수식에 변화는 없습니다. 이번에는 양변에 (-r-x)! 을 곱해줍시다. 음수의 팩토리얼이라 직관적으로 완전히 받아들여지지는 않지만, 수식계산을 할 .. 2019. 9. 14. 데이터를 입력하는 두가지 방법 비교 (엑셀과 SPSS의 데이터 입력방식 비교) 데이터를 입력하는 두가지 방법 비교 (엑셀과 SPSS의 데이터 입력방식 비교) 엑셀에서 남자와 여자키의 발크기를 비교하는 독립표본 t검정을 하려면 데이터를 아래와 같이 입력해야 합니다. 엑셀에서는 위 데이터를 아래 빈칸에 입력하여 t검정을 수행합니다. 이 데이터가 어떻게 구성되어 있는 것인지, 독립변수와 종속변수 입장에서 살펴봅시다. 데이터가 정리된 형태 때문에 남자키가 독립변수고 여자키가 종속변수인 것 같아 보입니다. X와 Y같은 느낌을 받기 때문입니다. 때문에 t검정의 독립변수와 종속변수 모두 '연속형'이라고 착각합니다. 위 데이터에서 독립변수는 '성별'입니다. 종속변수는 '키'입니다. 행방향으로 독립변수가, 열 방향으로 종속변수가 입력되어 있는 형태입니다. 아래와 같이 이해할 수 있습니다. 독립변수.. 2019. 8. 26. 통계검정에서 1종오류가 2종오류보다 중요한 이유 통계검정에서 1종오류가 2종오류보다 중요한 이유 통계검정에는 1종오류와 2종오류가 있습니다. 오류를 설명하기 전에 먼저 귀무가설과 대립가설을 설명드리겠습니다. 우리가 제약회사에서 일하고 있다고 해봅시다. 탈모를 치료하는 약을 개발했는데 효과가 있는지를 검정하고 싶은 것입니다. 각종 실험과 동물실험까지 마친 상태라고 가정합시다. 임상시험을 위해 환자 100명을 모집했고 약을 투약해서 전과 후의 머리카락 수를 측정했습니다. 이때 귀무가설은 아래와 같습니다. 귀무가설 : 투약 전과 후의 머리카락 수가 같다. 귀무가설이 참이 되면 회사가 어떻게 될까요? 회사가 망합니다. 귀무가설은 우리가 거짓으로 만들고 싶은 가설입니다. 귀무의 귀는 돌아갈 귀이고 무는 없을 무입니다. 무로 돌아가게 하고 싶은 가설입니다. 또다.. 2019. 8. 26. 중심극한정리 시뮬레이션해볼 수 있는 사이트 중심극한정리 시뮬레이션해볼 수 있는 사이트 중심극한정리는 모집단이 어떤 분포인지와 상관 없이 '표본의 크기'가 충분히 크다면 표본평균들의 분포가 정규분포를 따른다는 정리입니다. 자세한 설명은 아래 링크를 참조해주세요. 중심극한정리 설명(https://hsm-edu.tistory.com/21) 중심극한정리를 시뮬레이션해볼 수 있는 사이트를 소개해드리려고 합니다. 아래 링크로 들어가시면 됩니다. http://www.ltcconline.net/greenl/java/Statistics/clt/cltsimulation.html 링크로 들어가시면 아래와 같은 화면이 뜹니다. 먼저 모집단의 분포를 선택할 수 있습니다. 분포들의 모양은 아래와 같습니다. 왼쪽 위부터 uniform, Skewed Left, Skewed .. 2019. 8. 25. R,SPSS,EXCEL 통계강의 무료로 듣는 사이트(통계교육원) R,SPSS,EXCEL 통계강의 무료로 듣는 사이트(통계교육원) 통계강의를 무료로 들을 수 있는 사이트를 소개해드리겠습니다. 통계교육원이라는 곳인데요. 통계교육원은 국무총리 산하기관인 기획재정부, 기획제정부의 산하기관인 통계청, 이 통계청의 산하기관이 통계교육원입니다. 통계교육원은 국가에서 운영하는 통계교육기관입니다. 회원가입을 하시면 온라인 강의를 무료로 들을 수 있습니다. 아래와 같은 강의들을 제공합니다. R 기초 R 활용 SPSS 중급 통계분석 SPSS 초급 통계분석 빅데이터와 통계 엑셀을 이용한 통계분석 통계학의 이해 표본이론 기초 통계 기초 및 활용 시계자료의 분석과 실무 2019. 8. 24. 한국인 키, 몸무게 등 인체계측 데이터 무료로 다운로드 받을 수 있는 사이트 소개 한국인 키, 몸무게 등 인체계측 데이터 무료로 다운로드 받을 수 있는 사이트 소개 한국인 인체치수를 조사해서 그 결과를 제공하는 사이트입니다. 국가에서 운영하는 사이트인데요. 산업통상자원부의 국가기술표준원에서 한국인 인체표준 정보 DB를 구축하여 제공하고 있습니다. 국가에서 이런 계측을 하고 정보를 제공하는 이유는 국내 산업경쟁력 강화 때문입니다. 인체치수 계측 데이터들은 의류, 신발, 가구, 자동차, 자전거 등의 다양한 산업에 적용할 수 있습니다. 아래 사이트 링크가 있습니다. https://sizekorea.kr/ 2019. 8. 24. [손으로 푸는 확률분포] 음이항분포 (5) 그래프 5) 그래프 음이항분포는 r번의 실패(사건 미발생)가 나오기까지 성공(사건발생)이 x번 발생할 확률분포입니다. 음이항분포의 분포함수, 평균, 분산은 아래와 같습니다. r이 커질수록 평균과 분산은 커집니다. p가 커질 수록 평균과 분산이 커집니다. r이 커질 수록 평균이 커진다는 것은 r이 커질 수록 성공횟수 x가 높은 값에서 발생할 확률이 높아진다는 말입니다. 예를 들어서 r이 1이고 x가 10이라고 해봅시다. 이때는 성공이 10번 연속 발생하고, 마지막에 실패가 1번 발생해야 하는데 이 확률은 정말 작습니다. r이 10이고 x가 10이라면 확률이 더 높아질 것입니다. 또 반대로 r이 10인데 x가 1인 경우에도 확률이 희박해집니다. 물론 p의 영향을 받겠지만, r이 커지면 r이 작을때에 비해서 큰 값의.. 2019. 7. 19. [손으로 푸는 확률분포] 음이항분포 (4-2) 분산 4-2) 통계량 - 분산 분산은 아래 수식을 이용하여 구할 수 있습니다. 평균은 이전 강의에서 계산한 결과를 넣어줍시다. 우리가 모르는 값은 평균의 제곱이기 때문에, 따로 떼어서 계산하겠습니다. p(x)에 음이항분포식을 적용해봅시다. x가 0일때는 값이 0이므로, x를 1부터 계산해도 됩니다. 이항분포 식을 풀어서 씁시다. x를 약분해줍니다. p하나를 꺼내고, 1-p와 r을 나누고 곱해서 아래와 같이 변형합니다. r+1=s 로, x-1=t 로 치환합니다. t+1을 전개합시다. 위 그림의 빨간부분을 조합식으로 바꿔봅시다. 위 수식의 파란부분은 실패횟수가 s이고, 성공횟수(변수)가 t인 음이항분포의 분포함수입니다. 따라서 왼쪽식은 음이항분포의 평균을 구하는 식이고, 오른쪽 식은 분포함수의 전체 합이므로 1이.. 2019. 7. 5. [손으로 푸는 확률분포] 음이항분포 (4-1) 평균 4-1) 통계량 - 평균 음이항분포의 평균은 아래와 같이 정의됩니다. E[X] = \sum_{x=0}^{\infty} x \, p(x) = \sum_{x=0}^{\infty} x \binom{x + r - 1}{x} \, p^x \,(1-p)^r x를 1부터로 바꿔도 계산 결과가 동일하므로 바꿔줍니다. E[X] = \sum_{x=1}^{\infty} x \binom{x + r - 1}{x} \, p^x \,(1-p)^r 조합을 아래와 같이 풀어서 써봅시다. E[X]= \sum_{x=1}^{\infty} x \cdot \frac{(x + r - 1)!}{(r - 1)!\, x!} \, p^x \,(1-p)^r x를 약분해줍니다. $E[X]= .. 2019. 7. 5. [손으로 푸는 확률분포] 음이항분포 (3) 유도 3) 일반화(유도) 어떤 사건이 발생할 확률을 p라고 합시다. r번의 실패가 나오기까지 발생한 성공이 k번일 확률 p(X=k)의 분포가 음이항분포입니다. p와 r은 사전에 정해지는 값입니다. 변수는 k입니다. 이를 아래와 같이 표현합니다. k는 변수이고, r과 p은 주어진 값이라는 의미입니다. 이제 이런 조건을 따르는 확률분포 p(X=k)를 정의합시다. k가 확률변수 x라는 의미입니다. 총 r번의 실패와 k번의 성공이므로 전체 시행은 r+k번이 됩니다. 아래와 같이 정리합시다. 기호로 나타내면 아래와 같습니다. NB는 Negative binomial distribution(NB)의 약어입니다. 2019. 7. 5. [손으로 푸는 확률분포] 음이항분포 (2) 예시 2) 예시 어떤 농구선수의 자유투 성공률이 30%라고 해봅시다. 이 농구선수가 3번의 실패가 나오기까지 발생한 성공이 x번인 확률이 음이항분포입니다. x가 0일 때부터 구해봅시다. 성공 없이 실패만 세번 하면 됩니다. x가 1일 때는 어떨까요. 실패를 3번 할 동안 성공이 1번 나오면 됩니다. 마지막에 실패로 끝나는 것이므로 아래와 같은 경우들이 가능합니다. 실패/실패/성공/실패 실패/성공/실패/실패 성공/실패/실패/실패 위와 같은 경우가 발생할 확률을 구해봅시다. 이번에는 x가 2일 때 발생 가능한 경우를 구해봅시다. 실패/실패/성공/성공/실패 실패/성공/실패/성공/실패 .... 경우가 많아서 세기가 귀찮습니다. 규칙을 찾아야 합니다. 마지막에는 실패로 끝나야 하니까. 실패횟수에서 하나를 빼놓습니다. .. 2019. 7. 5. [손으로 푸는 확률분포] 음이항분포 (1) 소개 1) 소개 (음이항분포는 여러가지로 정의된다!) 이미 배운 기하분포를 떠올려봅시다. 음이항분포는 기하분포의 확장버젼이라고 할 수 있습니다. 더 정확히 말하면 음이항분포의 여러 정의중 하나가, 기하분포의 확장버전입니다. 기하분포의 정의는 아래와 같습니다. 성공확률을 p라고 했을 때, x번째 시행에서 첫번째 성공이 나올 확률 p(x)의 분포 이 정의에서 첫번째를 k번째로 바꾸면 음이항분포가 됩니다. 성공확률을 p라고 했을 때, x번째 시행에서 k번째 성공이 나올 확률 p(x)의 분포. 위 음이항분포를 보면, 사전에 정의되어야할 값이 성공확률 p 말고 k도 있습니다. p와 k이 정해져야 확률분포함수가 정의된다는 말입니다. 음이항분포는 위의 방법 외에 정의하는 방법이 더 있습니다. 또한 위 방법은 일반적으로 사.. 2019. 7. 4. [손으로 푸는 확률분포] 기하분포 (6) 이름의 유래 6) 기하분포 이름의 유래 문득 이름이 왜 '기하분포'인지 궁금해졌습니다. 자료들을 찾아보니 기하분포는 '기하수열'에서 온 말이라고 합니다. 기하수열은 다시 '기하평균'에서 온 말입니다. 기하평균(geometric mean) → 기하(등비)수열(Geometric sequence) → 기하분포(Geometric distribution) 기하(등비)수열과 기하평균에 기하라는 이름이 붙어있는데요. '기하(geometric)'는 어떤 의미인지 먼저 알아봅시다. 기하는 '선' '곡선' '도형'에 관련된 것을 의미합니다. 기하평균은 도형에서 발견한 평균입니다. 아래와 같은 사각형을 봅시다. 변의 길이가 a와 c인 직사각형이 있습니다. 넓이의 관점에서 이 길이의 평균은 얼마일까요. 넓이가 유지되도록 하는 b를 찾으면.. 2019. 7. 4. [손으로 푸는 확률분포] 기하분포 (5) 그래프 5) 그래프 기하분포의 분포함수는 아래와 같습니다. 성공확률을 0.1,0.3,0.5,0.7,0.9 놓고 각각의 그래프를 그렸습니다. 성공확률이 높을 수록 감소하는 속도가 빠릅니다. 2019. 7. 4. [손으로 푸는 확률분포] 기하분포 (4) 분산 4-2) 통계량 - 분산 기하분포의 분산은 아래와 같이 정의됩니다. 시그마를 전개해봅시다. 아래 식을 1번식이라고 하겠습니다. 양변에 (1-p)를 곱합시다. 1식에서 2식을 빼겠습니다. 이제 빨간색 부분을 시그마 형태로 다시 바꿔봅시다. 양변의 p는 약분하구요. 시그마 안쪽의 식을 인수분해합니다. 계산하면 아래와 같습니다. 전개해봅시다. 빨간부분은 평균을 구할때의 식에서 p가 빠진 형태와 동일합니다. 따라서 평균의 결과를 p로 나눠준 값과 동일합니다. 파란부분은 등비수열의 합으로 구할 수 있고, 마지막 항은 0으로 수렴합니다. 계산해봅시다. 이제 아래 식에 결과를 넣어봅시다. 2019. 7. 4. [손으로 푸는 확률분포] 기하분포 (3~4) 유도, 평균 3) 일반화(유도) 어떤 사건이 발생할 확률이 p라고 합시다. 사건이 발생하지 않을 확률은 1-p 입니다. 성공과 실패로 봐도 됩니다. 이때 기하분포는 아래와 같습니다. 확률변수 x는 모든 자연수입니다. 기호로는 아래와 같이 나타냅니다. 4-1) 통계량 - 평균 미적분을 이용해서 유도하는 짧은 방법이 있긴 한데, 더 많은 분들이 이해할 수 있도록 길지만 미적분이 들어가지 않는 방법으로 유도하겠습니다. 기하분포의 평균은 아래와 같이 정의됩니다. 시그마를 전개해봅시다. 확률변수는 모든 자연수이기 때문에 극한이 등장합니다. 아래 식을 1번 식이라고 합시다. $E(X)=\lim_{n\rightarrow \infty}p\left \{ 1+2(1-p)+\cdots +(n-1)(1-p)^{n-2}+n(1-p)^{n-.. 2019. 7. 4. [손으로 푸는 확률분포] 기하분포 (1~2) 소개, 예시 1) 소개 베르누이 시행을 반복할 때, 처음 성공이 나오기까지 시행한 횟수를 확률변수 x로 할때의 확률분포입니다. 예를들어 확률변수가 4일 때의 확률은 "실패-실패-실패-성공" 인 경우의 확률입니다. 또 다른 정의도 있는데, 처음 성공이 나오기까지 실패한 횟수를 확률변수로 하는 경우도 있습니다. 이때는 확률변수 4의 확률이 "실패-실패-실패-실패-성공"의 확률이 됩니다. 본 글에서는 전자의 정의(성공이 나오기까지 시행한 횟수)를 따르겠습니다. 2) 예시 연애를 시작한 남녀가 결혼할 확률이 5%라고 가정합시다. x번째 사귄 이성과 결혼하게 될 확률분포가 기하분포입니다. 2019. 7. 4. [손으로 푸는 확률분포] 이항분포 (3~5) 유도, 통계량, 그래프 3) 일반화(유도) 어떤 독립시행에서 특정 사건이 발생할 확률은 p입니다. 이 시행을 n번 했을 때, 사건이 발생한 횟수를 x라고 합시다. 이때의 확률분포가 이항분포이고 아래와 같습니다. 시행횟수가 n, 사건 발생활률이 p인 이항분포를 기호로 아래와 같이 나타냅니다. B는 binomial의 약자입니다. 4-1) 통계량 - 평균 이항분포의 평균은 아래와 같이 정의됩니다. x가 0일때는 값이 0이므로 아래와 같이 시그마의 시작을 1으로 바꿀 수 있습니다. 아래와 같이 변형합시다. p와 n은 시그마에 독립적이므로 아래와 같이 꺼내줄 수 있습니다. x는 약분됩니다. 이제 치환을 하겠습니다. n-1을 m로, x-1을 r로 치환합시다. 이번에는 n-1에서 x-1을 뺍시다. n-x가 나오고, 이 값은 m-r과 같습니.. 2019. 7. 4. [손으로 푸는 확률분포] 이항분포 (1~2) 소개, 예시 1) 소개 베르누이 시행을 n번 했습니다. 각각의 시행은 독립시행입니다. 각 시행이 독립이라는 것은 베르누이 시행의 조건 중 하나입니다. 따라서 베르누이시행이라고 말하면 독립이라고 따로 언급할 필요는 없습니다. 이 시행에서 사건이 발생할 확률을 p라고 하고, 사건이 발행한 횟수를 확률변수 x로 할 때의 분포가 이항분포입니다. 2) 예시 어떤 농구선수의 자유투 성공률은 80%입니다. 공을 10번 던질 때, 자유투의 성공 횟수와 그 확률을 구해하면 아래와 같습니다. 자유투 성공횟수를 확률변수 x로 놓겠습니다. 예를 들어 자유투가 두번 성공할 확률을 구하면 아래와 같습니다. 2019. 7. 4. [손으로 푸는 확률분포] 베르누이분포 (3~5) 유도, 통계량, 그래프 3) 일반화(유도) 어떤 시행의 결과가 성공, 혹은 실패라고 합시다. 성공할 확률은 p이고 실패할 확률은 1-p 또는 q입니다. 시행이 성공하면 1, 실패하면 0의 값을 갖습니다. 이때, 베르누이 분포는 아래와 같습니다. 또는 아래와 같이 쓸 수도 있습니다. 4) 통계량(평균,분산) 베르누이분포의 평균은 아래와 같이 계산합니다. 베르누이분포의 분산은 아래와 같이 계산합니다. 5) 그래프 베르누이분포의 그래프는 아래와 같습니다. 2019. 7. 4. 샘플사이즈 계산해주는 프로그램 무료 다운로드 (파워분석) G power 프로그램 여기서 다운 http://www.gpower.hhu.de/ 여기는 다운안받고 온라인에서 가능 https://www.stat.ubc.ca/~rollin/stats/ssize/b2.html 2019. 6. 25. [손으로 푸는 확률분포] 베르누이분포 (1~2) 소개, 예시 1) 소개베르누이 분포는 시행의 횟수가 1회이고, 시행의 결과가 오직 두 가지인 분포입니다. 시행의 두가지 결과를 보통 '성공' 과 '실패'라고 부릅니다. 시행횟수 : 1회시행결과 : 성공 or 실패 성공은 1의 값을 실패는 0의 값을 갖습니다. 확률변수가 0과 1인 뿐인 것입니다. 이름만 거창하지 알고 나면 굉장히 단순한 확률분포입니다. 시행의 결과가 오직 두가지 뿐인 시행을 '베르누이 시행'이라고 합니다. 베르누이분포보다 베르누이시행이라는 말을 더 자주보게 될겁니다. 동전을 던지는 시행, 주사위를 던질 때 2가 나오는 시행 등이 베르누이시행입니다. 앞면/뒷면 또는 주사위눈이2/주사위눈이2가아님, 이렇게 두가지 결과만을 갖는 시행이기 때문입니다. 2) 예시빨간공 7개와 검정공 3개가 들어있는 주머니.. 2019. 5. 8. R, SPSS 등 통계 무료강의 사이트(통계청) R, SPSS 등 통계 무료강의 사이트(통계청) 통계청에서 운영하는 '통계 교육원'이라는 교육기관이 있습니다. 통계청 소속 공무원, 통계분야 공무원, 일반인들을 대상으로 현장강의와 인터넷강의를 제공합니다. (통계교육원 링크 : https://sti.kostat.go.kr/coresti/site/main.do) 현장교육은 '집합교육'이라고 부르는데 유료입니다. 정해진 날짜에 교육이 이뤄지기 때문에 일정표를 보고 원하는 날짜에 신청하면 됩니다 . 온라인 교육(e러닝)은 무료입니다. 공부원 교육들도 있는데 일반인이 들을만한 강의는 R, SPSS, 빅데이터 등이 있습니다. 이러닝 강의방식은 아래 그림과 같습니다. 파워포인트 화면을 띄워놓고 강사가 설명합니다. 국가에서 무료제공하는 강의들이 다 너무 노잼이라 걱정.. 2019. 2. 7. 통계학과 학부에서 배우는 과목들 학년별 정리 *서울대학교 기준입니다. 1학년 1) 전산통계 및 실험- 통계 소프트웨어인 R의 사용법을 배움- 교재 : 빅데이터 분석 도구 R 프로그래밍 2학년 1) 확률의 개념 및 응용- 기초확률론이라고 생각하면됨- 교재 : A first course in probability (Sheldon M.Ross)- 교재 : 확률의 개념 및 응용(전종우) 2) 해석개론- 기초미적분학이라고 생각하면됨- 교재 : Principle of mathematical analysis (W.Rudin)- 교재 : 해석개론 (김성기) 3) 선형대수학- 벡터, 행렬, 선형변환 등을 배움- 교재 : Linear algebra (Stephene H.Friedberg)- 교재 : 선형대수와 군 (이인석) 3학년 1) 수리통계학- 통계학 개론이라고.. 2018. 12. 28. 이전 1 ··· 17 18 19 20 21 22 다음 반응형