반응형 전체 글648 [확률과통계 기초] 1-12. 1단원 경우의 수 내용 요약 이 강의는 크게 세개의 단원으로 되어 있는데요. 경우의수, 확률, 통계입니다. 우리는 지난시간까지 경우의 수 공부를 완료했습니다. 우리가 경우의 수 단원에서 배운 내용들은 아래와 같습니다. 시행과 표본공간 사건 순열과 조합 이항정리 한 문장을 표현하면 이렇습니다. "사건은 어떤 시행의 결과들의 집합이고, 사건의 원소 개수가 경우의 수 이다. 경우의 수를 구하는 테크닉에는 순열과 조합이 있다." 저는 1단원에서 가장 중요한 키워드는 '사건'이라고 생각합니다. 우리가 다음 단원에서 확률을 배울 건데요. 확률 앞에는 이런 말이 생략되어 있습니다. (어떤 사건이 발생할) 확률 2단원인 확률 단원도 사실은 사건 이야기입니다. 사건이 발생할 확률을 구하는 것이구요. 사건이 발생할 확률을 구할 때, 사건의 원소 개수.. 2023. 1. 7. [확률과통계 기초] 1-11. 사건을 잘못 알고 계실지도 몰라요 사건의 정의는 이미 배운 상태인데요. 확률과 통계에서 사건은 아주 중요한 개념이라서 정말 이해했는지 한번 더 확인해보려고 합니다. 확률과 통계에서 사용되는 사건은 우리가 일상적으로 사용하는 사건의 의미와는 다릅니다. 우리가 일상적으로 사용하는 사건의 정의는 아래와 같습니다. 사건 : 사회적으로 문제를 일으키거나 주목을 받을 만한 뜻밖의 일 우리가 '사건이 발생했다' 라고 할 때의 사건은 이미 벌어진 특정한 일을 말합니다. 주로 뉴스에서 많이 듣는 단어죠. 총격 사건, 위반 사건 등에 사용합니다. 반면에 통계에서 사건은 이미 벌어진 일이 아닙니다. 주사위를 던져서 3이 나왔다고 합시다. 3이 나온 상황은 통계에서는 사건이 아닙니다. 일상에서는 발생한 어떤 상황을 지칭할 때 사건이라고 하는데요. 통계에서 사.. 2023. 1. 7. [확률과통계 기초] 1-10. 사건과 경우의 수는 무엇이 다른가 안녕하세요. 확률과 통계 기초입니다. 사건과 경우의 수의 차이가 무엇인지 설명해보라고 하면 대답하기가 쉽지 않습니다. 사건은 어떤 시행의 결과들의 집합이라는 것을 이미 배웠습니다. 어떤 시행이 주사위 던지기라고 한다면, 홀수의 눈이 나오는 사건, 짝수의 눈이 나오는 사건 등이 있습니다. 그렇다면 경우의 수는 무엇일까요? 경우의 수가 무엇인지 알기 위해 경우의 수를 구하는 문제를 하나 풀어봅시다. "주사위를 하나 던질 때, 3 이상의 눈이 나오는 경우의 수를 구하시오" 3 이상의 눈이 나오는 경우의 수는 3,4,5,6으로 4가지입니다. 이 문제를 사건의 관점으로 풀어봅시다. 3 이상의 눈이 나오는 사건은 {3,4,5,6} 입니다. 이때 경우의 수는 사건의 원소의 개수입니다. 이제 경우의 수가 무엇인지 알았.. 2023. 1. 5. 민감도, 특이도, 양성예측도, 음성예측도 외우는 법 민감도,특이도,양성예측도,음성예측도의 정의는 아래와 같습니다. 민감도 : 환자 중에서 양성 판정을 받은 비율 특이도 : 정상인 중에서 음성 판정을 받은 비율 양성예측도 : 양성 판정을 받은 사람 중에서 환자의 비율 음성예측도 : 음성 판정을 받은 사람 중에서 정상인의 비율 제 업무에서 자주 사용하는 용어는 아닙니다. 가끔 등장하는데, 그럴 때마다 헷갈려서 검색을 해보곤 하는데요. 외울 수 있는 방법을 생각해보았고 작동한 방법을 공유합니다. 먼저 아래와 같이 연결하여 외워줍니다. 민감도-환자 특이도-정상인 양성예측도-양성 음성예측도-음성 그리고 아래 표를 떠올립니다. 2022. 12. 27. [손으로 푸는 t검정] 3. t분포의 아이디어 Z검정에서 사용하는 Z통계량은 아래와 같습니다. Z=ˉX−μσ√n Z검정의 한계는 Z통계량을 구할 때, 모분산 대신 표본분산을 사용한다는 것이었습니다. 우리가 뽑은 표본의 분산은 당연히 모분산과 다를 것입니다. 아주 우연히 같은 경우가 생길 수도 있겠지만, 대부분의 경우 다를 것입니다. 윌리엄 고셋은 이 문제를 해결하고 싶었습니다. 고민 끝에 이런 아이디어를 떠올리게 됩니다. "표본분산을 확률변수로 포함하는 분포를 만들면 되지 않을까" 다른 말로 하면 아래 확률변수의 분포를 구한다는 말입니다. ˉX−μs√n 이 확률변수는 Z통계량의 모분산 자리에 표본분산을 대입한 것입니다. 아마.. 2022. 12. 24. [손으로 푸는 t검정] 2. Z검정과 그 한계 t검정을 이해하려면 Z검정과 그 한계를 먼저 알아야 합니다. t검정이 고안되기 이전에는 Z검정을 사용하고 있었고, Z검정의 한계를 극복하는 과정에서 t검정이 등장했기 때문입니다. 1. Z검정 Z검정이 무엇인지는 「손으로 푸는 통계」에서 아주 자세히 설명했습니다. 여기서는 Z검정이 무엇인지 간단히 요약해보려고 합니다. 자세한 설명은 「손으로 푸는 통계」를 참고하시면 됩니다. Z검정은 두가지가 있습니다. 하나는 평균이 알려진 모집단에서 표본 하나를 뽑아서 모평균을 검정하는 일표본 Z검정입니다. 다른 하나는 두 모집단에서 각각 표본을 뽑고, 두 모집단의 평균을 비교하는 이표본 Z검정입니다. 일표본 Z검정을 기준으로 설명하겠습니다. 모집단 A의 평균이 μ 라고 알려져 있습니다. 모평균과 모분산이 얼마인지.. 2022. 12. 24. [손으로 푸는 등분산 검정] 1. 소개 안녕하세요 통계의 본질입니다. 본 강의의 제목은 「손으로 푸는 등분산검정」 입니다. 등분산검정의 원리를 수학적으로 이해해보는 강의입니다. 등분산 검정의 모든 과정을 수식으로 써가며 이해하는 것이 목적입니다. 선수 과목은 「손으로 푸는 통계」입니다. 여러분이 통계검정의 원리를 이해하고 있다고 가정하고 진행합니다. 등분산검정은 집단의 분산을 비교할 때 사용됩니다. 대표적인 등분산 검정은 두 가지가 있습니다. F검정과 Levene's 검정입니다. F검정은 두 그룹의 분산 비교만 가능하고, Levene's 검정은 두 그룹 뿐 아니라 세 그룹 이상의 분산 비교도 가능합니다. t검정과 분산분석은 그룹들의 등분산성을 전제로 하기 때문에 사전 과정으로 등분산 검정을 해야 합니다. 이때 Levene's 검정을 주로 사용.. 2022. 12. 24. 통계의 본질 강의 커리큘럼 2023ver 통계의 본질 강의 커리큘럼 2023ver 입니다. 화살표는 선행강의입니다. 선행강의를 들어야 해당 강의를 어려움 없이 이해할 수 있습니다. 2022. 12. 24. [손으로 푸는 분산분석] 1. 소개 안녕하세요. 본 강의의 제목은 손으로 푸는 분산분석입니다. 분산분석의 원리를 수학적으로 이해해보는 강의입니다. 분산분석의 모든 과정을 수식으로 써가며 이해하는 것이 목적입니다. 선수 과목은 「손으로 푸는 통계」와 「손으로 푸는 등분산검정」입니다. 통계검정의 원리, 등분산검정의 원리를 이해하고 있다고 가정하고 설명합니다. 분산분석은 셋 이상의 집단의 평균을 비교할 때 사용하는 통계검정 방법입니다. 쉽게 생각할 수 있는 예시는 세 반의 수학점수 평균 비교가 있습니다. 그런데 방금 든 예시는 가장 간단한 형태의 분산분석입니다. 분산분석은 독립변수의 개수에 따라 여러가지로 나뉩니다. 방금 든 예시는 독립변수가 한가지인 분산분석입니다. 세반의 수학점수 비교에서 독립변수와 종속변수는 무엇일까요? 독립변수는 반의 종.. 2022. 12. 23. 비복원추출인 경우 표본평균의 평균과 분산 (유도링크 추후 보완예정) 크기가 n인 표본을 모집단에서 뽑는다고 합시다. 만약 복원추출로 뽑는다면 아래 성질이 성립합니다. 표본 평균의 평균 = 모평균 표본 평균의 분산 = 모분산/n 비복원 추출에서도 성립할까요? 수학적으로 유도하기 전에 복원추출과 비복원추출이 '확률변수' 관점에서 어떤 차이가 있는지 생각해봅시다. 복원추출은 하나의 표본을 뽑을 때, 원소들의 중복을 허용합니다. 크기가 n인 표본을 뽑을 때, n개의 원소를 뽑을 때마다 복원하는 것입니다. 따라서 표본의 원소를 뽑는 사건들은 서로 '독립'입니다. 반면에 비복원추출은 표본의 원소들을 뽑을 때 복원하지 않으므로 중복이 허용되지 않습니다. 예를들어 한 원소로 1이 뽑히면 다른 원소로는 뽑힐 수가 없습니다. 따라서 비복원추출로 뽑을 때, 표본의 원소들을 뽑는 사건은 서로.. 2022. 12. 20. [통계 Q&A] 통계 개념질문 5개 Q) 통계 개념질문 답해주세요 A) 1. 양측검정의 유의확률은 단측검정 보다 2배 크다. 맞습니다. 양측검정의 유의확률은 0.025와 비교해야하기 때문에, 0.05를 기준으로 하면 두배 커져야 합니다. 따라서 단측검정의 유의확률보다 두배 커집니다. 자세한 설명은 아래 글 참고하세요. https://hsm-edu.tistory.com/850 2. 유의확률이 1종 오류보다 작아야 연구가설을 받아들일 수 있다. 맞습니다. 1종오류는 유의수준인 0.05입니다. 유의확률이 1종오류보다 작아야 귀무가설이 기각되고 대립가설이 채택됩니다. 3. T검정은 2개 독립변수 평균 차이를 검정하는 것이다. 틀렸습니다. t검정에는 '독립표본 t검정'과 '대응표본 t검정'이 있습니다. 이 중 독립표본 t검정이 두 독립변수 평균차이.. 2022. 12. 10. [손으로 푸는 비율검정] 2. 일표본 비율검정의 수학적 원리 일표본 비율검정을 이해하기 위해 한가지 상황을 설정하겠습니다. 아래와 같습니다. "A시의 여성 비율이 p라고 알려져 있는데, 표본을 뽑아 정말 그러한지 확인해 봅시다." 표본을 뽑아서 가설검정을 할 것입니다. 귀무가설과 대립가설은 아래와 같습니다. 귀무가설 : A시의 여성비율이 p이다. 대립가설 : A시의 여성비율은 p가 아니다. A시에서 크기가 n인 표본을 뽑으려고 합니다. 이때 크기가 n인 표본에 속해 있는 여성의 수를 확률변수 X라고 놓겠습니다. 확률변수 X는 아래 이항분포를 따릅니다. X∼B(n,p) 왜 확률변수 X는 이항분포를 따를까요? A시에서 크기가 n인 표본을 뽑는다는 것은, 한번 시행을 했을 때 여성이 발생할 확률이 p인 사건을 n번 시행하는 것과 같습니다. 이는 이항분포와 .. 2022. 12. 2. [손으로 푸는 비율검정] 1. 무엇을 배우는가 이 강의에서는 두 가지 종류의 비율검정을 배울 것입니다. 하나는 일표본 비율검정이고, 다른 하나는 이표본 비율검정입니다. - 일표본 비율검정 - 이표본 비율검정 일표본 비율검정은 모비율이 p 라고 알려져 있는 상황에서, 표본을 뽑아 모비율이 p가 맞는지 검정하는 것입니다. 예를 들어 A시 여성 비율이 0.3 이라고 알려져 있는 상황에서, 정말 0.3이 맞는지 표본을 뽑아 검정하는 것입니다. 이표본 비율검정은 두 집단의 비율이 같은지 다른지 검정합니다. 예를 들어 A시와 B시의 여성 비율이 같은지 다른지를 표본을 뽑아 검정하는 것입니다. R이나 SPSS 같은 통계 프로그램으로 비율검정을 따라하는 것은 어렵지 않습니다. 본 강의는 비율검정 결과를 단순히 얻는 방법을 설명하는 강의는 아닙니다. 본 강의는 비율.. 2022. 11. 26. [통계 기호의 이해] 4. X 와 aX+b 의 발생 확률이 같은 이유 X의 확률밀도함수가 p(x) 인 경우에 X의 기댓값과 3X의 기댓값을 지난 시간에 구했었습니다. 결과는 아래와 같습니다. E[X]=∑ni=1xip(xi) E[3X]=∑ni=13xip(xi) 여기서 이런 의문이 드는 분들이 계실겁니다. X가 3X로 바뀌었는데, 왜 p(x) 는 그대로인가. 오늘 그 의문을 해결해봅시다. 확률변수 X의 원소를 아래와 같이 놓겠습니다. X={x1,x2,...,xn} x1 이 발생할 확률은 p(x1) 입니다. x2가 발생할 확률은 p(x2) 입니다. 나머지 원소들에도 동일하게 성립합니다. 기댓값은 모든 사건과 각 사건이 발생할 확률의 합.. 2022. 10. 26. 이산 vs 연속확률변수 (3) 확률 밀도가 등장한 맥락 연속확률변수는 실수 구간에서 정의된 확률변수입니다. 아래 구간에서 임의로 하나의 실수 값을 출력해주는 기계를 만들었다고 합시다. 0≤X≤3 각 숫자가 나올 확률은 동일하다고 합시다. 이때 숫자들이 각각 발생할 확률을 갖는다면 확률 전체의 합이 1이 될 수 없습니다. 확률 전체의 합이 무한대가 됩니다. 따라서 각 숫자들은 확률을 가질 수 없습니다. 대신 범위는 확률을 가질 수 있습니다. 예를들어 0≤X≤1 은 전체 영역의 1/3이므로, 발생 확률이 1/3입니다. 기호로 나타내면 아래와 같습니다. P[0≤X≤1]=13 이때 누적적분포함수는 아래와 같이 구할 수 있습니다. $P[0 \leq X \leq x]=\frac{1}{3}x.. 2022. 10. 14. 이전 1 ··· 3 4 5 6 7 8 9 ··· 44 다음 반응형