본문 바로가기
반응형

전체 글647

[손으로 푸는 통계 ver1.0] 62. 표본분산의 분포 유도 (27) 감마함수 적분형 유도 지난시간에 배운 내용을 잠깐 리뷰해봅시다. 오일러는 $\frac{1}{2}!=\frac{\sqrt{\pi}}{2}$ 라는 결과에 영감을 받아 팩토리얼이 적분과 관련이 있을 것이라고 생각하게 되고, 아래 적분을 떠올립니다. $\int_{0}^{1}x^{e}(1-x)^{n}dx$ 이 적분식을 지난시간에 아래와 같이 변형했습니다. $\int_{0}^{1}x^{e}(1-x)^{n}dx= \frac{n!}{(e+1)(e+2)\cdots (e+n)(e+n+1)}$ 팩토리얼과 적분을 연결한 식이 유도되었습니다. 오일러는 위 수식을 변형해서 감마함수 적분형을 유도합니다. 유도해보겠습니다. 먼저 $e$ 를 $\frac{f}{g}$ 로 치환합시다. $\int_{0}^{1}x^{\frac{f}{g}}(1-x)^{n}dx= .. 2021. 7. 10.
인사채용의 1종오류와 2종오류 인사채용시 지원자를 능력자와 무능력자로 구분하고, 회사의 행동은 채용과 비채용으로 구분하면 아래와 같은 분할표를 얻을 수 있습니다. 아래 표를 표1이라고 하겠습니다. 능력자 무능력자 채용 옳은 선택 오류 비채용 오류 옳은 선택 이 상황을 통계적 가설검정과 비교해봅시다. 통계적 가설검정의 결과에 대한 분할표는 아래와 같습니다. 귀무가설이 참 귀무가설이 거짓 기각안함 옳은 선택 2종 오류 기각함 1종 오류 옳은 선택 표 1에서 1종오류와 2종오류를 구분해봅시다. 먼저 귀무가설을 세워야하는데, 귀무가설은 두가지가 가능합니다. - 지원자는 능력자다. - 지원자는 무능력자다. 지원자가 능력자라는 귀무가설을 세운 경우의 분할표입니다. 능력자 무능력자 채용 옳은 선택 2종 오류 비채용 1종 오류 옳은 선택 지원자가 .. 2021. 6. 23.
통계적 유의차가 있으면 의미 있는 차이인 걸까 두 회사에서 감자칩을 출시했고 가격은 동일합니다. 각각의 회사는 올해 10만개의 감자칩을 생산했습니다. 우리에게 모든 것을 아는 초능력이 있어서 10만개의 평균과 표준편차를 알고 있다고 가정합시다. A회사의 감자칩 무게의 평균은 50g, 표준편차는 1g 이었고, B회사의 감자칩 무게의 평균은 50.1g, 표준편차는 1g 이었습니다. 분포는 정규분포를 따른다고 가정하겠습니다. $A\sim N\left ( 50,1 \right )$ $A\sim N\left ( 50.1,1 \right )$ 각 회사의 10만개의 감자칩을 모집단으로 하여 표본을 추출하고 p값을 구해봅시다. 무료 통계 프로그램인 R을 이용하여 표본의 크기를 10부터 10000까지 10단위로 키우며 표본을 추출하고 p값을 구해봤습니다. 사용한 R.. 2021. 6. 22.
[손으로 푸는 통계 ver1.0] 61. 표본분산의 분포 유도 (26) 팩토리얼과 적분의 연결 우리는 지난시간에 이분의일 팩토리얼이 루트 파이임을 증명했습니다. $\frac{1}{2}!=\frac{\sqrt{\pi}}{2}$ 오일러는 이 결과에 영감을 받아 팩토리얼이 적분과 관련이 있을 것이라고 생각하게 되고, 아래 적분을 떠올립니다. $\int_{0}^{1}x^{e}(1-x)^{n}dx$ 이 적분은 당시에 이미 알려져 있는 수식이었습니다. 왈리스, 뉴튼, 스털링이 이미 이 적분의 특수형을 다뤘었다고 합니다. 위 적분을 변형해서 팩토리얼이 포함된 식으로 바꿔보겠습니다. 아래와 같이 부분적분을 적용합니다. $\int_{0}^{1}x^{e}(1-x)^{n}dx=\left [ \frac{1}{e+1}x^{e+1}(1-x)^{n} \right ]^{1}_{0}-\int_{0}^{1} \frac{1}{e+.. 2021. 6. 19.
[손으로 푸는 통계 ver1.0] 60. 표본분산의 분포 유도 (25) 이분의일 팩토리얼이 이분의 루트 파이임을 증명 지난 시간에 우리는 왈리스공식을 유도했습니다. 아래와 같습니다. $\frac{\pi}{2}=\prod_{n=1}^{\infty}\frac{4n^{2}}{4n^{2}-1}=\prod_{n=1}^{\infty}\left ( \frac{2n}{2n-1}\cdot \frac{2n}{2n+1} \right )= \left ( \frac{2}{1} \cdot \frac{2}{3}\right ) \left ( \frac{4}{3} \cdot \frac{4}{5}\right ) \left ( \frac{6}{5} \cdot \frac{6}{7}\right ) \left ( \frac{8}{7} \cdot \frac{8}{9}\right ) \cdots $ 이번 시간에는 왈리스공식과 오일러 무한곱을 이용하여 $\frac.. 2021. 6. 19.
[손으로 푸는 통계 ver1.0] 59. 표본분산의 분포 유도 (24) 왈리스 공식 유도3 (Wallis product) 지난 시간까지 유도한 재료들은 아래와 같습니다. $I(n)= \frac{n-1}{n}I(n-2) \quad ......(1)$ $\frac{I(2n-1)}{I(2n+1)}= \frac{2n+1}{2n} \quad ......(2)$ $I(0)= \int_{0}^{\pi}\sin^{0}x \ dx =\int_{0}^{\pi}1dx =x \vert_0^\pi =\pi$ $I(1)= \int_{0}^{\pi}\sin x \ dx =-\cos x \vert_0^\pi =2$ $I(2n)= \pi \prod_{k=1}^{n}\frac{2k-1}{2k} \quad ......(3)$ $I(2n+1)=2\prod_{k=1}^{n}\frac{2k}{2k+1} \quad ......(4)$ 계속해서 왈리스공식을 유도해봅.. 2021. 6. 19.
같은 것이 있는 순열 / 2020년 수능 수학 가형 28번 [확률과통계] 2020 수능 가형의 [확률과 통계] 문제는 4,6,14,16,18,20,23,25,28입니다. 경우의 수 문제도 포함하였습니다. 풀이 아래 두가지 경우가 가능합니다. (홀수1) (짝수1 짝수1) (짝수2 짝수2) (홀수1) (홀수2) (홀수3) (짝수1 짝수1) 첫번째 경우 경우의 수는 아래와 같습니다. (홀수1개 짝수 2개 뽑음) x (같은 것이 있는 순열로 배열함) $\left ( _{3}C_{1} \times _{3}C_{2} \right ) \times \left ( \frac{5!}{2! \times 2!} \right )=270$ 두번째 경우 경우의 수는 아래와 같습니다. (홀수3개 짝수 1개 뽑음) x (같은 것이 있는 순열로 배열함) $\left ( _{3}C_{3} \times _{3}.. 2021. 6. 16.
이항분포 / 2020년 수능 수학 가형 25번 [확률과통계] 2020 수능 가형의 [확률과 통계] 문제는 4,6,14,16,18,20,23,25,28입니다. 경우의 수 문제도 포함하였습니다. 풀이 a는 {0,1,2,3,4,5} 를 가질 수 있고, b는 {0,1,2,3,4}를 가질 수 있습니다. a-b=3 인 경우는 (5,2) , (4,1), (3,0) 의 세가지입니다. 각 경우의 확률은 아래와 같습니다. $P(a=5,b=2)=\left ( \frac{1}{2} \right )^5 \times _{5}C_{5} \times \left ( \frac{1}{2} \right )^4 \times _{4}C_{2}$ $P(a=4,b=1)=\left ( \frac{1}{2} \right )^5 \times _{5}C_{4} \times \left ( \frac{1}{2} \.. 2021. 6. 15.
[수리통계학] #31. 분위수(Quantile)와 사분위수(Quartile) 분위수 설명 분위수는 확률분포에서 확률변수의 구간을 나누는 기준이 되는 수 입니다. 전체를 몇개로 나누는가에 따라 앞에 숫자가 붙습니다. 예를들여 이분위수는 전체를 둘로 나누는 분위수입니다. 확률분포를 둘로 나누는 것이므로, 이분위수를 기준으로 왼쪽의 넓이는 0.5, 오른쪽의 넓이도 0.5입니다. 따라서 이분위수는 중앙값(median)입니다. 확률분포를 셋으로 나누는 분위수는 삼분위수(tertiles)입니다. 전체를 셋으로 나누는 것이므로, 삼분위수는 2개가 있습니다. 누적 확률이 1/3이 되는 곳의 확률변수가 첫번째 삼분위수입니다. 1삼분위수라고 부릅니다. 누적확률이 3/2가 되는 곳이 두번째 삼분위수이고, 2삼분위수라고 부릅니다. 확률분포를 넷으로 나누는 분위수는 사분위수(quartile) 입니다. .. 2021. 6. 14.
이항분포 / 2020년 수능 수학 가형 23번 [확률과통계] 2020 수능 가형의 [확률과 통계] 문제는 4,6,14,16,18,20,23,25,28입니다. 경우의 수 문제도 포함하였습니다. 풀이 이항분포 $B(n,p)$를 따르는 확률변수 $X$ 의 평균과 분산은 아래와 같습니다. $E(X)=np$ $V(X)=np(1-p)$ 따라서 p는 $\frac{1}{4}$ 입니다. V(X)는 아래와 같이 계산됩니다. $V(X)=80 \times \frac{1}{4} \times \frac{3}{4} = 15$ 정답은 15입니다. 풀이 영상 2021. 6. 14.
[손으로 푸는 통계 ver1.0] 58. 표본분산의 분포 유도 (23) 왈리스 공식 유도2 (Wallis product) 지난시간에 유도한 1번식, 2번식, 기본적인 함수값은 아래와 같습니다. $I(n)= \frac{n-1}{n}I(n-2) \quad ......(1)$ $\frac{I(2n-1)}{I(2n+1)}= \frac{2n+1}{2n} \quad ......(2)$ $I(0)= \int_{0}^{\pi}\sin^{0}x \ dx =\int_{0}^{\pi}1dx =x \vert_0^\pi =\pi$ $I(1)= \int_{0}^{\pi}\sin x \ dx =-\cos x \vert_0^\pi =2$ $I(2n)$ 을 계산합시다. 위에서 유도한 1번 식에 2n을 대입합니다. $I(2n)=\frac{2n-1}{2n}I(2n-2)$ $2n-2$는 다시 아래와 같이 변형됩니다. 1번식을 이용하면 됩니다. $I(2n)= .. 2021. 6. 12.
[머신러닝 앤드류응] (Week3) 2. Logistic Regression Model (3) 심화 최적화 앤드류 응 교수님의 코세라 머신러닝 강의를 요약하는 글입니다. Week3 의 상세 목차는 아래와 같습니다. Week3 목차 1. Classification and Representation (분류와 설명?) 2. Logistic Regression Model (로지스틱 회귀 모델) 3. Multiclass Classification (다항 분류) 4. Solving the Problem of Overfitting (과적합 문제 해결) 이번 글은 Week3의 1강인 Classification and Representation (분류와 설명?) 요약입니다. 2. Logistic Regression Model (1) Cost Function (2) Simplified Cost Function and Gradi.. 2021. 6. 11.
[수리통계학] #30. 역누적분포함수 역누적분포함수는 누적분포함수의 역함수입니다. 누적분포함수에서는 정의역이 확률변수, 함수값이 확률이었습니다. 역누적분포함수에서는 정의역이 확률이고 함수값이 확률변수입니다. 누적분포함수 X : 확률변수 Y : 누적 확률 역누적분포함수 X : 누적확률 Y : 확률변수 역누적분포함수는 아래와 같이 정의됩니다. 확률변수 X가 F라는 누적분포함수를 따를 때, 역누적분포함수는 아래와 같다. $F^{-1}(q)=inf \left \{ x:F(X)>q \right\}$ q는 0과 1사이의 값을 갖습니다. 역누적분포함수는 분위수함수(quantile)라고도 부릅니다. 분위수를 함수값으로 갖기 때문입니다. 정규분포를 예로들어봅시다. 왼쪽부터 확률밀도함수, 누적분포함수, 역누적분포함수 입니다. 2021. 6. 11.
조합 / 2020년 수능 수학 가형 20번 [확률과통계] 2020 수능 가형의 [확률과 통계] 문제는 4,6,14,16,18,20,23,25,28입니다. 경우의 수 문제도 포함하였습니다. 풀이 1. (앞면이 3번 나오는경우)-(앞면이 연속하지 않은 경우) $\left ( \frac{1}{2} \right )^{7} \times _{7}C_{3}-\left ( \frac{1}{2} \right )^{7} \times _{5}C_{3}$ 2. (앞면이 4번 나오는경우)-(앞면이 연속하지 않은 경우) $\left ( \frac{1}{2} \right )^{7} \times _{7}C_{4}-\left ( \frac{1}{2} \right )^{7} \times _{4}C_{4}$ 3. (앞면이 5번 나오는경우) 앞면이 연속해서 나오는 경우가 항상 있음 $\left .. 2021. 6. 11.
[머신러닝 앤드류응] (Week3) 2. Logistic Regression Model (2) 단순화된 비용함수와 경사하강법 앤드류 응 교수님의 코세라 머신러닝 강의를 요약하는 글입니다. Week3 의 상세 목차는 아래와 같습니다. Week3 목차 1. Classification and Representation (분류와 설명?) 2. Logistic Regression Model (로지스틱 회귀 모델) 3. Multiclass Classification (다항 분류) 4. Solving the Problem of Overfitting (과적합 문제 해결) 이번 글은 Week3의 1강인 Classification and Representation (분류와 설명?) 요약입니다. 2. Logistic Regression Model (1) Cost Function (2) Simplified Cost Function and Gradi.. 2021. 6. 10.
반응형