본문 바로가기
반응형

통계213

[통계 Q&A] 적률생성함수 만들때 어떻게 X만 대체해도 되나요? Q) 적률생성함수 만들때 어떻게 X만 대체해도 되나요? 질문을 이해하기 위해 약간의 배경설명을 하겠습니다. 확률변수 X의 평균은 아래와 같이 구합니다. $E\left [ X \right ]=\int_{-\infty}^{\infty}x f(x) dx$ 적률생성함수는 X자리에 $e^{tX}$ 를 넣어서 구합니다. $E\left [ e^{tX} \right ]=\int_{-\infty}^{\infty}e^{tx} f(x) dx$ 이때 왜 우변의 x 하나만 $e^{tX}$ 로 교체할 수 있냐는 질문입니다. f(x)안에도 x가 있고, dx에도 x가 있으니 다 교체해야하는 것 아닌가라는 의문이 드신 것 같아요. A) E[ ] 는 함수가 아닙니다. 그냥 기호입니다. '대괄호 안에 있는 확률변수의 기댓값' 이라고 매번.. 2022. 5. 4.
히스토그램 간격 설정 원리 엑셀이나 R에서 히스토그램을 그리면 알아서 간격을 설정해주는데요. 오늘은 그 원리를 알아봅시다. 히스토그램의 간격을 설정할 때는 일반적으로 Sturge's Rule 을 사용합니다. 데이터의 크기를 n이라고 할 때 간격의 개수는 아래와 같이 계산됩니다. 막대의 개수라고 생각하시면 됩니다. bin 이라고도 부릅니다. $number \ of \ bins=\left \lceil \log_{2}n+1 \right \rceil$ 괄호 기호는 '올림' 의 의미입니다. 2022. 5. 2.
분산 구하는 두 가지 방법 (제곱의평균-평균의제곱 유도) 평균 아래와 같은 자료가 있다고 합시다. $x_{1},x_{2},...,x_{n}$ 이 자료를 변수 X로 나타낸다고 합시다. $X=\left \{ x_{1},x_{2},...,x_{n} \right \}$ X의 평균은 아래와 같이 정의됩니다. $E[X]=\frac{x_{1}+x_{2}+\dots+x_{n}}{n}$ 시그마 기호로 나타내면 아래와 같습니다. $E[X]=\frac{x_{1}+x_{2}+\cdots+x_{n}}{n}=\frac{\sum_{i=1}^{n}x_{i}}{n}$ 편의상 변수 X의 평균을 $\mu$ 라고 놓겠습니다. $E[X]=\mu$ 분산 변수 X의 분산은 아래와 같이 정의됩니다. 편차의 제곱의 평균입니다. $V[X]=E\left [ \left ( X-\mu \right )^2 \ri.. 2022. 4. 27.
[손으로 푸는 상관분석] 3. 공부 순서 정하기 지난시간에 산관분석 결과를 살펴봤습니다 .상관분석을 하면 t검정 결과인 p값과 상관계수가출력되는데요. 간단한 설명은 아래와 같습니다. t검정 : 관계의 유무를 나타냄. p 2022. 4. 20.
[책 증정 이벤트] 데이터 요약과 시각화 with R (임경덕) 루비페이퍼 라는 출판사에서 책을 한권 보내왔습니다. 읽어보고 괜찮으면 채널에 이 책을 소개하면서 증정 이벤트를 하자고 제안하셨습니다. 책을 처음부터 끝까지 전부 읽어봤습니다. 잘 쓰여진 책인 것 같아서 소개를 드리려고 합니다. 10분을 추첨해서 책을 보내드릴 거구요. 이벤트 참여 방법은 더보기 란에 있습니다. 제가 돈을 받은게 아니라서 유료광고는 아니지 않나 생각했는데요. 알아보니 상품 무료제공도 유료광고라고 합니다. 그래서 영상 제목에 광고라고 표시한겁니다. 자 그럼 책 소개를 시작하겠습니다. 책 제목은 데이터 요약과 시각화 with R 입니다. R은 무료 통계 프로그램이구요. 오픈소스라서 참여자들이 계속해서 발전시켜 나가고 있는 프로그램입니다. 저도 R을 사용하고 있습니다. 통계를 처음 접한 시기에는.. 2022. 4. 16.
[손으로 푸는 통계 ver1.0] 87. 표본분산의 분포에서 모집단이 정규분포를 따라야 한다는 조건 제거하기 우리는 지금까지 표본분산의 분포를 유도했는데요. $\frac{n-1}{\sigma^{2}}s^{2} \sim \chi^{2}_{n-1}$ 한가지 잊고 있었던 사실이 있습니다. 우리가 표본분산의 분포를 유도할 때 두가지 조건을 설정했었다는 것입니다. (36강) 1) 표본평균의 분포가 정규분포를 따를 만큼 표본의 크기 n이 크다. 2) 모집단의 분포는 정규분포를 따른다. 첫번째 조건을 만족시키는 것은 어렵지 않습니다. 문제는 두번째 조건입니다. 표본분산에 어떤 상수를 곱한 분포가 카이제곱분포를 따른다는 명제를 유도하려면 모집단이 정규분포를 따른다는 조건이 필요합니다. '표본분산에 어떤 상수를 곱한 분포가 카이제곱분포를 따른다'는 조건은 t분포를 유도할 때도 사용됩니다. t분포를 사용할 때도 모집단이 정규분포.. 2022. 3. 28.
[손으로 푸는 통계 ver1.0] 86. R로 카이제곱분포 그래프 그려보기 지난시간까지 미분을 이용하여 카이제곱분포의 그래프 형태를 예측해보았습니다. 우리가 예측한 1,2,3 자유도 카이제곱분포 그래프는 아래와 같습니다. 4자유도 카이제곱분포 그래프는 아래와 같습니다. 5자유도 이상인 카이제곱분포 그래프는 아래와 같습니다. 2자유도의 c를 구해봅시다. $f(x)=\frac{1}{2^{\frac{n}{2}} \Gamma \left ( \frac{n}{2} \right ) } e^{-\frac{x}{2}} x^{\frac{n}{2}-1}$ 위 식 계수에 2를 넣으면 되구요. 감마 1은 1이니까. 0.5가 나옵니다. R을 이용하여 우리가 예측한 그래프 형태가 맞는지 알아봅시다. R의 dchisq 라는 함수를 이용하면 카이제곱분포의 함수 값을 알 수 있습니다. 코드는 아래와 같습니다... 2022. 3. 25.
[손으로 푸는 통계 ver1.0] 85. 카이제곱분포 형태 예측 (자유도 4자유도 이상 ) 지난시간에 1,2,3 자유도 카이제곱분포의 개형을 예측했습니다. 우리가 예측한 형태는 아래와 같습니다. 왼쪽부터 1,2,3 자유도 입니다. 오늘은 4자유도 이상의 카이제곱분포의 개형을 예측해봅시다. n자유도 카이제곱분포의 분포함수 $f(x)$와 도함수 $f'(x)$는 아래와 같습니다. $f(x)=c \cdot e^{-\frac{x}{2}}\cdot x^{\frac{n}{2}-1}$ $f'(x)=-\frac{1}{2} c \cdot e^{-\frac{x}{2}}\cdot x^{\frac{n}{2}-2}\left(x-(n-2) \right)$ n=4 n이 4인 경우의 $f(x)$와 $f'(x)$ 는 아래와 같습니다. $f(x)=c\cdot \frac{x}{e^{\frac{x}{2}}}$ $f'(x)=-\fr.. 2022. 3. 23.
[손으로 푸는 통계 ver1.0] 84. 카이제곱분포 형태 예측 (자유도 1~3) 우리는 아래 수식을 유도했습니다. $\frac{n-1}{\sigma^{2}}s^{2} \sim \chi^{2}_{n-1}$ 카이제곱분포의 평균과 분산도 유도한 상태입니다. 이제 카이제곱분포의 분포함수를 그리고 넓이를 구해보면서 모분산 대신 표본분산을 사용하는 것이 가능한지 알아봐야 하는데요. 카이제곱분포를 손으로 정확히 것은 거의 불가능합니다. R이나 파이썬등의 소프트웨어를 이용해서 그려야 하는데요. 미분을 이용하면 어느정도의 형태는 예상해볼 수 있습니다. 오늘은 미분을 이용해서 카이제곱분포의 대략적인 형태를 알아봅시다. n자유도 카이제곱분포 함수는 아래와 같습니다. $f(x)=\frac{1}{2^{\frac{n}{2}}\Gamma\left( \frac{n}{2} \right)} \cdot e^{-\fr.. 2022. 3. 11.
[손으로 푸는 통계 ver1.0] 81. 카이제곱분포의 평균 유도 우리는 아래 수식을 유도했습니다. $\frac{n-1}{\sigma^{2}}s^{2} \sim \chi^{2}_{n-1}$ 표본분산에 상수가 곱해진 확률변수가 n-1 자유도인 카이제곱분포를 따른다는 의미입니다. n-1 자유도의 카이제곱분포 함수는 아래와 같습니다. $f(x)=\frac{1}{2^{\frac{n-1}{2}} \Gamma \left ( \frac{n-1}{2} \right ) } e^{-\frac{x}{2}} x^{\frac{n-1}{2}-1}$ 오늘은 카이제곱분포의 평균을 유도해보겠습니다. 유도해놓으면 분명 뒤에서 써먹을 일이 있을것 같아요. 수식을 편하게 다루기 위해 n자유도의 카이제곱분포에서 평균을 유도하겠습니다. $f(x)=\frac{1}{2^{\frac{n}{2}} \Gamma \l.. 2022. 3. 5.
통계 분석 언제 뭘써야 하나 표 하나로 정리하기 다양한 통계 분석을 어떤 상황에 사용해아 하는지 표로 정리해봤습니다. 목적 독립변수 종속변수 모수적 방법 비모수적 방법 서로 독립인 두 그룹의 평균 비교 범주형 연속형 독립표본 t검정 맨-휘트니 검정 (윌콕슨 순위합 검정) 서로 종속인 두 그룹의 평균 비교 범주형 연속형 대응표본 t검정 윌콕슨 부호 순위 검정 셋 이상 그룹의 평균 비교 범주형 연속형 분산분석 크루스칼-왈리스 검정 동일 대상의 반복측정 결과 평균 비교 범주형 연속형 반복측정 분산분석 프라이드만 검정 두 범주형 변수 사이의 관계 범주형 범주형 카이제곱검정 두 연속형 변수 사이의 관계 연속형 연속형 선형 회귀분석 연속형 독립변수와 범주형 종속변수 사이의 관계 연속형, 범주형 범주형 로지스틱 회귀분석 2021. 12. 25.
통계 그래프 언제 뭘써야 하나 표 하나로 정리하기 1 다양한 통계 그래프를 어떤 상황에 사용해아 하는지 표로 정리해봤습니다. 독립변수와 종속변수의 데이터 종류에 따라 분류하였습니다. 데이터는 범주형 데이터와 연속형 데이터로 나뉩니다. 독립 범주 연속 종속 범주 분할표 산점도 상자수염그림(가로) 연속 상자수염그림 히스토그램 막대그래프 산점도 각 데이터의 예를 들면 아래와 같습니다. 독립 범주 연속 종속 범주 성별에 따른 흡연자와 비흡연자 수 - 연속 남자와 여자 키 비교 키와 몸무게의 관계 2021. 12. 25.
[손으로 푸는 통계 ver1.0] 80. aX가 카이제곱분포를 따를 때, X도 그럴까 정규 분포에서는 아래 성질이 성립했습니다. 변수 aX가 평균이 $\mu$이고, 분산이 $\sigma^{2}$인 정규분포를 따를 경우, 확률변수 X는 평균이 $\frac{\mu}{a}$이고, 표준편차가 $\left| \frac{\sigma}{a} \right| $인 정규분포를 따릅니다. 카이제곱분포에서는 어떨까요? 변수 aX가 자유도가 n-1인 카이제곱분포를 따른다고 합시다. 기호로는 아래와 같이 나타냅니다. $aX \sim \chi^{2}_{n-1}$ aX의 확률밀도함수를 f(ax), 누적분포함수를 F(ax)라고 놓겠습니다. F(ax) 는 아래와 같이 정의됩니다. $P\left[ aX \leq ax \right]$ 우리가 궁금한 것은 X의 분포입니다. X의 확률밀도함수를 g(x), 누적분포함수를 G(x).. 2021. 12. 17.
통계 영문자료를 이해하기 위한 통계 용어와 해석 모음(지속적 업데이트) sample space : 표본공간, 전체집합 sample outcome : 표본공간의 원소 realization : 표본공간의 원소 element : 표본공간의 원소 complement A : A의 여집합 disjoint : 교집합이 없음, 배반임 mutually exclusive : 교집합이 없음, 배반임 monotone increasing : A1, A2, A3, .... 에서 A1 ⊂ A2 ⊂ A3... 관계가 성립 monotone decreasing : monotone increasing 의 반대 bivariate distrituion : 이변량 분포 2021. 12. 2.
양측검정과 단측검정의 검정력은 같을까 다를까 가설검정에는 두가지 오류가 있습니다. 1종오류인 α와 2종오류인 β 입니다. 1종오류는 신뢰도와 관련 있고, 2종오류는 검정력과 관련이 있습니다. 관계는 아래와 같습니다. 1종오류(α) = 1-신뢰도 2종오류(β) = 1-검정력 양측검정에서 단측검정으로 바뀐다고 해서 1종오류가 바뀌지는 않습니다. 한쪽에 0.05를 몰아주던 것이 양쪽에 0.025씩 나뉘주는 것으로 바뀔 뿐입니다. 전체 오류는 0.05로 동일합니다. 하지만 2종오류 입장에서는 다릅니다. 단측검정이 양측검정으로 바뀌게 되면 위에 보이시는 세로 선이 우측으로 이동하게 되고, 2종오류는 커지는 결과를 낳습니다. 따라서 단측검정이 양측검정으로 바뀌면 검정력은 줄어들게 됩니다. 2021. 11. 12.
[균등분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 균등분포에 대한 통계량들을 표로 요약한 내용입니다. 더 정확히 말하면 연속균등분포입니다. 정의 모든 확률변수의 함수값이 동일한 분포 분포함수 $\left\{\begin{matrix} \frac{1}{b-a} & (a \leq x \leq b ) \\ 0 & \mathrm{else} \end{matrix}\right.$ 누적분포함수 $\left\{\begin{matrix} 0 & (xb) \end{matrix}\right.$ 평균 $\frac{1}{2}(a+b)$ 분산 $\frac{1}{12}(b-a)^{2}$ 왜도 0 첨도 $\frac{9}{5}$ 적률생성함수 $\left\{\begin{matrix} \frac{e^{tb}-e^{ta}}{t(b-a)} & (t \neq 0) \\ 1 & (t=0) \en.. 2021. 11. 4.
[통계 Q&A] 푸아송분포 문제 Q) 한시간 동안 평균 60마리 고양이 마주침. 1분동안 2마리의 고양이를 마주칠 확률? 1분동안 3마리 이하의 고양이를 마주칠 확률? A) 먼저 푸아송분포의 분포함수는 아래와 같습니다. $f(x)=\frac{\lambda^{x}e^{-\lambda}}{x!}$ 람다($\lambda$)는 단위시간당 평균발생횟수 입니다. 한시간에 평균 60마리를 마주치므로, 1분에는 평균 1마리를 마주칩니다. 따라서 푸아송분포는 아래와 같습니다. $f(x)=\frac{e^{-1}}{x!}$ 이때 x는 1분동안 고양이를 마주치는 횟수입니다. 1분동안 2마리의 고양이를 마주칠 확률? x에 2를 넣으면 됩니다. 1분동안 3마리 이하의 고양이를 마주칠 확률? x 에 0,1,2,3 을 각각 넣고 더해주시면됩니다. 2021. 11. 1.
[푸아송분포 한눈에] 정의, 분포함수,평균,분산,첨도,왜도,적률생성함수,특성함수 푸아송분포에 대한 통계량들을 표로 요약한 내용입니다. 정의 이항분포에서 시행횟수가 무수히 많아지고, 발생확률은 아주 작은 경우입니다. 이항분포의 평균인 np가 $\lambda$ 입니다. 단위시간당 사건의 평균 발생횟수입니다. 분포함수 $ \frac{\lambda^{x}e^{-\lambda}}{x!}$ 누적분포함수 $e^{-\lambda}\sum_{k=1}^{\left \lfloor x \right \rfloor}\frac{\lambda^{k}}{k!} $ 평균 $\lambda$ 분산 $\lambda$ 왜도 $\lambda^{-\frac{1}{2}}$ 첨도 $\frac{1}{\lambda}+3$ 적률생성함수 $e^{\lambda\left ( e^{t}-1 \right )}$ 특성함수 $e^{\lambda\.. 2021. 11. 1.
[통계 Q&A] 지수분포 문제 Q) 대기시간이 5분인 지수분포에서 10번 방문했을 때, 대기시간이 4분 이내가 8회 이상일 확률은? A) 대기시간이 5분이라는 것은, 1분에 사건이 평균 0.2회 발생하는 것을 의미합니다. 따라서 지수분포는 아래와 같습니다. $f(t)=0.2e^{-0.2t}$ 방문 시 대기시간이 4분 이내일 확률은 아래와 같이 구합니다. $P\left ( 0\leq t\leq 4 \right )=\int_{0}^{4}0.2e^{-0.2t}=\left [ -e^{-0.2t} \right ]_{0}^{4}=1-e^{-0.8}$ 10번 방문 중 대기시간 4분 이내가 8회 이상 발생할 확률은 아래와 같이 구합니다. 10번 방문 중 8회 발생 : $\binom{10}{8}\left [ 1-e^{-0.8} \right ]^{8}.. 2021. 10. 30.
[통계 적률의 이해] 7. 적률생성함수 수학 거의 없이 이해하기 지난 강의에서 수학을 많이 사용하여 적률생성함수를 설명했는데요. 혹시 수학에 어려움을 느끼는 분들이 계실 수도 있어서 이번 시간에는 수학을 최대한 적게 쓰며 적률생성함수를 설명해보겠습니다. 적률생성함수는 함수입니다. 변수는 t입니다. t에대한 함수에요. 아래와 같습니다. $M(t)$ 어떤 확률변수 X의 적률생성함수는 아래와 같이 정의됩니다. $M_{X}(t)=E\left [ e^{tX} \right ]$ 위 식을 이용하면 정규분포의 적률생성함수도 구할 수 있고 이항분포의 적률생성함수도 구할 수 있습니다. 적률생성함수를 한번 구해놓으면 유용하게 사용됩니다. 적률생성함수를 한번 미분에서 t에 0을 넣으면 X의 기댓값인 $E\left [ X \right ]$ 가 구해집니다. 두번 미분하고 t에 0을 넣으면 $.. 2021. 10. 27.
X가 U(0,1)인 균등분포를 따르면 1-X 도 그럴까 오늘 증명해볼 내용은 아래와 같습니다. X가 U(0,1)인 균등분포를 따르면 1-X 도 그럴까 직관적으로 당연하지만 수식으로 증명해보겠습니다. 두 확률분포의 적률생성함수가 같다면 두 확률변수는 같다는 성질을 이용하여 증명하겠습니다. 먼저 U(0,1)을 따르는 확률변수 X의 적률생성함수를 유도하겠습니다. X의 적률생성함수는 아래와 같습니다. $M_{X}(t)=E\left [ e^{tX} \right ]=\int_{-\infty}^{\infty}e^{tx}f(x)dx$ x는 0과 1 사이에서만 1이라는 값을 가지므로 아래와 같이 변형됩니다. $E\left [ e^{tX} \right ]=\int_{0}^{1}e^{tx}dx$ 적분합시다. $M_{X}(t)=E\left [ e^{tX} \right ]=\lef.. 2021. 10. 21.
p값에 대한 미국통계협회의 입장발표 (이거 계속 써도 되는겨?) p값에 대한 논란은 꾸준히 제기되어 왔는데요. 미국통계협회에서 공식적으로 발표한 글이 있어서 가져왔습니다. 아래 제목의 글입니다. ASA Statement on Statistical Significance and P-Values 구글에 치시면 전문을 보실 수 있습니다. 여기서는 간단히 요약하도록 하겠습니다. 2014년 2월에 미국 매사추세스주에 있는 마운트 홀리오크 대학의 통계학과 교수인 George Cobb은 아래와 같은 대화형식의 글을 통해 문제를 제기했습니다. 질문자 : 왜 수많은 대학에서 p값이 0.05라고 가르치는거죠? 답변자 : 왜냐하면 과학 커뮤니티들과 논문 에디터들이 여전히 p값을 0.05로 사용하기 때문입니다. 질문자 : 그럼 왜 많은 사람들이 여전히 p값을 0.05로 사용하는 걸까요? .. 2021. 10. 20.
평균과 중앙값의 비교와 그래프의 치우침 대칭인 분포의 경우 평균과 중앙값이 같습니다. 반면 분포가 한쪽으로 치우친 경우 평균과 중앙값이 달라집니다. 아래 데이터를 봅시다. 100 100 100 150 150 150 150 150 200 200 200 이 데이터는 평균이 150 이고, 중앙값도 150입니다. 이 데이터를 오른쪽 꼬리를 가진 데이터로 바꿔보겠습니다. 오른쪽 꼬리를 가진 데이터는 right-tailed 또는 skewed to right 또는 poistive skewed 라고 부릅니다. 100 100 100 150 150 150 150 150 200 200 2000 이렇게 바꾸었을 때 왜 오른쪽 꼬리를 갖는 것인지 이해가 되지 않는 분들은 히스토그램을 떠올리시면 됩니다. 오른쪽으로 아주 먼 곳인 2000에 막대가 하나 올라와 있게 된.. 2021. 10. 19.
표준편차 vs 평균절대편차 vs 중앙값절대편차 (극단값 민감성 비교) 표준편차, 평균절대편차, 중앙값절대편차는 아래와 같이 정의됩니다. $SD=\sqrt{\frac{\sum_{i=1}^{n}\left ( X_{i}-mean \right )^{2}}{n}}$ $AAD=\frac{ \sum_{i=1}^{n}\left |X_{i}-mean \right |}{n}$ $MAD=MAD=median(X_{i}-median)$ SD : Standard deviation (표준편차) AAD : Average Absolute deviation (평균 절대편차) MAD : Median Absolute deviation (중앙값 절대편차) 극단값에 대한 민감도를 알아보기 위해 두개의 데이터를 정의했습니다. 프로그램은 R을 사용했습니다. > dt1=c(1,2,3,4,5,6,7,8,9,10) > .. 2021. 10. 19.
분산 구하는 변형공식을 표본에도 적용할 수 있을까 분산을 구하는 변형공식을 유도하는 과정은 아래와 같습니다. $V(X)=E\left ( (X-\mu)^{2} \right )=\frac{\sum_{i=1}^{n}(X_{i}-\mu)^{2}}{n}$ $V(X)=E\left ( (X-\mu)^{2} \right )=\frac{\sum_{i=1}^{n}X_{i}^{2}-2X_{i}\mu+\mu^{2}}{n}$ $V(X)=E\left ( (X-\mu)^{2} \right )=\frac{ \sum_{i=1}^{n}X_{i}^{2} -2\mu\sum_{i=1}^{n}X_{i}+ \sum_{i=1}^{n}\mu^{2} }{n}$ $V(X)=E\left ( (X-\mu)^{2} \right )=\frac{ \sum_{i=1}^{n}X_{i}^{2} }{n} + \fra.. 2021. 10. 18.
물가가 2%씩 오르면 10년 뒤 돈의 가치는 얼마나 줄어들까 물가가 두배 오르면 돈의 가치는 반으로 줄어듭니다. 이정도는 계산기를 사용하지 않아도 이해가 가능합니다. 물건의 가격이 A배 올랐을 때의 돈의 가치는, 현재 돈의 액수를 A로 나눠주면 됩니다. 물건 가격이 두배 오르면 2로 나누고, 세배 오르면 3으로 나눠주면 됩니다. 여기까진 이해가 되실겁니다. 물건의 가격이 50% 올랐다고 합시다. 물건 가격이 몇배 오른 것일까요? 1.5배 오른 것입니다. 물건 가격이 5% 오르면 물건 가격은 몇 배 오른 것일까요? 1.05배 오른 겁니다. 돈의 가치는요? 1.05로 나눠주면 됩니다. 물가가 2%씩 10년 올랐다는 것은 물건 가격에 1.02가 10번 곱해졌다는 것을 말합니다. $1.02^{10}$ 배가 된 것입니다. 만원의 가치는 얼마가 되어 있을까요? 만원을 $1... 2021. 10. 12.
로그스케일 그래프는 언제 쓰는걸까? (로그-로그 그래프) 책이나 논문을 읽다 보면 로그스케일 그래프가 나올 때가 있습니다. 로그-로그 그래프라고도 부르는데요. 제가 가장 최근에 본 로그 그래프는 아래 그래프입니다. 「벤 버냉키, 연방준비제도와 금융위기를 말하다」라는 책의 207페이지에 나오는 그래프입니다. 실질 GDP가 매년 3% 정도의 성장률을 보이고 있다는 내용입니다. 기준 년의 GDP를 a, 매년 3%의 성장을 한다면 n년 뒤의 실질 GDP는 아래와 같은 함수로 정의할 수 있습니다. $f(n)=a(1.03)^{n}$ 지수함수입니다. 그래프로 그리려면 세로로 아주아주 긴 그래프가 될 것입니다. 값이 너무 빠르게 커지기 때문입니다. 이런 경우에 양변에 로그를 취하면 선형 그래프로 만들 수 있습니다. $\ln f(n)=n\ln a(1.03)$ 로그 그래프로 그.. 2021. 9. 24.
[손으로 푸는 통계 ver1.0] 77. 표본분산의 분포를 왜 유도했나? 우리는 표본분산의 분포를 유도했습니다. n-1 카이제곱분포입니다. $\frac{n-1}{\sigma^{2}}s^{2} \sim \chi^{2}_{n-1}$ 표본분산의 분포를 유도하기 시작한게 35강입니다. 71강에 완료했으니 37강에 걸쳐 유도한 것입니다. 너무 오랜시간 유도하다 보니 유도 자체가 목적이 되어서 왜 유도한 것인지 잊어버리셨을 것 같습니다. 오늘은 유도한 이유를 다시 설명하며 강의의 방향성을 재정립하려고 합니다. z검정을 배우고 있었습니다. z검정은 표본평균의 분포가 평균을 모평균으로 하고 분산이 모분산/표본크기인 정규분포를 따른다는 성질을 기반으로 합니다. $\bar{X} \sim N\left ( \mu, \frac{\sigma^{2}}{n} \right )$ 문제는 모분산을 모른다는데 .. 2021. 9. 22.
[손으로 푸는 통계 ver1.0] 76. 표본분산의 분포 유도과정 요약 우리는 지난시간까지 표본분산의 분포를 유도했습니다. 크기가 n인 표본분산의 분포는 n-1 자유도 카이제곱분포입니다. $\frac{n-1}{\sigma^{2}}s^{2} \sim \chi^{2}_{n-1}$ 오늘은 유도과정을 간단히 요약해봅시다. 표본분산의 정의에서 출발합니다. $s^{2}=\frac{\sum_{i=1}^{n}\left ( X_{i}-\bar{X} \right )^{2}}{n-1}$ 아래와 같이 변형했습니다. $\frac{n-1}{\sigma^{2}}s^{2}= \left (\frac{X_{1}-\mu}{\sigma} \right )^{2}+ \cdots + \left (\frac{X_{n}-\mu}{\sigma} \right )^{2}- \left (\frac{\bar{X}-\mu}{\f.. 2021. 9. 22.
[손으로 푸는 통계 ver1.0] 75. 표본분산의 분포 유도 (40) 표본분산의 분포 유도 완성 및 오류 수정 우리는 n자유도 카이제곱분포와 적률생성함수를 유도한 상태입니다. $f_{n}(x)=\frac{1}{2^{\frac{n}{2}} \Gamma \left ( \frac{n}{2} \right ) } e^{-\frac{x}{2}} x^{\frac{n}{2}-1}$ $M_{X}(t)= \left ( 1-2t \right )^{-\frac{n}{2}} \quad \left ( t 2021. 9. 22.
반응형