본문 바로가기
반응형

통계 강의93

[손으로 푸는 통계 ver1.0] 39. 표본분산의 분포 유도 (4) 자유도가 1인 카이제곱분포의 평균과 분산 36~38강에서 표본분산의 분포는 표준정규분포를 따르는 확률변수의 제곱을 n-1개 더한 분포라는 것을 유도했습니다. 표준정규분포의 제곱의 합의 분포를 단계적으로 유도하기 위해 표준정규분포 1개의 제곱의 분포를 유도했습니다. 이는 자유도 1인 카이제곱분포였습니다. 자유도가 1인 카이제곱분포를 표본분산의 분포로 이용하는 방법을 알아보기 전에 자유도가 1인 카이제곱분포의 평균과 분산을 구해보겠습니다. 먼저 평균을 유도해봅시다. 평균 평균은 아래와 같이 정의됩니다. 아래와 같이 계산할 수 있습니다. 부분적분을 합시다. e^(y/2)을 적분할 것입니다. 빨간항은 0이 됩니다. 2를 약분해줍시다. 적분기호 안은 자유도가 1인 카이제곱분포의 확률밀도함수입니다. 전체구간으로 적분하면 값은 1입니다. 따라서 평균은 1이.. 2020. 4. 27.
[손으로 푸는 통계 ver1.0] 38. 표본분산의 분포 유도 (3) 자유도가 1인 카이제곱분포 유도 36강과 37강에서 아래 수식을 유도했습니다. 우변의 각 항은 표준정규분포를 따르는 변수의 제곱입니다. 따라서 아래와 같이 바꿔쓸 수 있습니다. 2020. 4. 4.
[손으로 푸는 통계 ver1.0] 37. 표본분산의 분포 유도 (2) 표준화 표본분산의 분포를 계속해서 유도해봅시다. 아래는 표본분산의 계산식입니다. 지난시간에 우리는 위 수식을 아래와 같이 변형하였습니다. 우변은 정규분포를 따르는 모집단의 확률변수의 제곱 n개 에서, 정규분포를 따르는 표본평균의 제곱 n개를 뺀 형태입니다. 정규분포보다 표준정규분포가 다루기 쉬우므로, 변형해주겠습니다. 표준화를 할 것입니다. 모집단의 확률변수들은 평균이 모평균 μ 이고 분산이 모분산 σ² 입니다. 표본평균의 평균은 모평균 μ이고, 분산은 모분산을 n으로 나눈 값입니다. 아래와 같이 완전제곱식을 만들게해주는 항을 더하고 빼줍시다. 아래와 같이 꺼내줍시다. 완전제곱식으로 만들어줍시다. 위 식의 파란식들도 완전제곱식으로 만들기 위해 아래와 같이 더하고 뻅시다. 완전제곱식으로 묶고, 소거할 수 있는 항.. 2020. 4. 4.
[손으로 푸는 통계 ver1.0] 36. 표본분산의 분포 유도 (1) 표본분산 수식 변형하기 표본분산의 분포를 유도해봅시다. 일단 시도해보면서 어떤 내용들이 더 필요할지 알아볼 것입니다. 만만치 않은 과정이 될 것 같네요. 평균이 μ 이고 분산이 σ² 인 모집단이 있습니다. 이 모집단에서 뽑을 수 있는 크기가 n인 표본의 표본분산은 아래와 같이 정의됩니다. s² 는 표본분산의 확률변수입니다. 모집단에서 뽑은 수많은 표본분산을 원소로 갖는 집합입니다. 우리가 실제로 표본을뽑는다면, 그 표본을 이 함수에 대입하여 표본분산을 구할 수 있습니다. 확률변수로 놓는 것은 3강에서도 설명한 개념인데요. 이 부분이 이해 안되시는 분들은 댓글을 달아주세요. 많은 분들이 이해를 어려워하시면 더 와닿는 설명을 생각해 보겠습니다. 이제 위 식을 전개해봅시다. 앙변에 n-1을 곱합시다. 시그마와 무관한 식들은 시그마 .. 2020. 4. 1.
[손으로 푸는 확률분포] 다항분포 (5) 독립변수의 개수 (5) 독립변수의 개수 시행의 결과가 A,B,C 세가지인 다항분포에서 독립변수의 개수는 몇개일까요? 세개라고 생각하시는 분들이 아마 계실거 같은데 정답은 2개입니다. 시행의 결과가 두가지인 경우를 생각해봅시다. 시행의 결과는 A, B 두가지이고 n번에 시행에서 각각이 발생한 횟수를 x회와 y회라과 하겠습니다. x와 y가 둘 다 독립변수 같아 보이지만 사실 둘 중 하나만 독립변수입니다. x+y=n 이기 때문에 한 변수가 결정되면 다른 변수는 저절로 정해기디 때문입니다. 위 식에서 y=n-x로 바꿔봅시다. 두 확률의 합도 1이므로, 아래와 같이 변형됩니다. 이항분포가 되었죠? 이항분포는 시행의 결과가 두가지인 다항분포입니다. '이항'이라는 말은 시행의 결과가 '두 가지'라는 뜻입니다. 시행의 결과가 '사건의.. 2020. 2. 11.
[손으로 푸는 통계 ver1.0] 34. 1~33강 요약 손으로 푸는 통계는 't검정의 원리'를 이해하는 강의입니다. t검정,분산분석,회귀분석 등 우리가 접하는 통계기법들의 근본 원리는 동일합니다. t검정을 이해하기 위해서는 꽤 많은 선행 내용이 필요했습니다. 33개의 강의를 진행했고, 곧 t검정이 등장합니다. 이번 강의에서는 지금까지 배운 내용을 요약해봅시다. 1. 평균, 편차, 분산, 표준편차 2. 자유도와 불편추정량 (왜 n-1로 나누나요?) 3. 표본평균의 평균이 모평균과 같은 이유 4. 표본분산의 기댓값이 모분산과 같은 이유 5. 표본평균의 분산이 모분산/n 인 이유(고등학생들 꼭 보세요) 6. E(XY)=E(X)E(Y) 의 성립조건과 증명 7. 크기가 1인 표본평균의 평균과 분산이 모집단과 같은 이유 증명 8. 1~7강 요약(세로영상) 9. 중심극한.. 2020. 2. 10.
[손으로 푸는 통계 ver1.0] 33. 독립표본 Z검정 예제 독립표본 Z검정의 예제를 풀어봅시다. 우리가 핸드폰 케이스를 만드는 공장을 운영한다고 해봅시다. 플라스틱 재료를 구매하기 위해 두 업체와 컨택했습니다. A업체와 B업체라고 하겠습니다. 두 업체에서 같은 소재의 견적을 받았고 가격은 비슷했습니다. 제품에 대한 정보를 받긴 했는데, 직접 강도 테스트를 해보고 싶었습니다. 각 회사로부터 샘플 50개를 받기로 했습니다. 우리는 각 회사로 부터 크기가 50인 표본을 뽑으려는 것입니다. 50개 샘플을 받기 전에, 각 회사의 표본평균의 분포를 알 수 있습니다. (이 부분이 이해가 되셔야 합니다.) 표본의 크기가 충분히 크므로, 중심극한정리에 의해 정규분포를 가정할 수있습니다. 각 회사의 표본평균의 분포는 아래와 같습니다. 각 회사 재료 강도의 분산은 25과 16로 알.. 2020. 1. 26.
[손으로 푸는 확률분포] 다항분포 (1) 소개 (1) 소개 이항분포는 시행의 결과가 두가지입니다. '사건의 발생, 사건이 발생하지 않음' 주사위를 예로 들면 시행의 결과가 아래와 같이 둘로 나뉘는 것입니다. - 6의 눈이 발생 - 6의 눈이 발생하지 않음 시행을 10번 했을 때 6의 눈이 3번 나올 확률 등이 이항분포의 확률에 해당됩니다. 확률을 구하면 아래와 같습니다. 반면에 다항분포는 시행의 결과가 셋 이상입니다. 주사위를 예로 들면 시행의 결과가 아래와 같이 나뉘는 경우가 다항분포가 됩니다 - 1의 눈이 발생 - 2이상 4이하의 눈이 발생 - 5의 눈이 발생 - 6의 눈이 발생 시행을 10번 했을 때 1의 눈이 3번, 2이상 4이하 눈이 5번, 5의 눈이 1번, 6의 눈이 1번 나올 확률이 다항분포에 해당됩니다. 확률을 구하면 아래와 같습니다... 2020. 1. 12.
[손으로 푸는 통계 ver1.0] 31. 특성함수를 이용한 두 확률변수 차의 분포함수 유도 (2) 정규분포의 특성함수 우리는 2표본 z검정을 공부하고 있습니다. 두 모집단의 평균을 비교하는 검정입니다. 중심극한정리를 이용하여 두 모집단의 표본평균이 정규분포를 따른다고 가정했습니다. 두 집단의 표본평균의 분포는 아래와 같습니다. 표본평균의 차이를 Y라고 놓고, Y의 분포를 유도하기로 했는데요. Y의 분포를 유도하는 방법은 세가지가 있었습니다. 1) 특성함수 2) 컨볼루션 적분 3) 기하적인 방법 원래 세가지를 다 다루려고 했는데요. 내용이 또 산으로 갈 것 같아서, 1번을 이용해서 유도하고 빨리 진행하기로 했습니다. 수학적인 다양한 접근방법들은 나중에 따로 강의를 만들어 다루도록 하겠습니다. 특성함수를 이용하여 유도하기로 했습니다. 지난시간에 특성함수가 무엇인지 배웠구요. 오늘은 정규분포의 특성함수를 구해볼겁니다. 두 모.. 2020. 1. 12.
[손으로 푸는 통계 ver1.0] 30. 특성함수를 이용한 두 확률변수 차의 분포함수 유도 (1) 특성함수란? 지난시간까지 2표본 z검정의 원리를 알아보았습니다. 2표본 z검정을 하기 위해, 정규분포를 따르는 두 확률변수의 차의 분포를 유도해야합니다. 두 확률변수는 아래와 같습니다. 두 확률변수의 차는 아래와 같습니다. Y의 분포를 유도해야하는데요. 특성함수를 이용하여 유도하겠습니다. 특성함수는 확률밀도함수에 '퓨리에 변환'을 적용한 함수입니다. 퓨리에변환은 아래와 같습니다. 퓨리에 변환은 시간에 대한 함수를 주파수성분으로 분해해주는 역할을 하는데요. 공대생 분들은 '공업수학'에서 보셨을겁니다. 퓨리에 변환을 통계학의 확률밀도함수 f(x)에 적용했더니 재밌는 일이 벌어졌습니다. 익숙한 모양입니다. 기댓값을 구하는 수식이 됩니다. 따라서 아래와 같은 의미를 갖습니다. 통계학에서 특별하게 사용될 함수이므로, 함수의 .. 2020. 1. 6.
[손으로 푸는 통계] 29. 2표본 z검정 (2) 원리 우리는 아래와 같은 두 모집단의 평균을 비교하고 있습니다. 모집단의 평균을 알지 못하기 때문에 표본을 하나씩 뽑았습니다. 그림으로 나타내면 아래와 같습니다. 이제 우리는 두 모집단의 평균을 통계적으로 비교할 방법을 찾아야 합니다. 우리에게 주어진 것들은 아래와 같습니다. 1) 각 모집단의 분산 ($\sigma_{A}^2$, $\sigma_{B}^2$) 2) 각 모집단의 표본평균의 분포 $f\left ( \bar{X}_{A} \right )=\frac{1}{\sqrt{2\pi}\frac{\sigma_{A}}{\sqrt{n}}}e^{-\frac{\left ( \bar{X}_{A}-\mu_{A} \right )^2 }{2\frac{\sigma_{A}^2}{n}}}$ $f\left ( \bar{X}_{B} \r.. 2020. 1. 4.
[손으로 푸는 확률분포] 푸아송분포 (2-2) 미분방정식으로 유도 ② 유도 (2-2) 미분방정식으로 유도 ② 유도 지난시간에 세개의 식을 유도했습니다. 본격적으로 푸아송분포를 유도합시다. 길냥이 예제를 이어서 사용하겠습니다. 아래와 같은 확률을 정의해봅시다. 이 확률은 t+Δt 라는 시간동안 길냥이를 x번 만날 확률입니다. 이 확률은 아래와 같이 다른 두 확률의 곱으로 표현할 수 있습니다. t+Δt 라는 시간동안 길냥이를 x번 만날 확률은 t라는 시간동안 x번 만나고 이후 Δt라는 시간동안 0번 만날 확률과 t라는 시간동안 x-1번 만나고 이후 Δt라는 시간동안 1번 만날 확률의 합과 같습니다. 1,2번식(맨 위 빨간식)을 대입하여 정리합시다. 전개하겠습니다. 이항하여 아래와 같이 정리합시다. Δt로 양변을 나눠줍시다. Δt를 0으로 보내면 아래와 같은 미분방정식이 됩니다. 이.. 2019. 11. 7.
[손으로 푸는 확률분포] 푸아송분포 (2-2) 미분방정식으로 유도 ① 준비 (2-2) 미분방정식으로 유도 ① 준비 지난시간에는 이산확률분포를 이용하여 포아송분포를 유도했는데요. 이번에는 미분방정식을 세워서 포아송분포를 유도해보겠습니다. 푸아송분포 첫번째 시간에 소개한 예시를 떠올려봅시다. 24시간 동안 길냥이를 만날 확률분포를 포아송분포의 예로 들었습니다. 길냥이를 만나는 사건이 최대 1번 일어날 수 있을 만큼 작은 시간을 Δt 라고 놓읍시다. Δt 라는 시간 동안 길냥이를 만날 사건이 1번 일어날 확률을 아래와 같이 놓겠습니다. 이 확률은 Δt에 비례할 것입니다. Δt가 길 수록 길냥이를 만날 확률이 높아질 것이기 때문입니다. 따라서 아래와 같이 놓을 수 있습니다. 비례상수를 k라고 합시다. 이때, Δt 동안 길냥이를 만나지 않을 확률은 아래와 같습니다. 전체확률이 1이므로 .. 2019. 11. 5.
중심극한정리 시뮬레이션해볼 수 있는 사이트 중심극한정리 시뮬레이션해볼 수 있는 사이트 중심극한정리는 모집단이 어떤 분포인지와 상관 없이 '표본의 크기'가 충분히 크다면 표본평균들의 분포가 정규분포를 따른다는 정리입니다. 자세한 설명은 아래 링크를 참조해주세요. 중심극한정리 설명(https://hsm-edu.tistory.com/21) 중심극한정리를 시뮬레이션해볼 수 있는 사이트를 소개해드리려고 합니다. 아래 링크로 들어가시면 됩니다. http://www.ltcconline.net/greenl/java/Statistics/clt/cltsimulation.html 링크로 들어가시면 아래와 같은 화면이 뜹니다. 먼저 모집단의 분포를 선택할 수 있습니다. 분포들의 모양은 아래와 같습니다. 왼쪽 위부터 uniform, Skewed Left, Skewed .. 2019. 8. 25.
정규성검정 KS test (1) Andrey Kolmogorov 드디어 정규성검정에 대한 공부가 시작되었습니다. Q-Q plot도 정규성 검정으로 사용되기는 하지만 정성적인 방법이므로, 정량적인 방법은 이번 강의부터 설명하는 것입니다. 제가 앞으로 설명드릴 정량적인 방법은 아래의 다섯가지입니다. 1. Kolmogorov-Smirnov test (KS test) 2. Lilliefors test (LF test) 3. Cramer-von Mises test (CVM test) 4. Anderson-Darling test (AD test) 5. Shapiro-Wilk test (SW test) 앞으로는 약어(abbreviation)를 사용하도록 하겠습니다. KS 검정을 먼저 공부할 것인데요. 검정의 원리를 설명하기 전에 검정 방법을 만든 사람들에 대한 소개를 하려고 합니.. 2018. 11. 24.
Q-Q plot 그리는 법 (5) 정규분포와의 비교 이번 시간에는 데이터를 정규분포와 비교할 수 있는 Q-Q plot을 그려보겠습니다. '정규성 검정'의 기능을 하는 Q-Q plot입니다. 먼저 데이터를 하나 생성합시다. Data1 : 24, 28, 37, 43, 46 이제 Data1의 확률 분위수 그래프를 그리고, 같은 확률의 분위수를 정규분포에서 찾아주시면 됩니다. 원리는 앞의 방법과 동일한데 주의할 점이 하나 있습니다. Type7를 예를들어봅시다. Data1의 Type7 그래프를 그리면 아래와 같습니다. 오른쪽에는 표준정규분포의 역누적분포함수를 그리겠습니다. data1의 각 값들을 분위수로 하는 확률은 0, 0.25, 0.5, 0.75, 1입니다. 문제가 뭔지 아시겠죠? 표준정규분포 누적분포함수의 역함수에서는 확률이 0과 1인 곳에서 그 값이 존재하.. 2018. 11. 18.
Q-Q plot 그리는 법 (4) 크기가 다른 두 데이터의 Q-Q plot 이번 시간에는 크기가 다른 두 데이터의 Q-Q plot을 그려봅시다. 먼저 두 데이터를 생성합시다. Data1 : 24, 28, 37, 43, 46 Data2 : 15, 18, 23, 33, 45, 48, 50 두 데이터 각각의 확률-분위수 그래프를 먼저 그리겠습니다. 몇 번 type으로 그릴지를 정해야합니다. 어떤 타입도 선택할 수 있는데 type7로 하겠습니다(R의 디폴트입니다). 그래프를 그리면 아래와 같습니다. 개수가 적은 쪽에 맞춰서 대응시킵니다. Data1의 데이터에 대응되는 확률은 0, 0.25, 0.5, 0.75, 1입니다. 이 확률에서의 분위수 값을 Data2그래프에서 찾으면 됩니다. 계산하면 아래와 같습니다. 15, 20.5, 33, 46.5, 50 Data1과 2의 분위수를 이용하여 .. 2018. 11. 14.
Q-Q plot 그리는 법 (3) 크기가 같은 두 데이터의 Q-Q plot 지난 강의에서 Q-Q plot의 원리에 대해서 알아보았습니다. 오늘은 실제 예시를 통해 직접 그려보도록 하겠습니다. 아래와 같이 크기가 같은 두 데이터를 예로 들겠습니다. Data 1 : 24,28,37,43,46 Data 2 : 14,17,23,44,57 각각을 순위 또는 순서를 이용해서 표현해봅시다. Data 1 : x1, x2, x3, x4, x5 Data 2 : x1, x2, x3, x4, x5 만약 이 순서로 확률-분위수 그래프를 그린다면, 두 데이터에서 동일한 그래프가 그려질 것입니다. type에 상관없이 같아집니다. 따라서 x1에 해당되는 24와 14에 해당되는 확률이 같습니다. 24와 14가 같은 분위수라는 것입니다. 이와 동일한 이유로 28과 17, 37과 23, 43과 44, 46과 5.. 2018. 11. 13.
Q-Q plot 그리는 법 (2) 원리 Q-Q plot의 원리 지난시간에 '역누적분포함수'가 확률-분위수함수와 동일하다는 것을 배웠습니다. 오늘은 '역누적분포함수'를 이용해서 Q-Q plot의 원리를 설명하겠습니다. 두 집단이 있다고 해봅시다. 집단 A와 집단 B입니다. 집단 A의 역누적분포함수를 A(x), 집단 B의 역누적분포함수를 B(x)라고 합시다. 변수 x는 확률입니다. 두 집단의 분포가 같다면 아래 등식이 성립합니다. 두 집단이 같은 분포를 따른다는 것은 한 집단의 선형변환을 통해 다른 집단을 만들 수 있다는 것입니다. 여러분이 알고 계신 여러 분포들(정규분포, 지수분포, 카이제곱분포 등)을 선형 변환해보시면 이해가 되실 겁니다. 이 원리를 이용하면 분위수 끼리도 선형관계를 갖는다는 것을 알 수 있습니다. 그래프로 그리면 아래와 같습.. 2018. 11. 12.
Q-Q plot 그리는 법 (1) 역누적분포함수 Q-Q plot의 목적 Q-Q plot은 Quantile-Quantile plot의 줄임말입니다. 분위수-분위수 그래프라는 뜻이구요. 두 데이터의 분위수를 그래프로 그리는 것입니다. 두 데이터의 분위수를 그려서 뭘 하고싶은 걸까요? Q-Q plot의 목적은 '분포 비교'입니다. 어떤 원리로 비교하는 것일까요? 역누적분포함수 Q-Q plot의 원리를 이해하려면 먼저 '역누적분포함수'를 알아야 합니다. 우리가 이미 알고 있는 정규분포함수로 시작해서 접근해 봅시다. 정규분포함수는 '확률밀도함수'입니다. x축이 변수(키,몸무게 등), y축이 확률밀도값입니다. 정규분포함수를 f(x)라고 했을 때, 누적분포함수 F(x)를 아래와 같이 정의할 수 있습니다. 이때 F(x) 값은, x 이하인 데이터의 비율(또는 x보다 .. 2018. 11. 8.
분위수 구하는 9가지 방법을 공부한 이유 11강에 걸쳐서 분위수에 대해 공부했습니다. 분위수 설명에 많은 강의를 사용했기 때문에, 흐름을 놓친 분을 위해 분위수를 공부한 이유에 대해 되짚어보려고 합니다. 정규성검정의 한 방법으로 Q-Q plot을 소개할 때 분위수가 등장했습니다. Q-Q plot의 full name은 quantile-quantile plot으로 이름 자체에 분위수를 담고 있습니다. QQ plot을 그릴 때, 두 데이터의 분위수를 각각 x축 y축에 나타내고 좌표평면에 점을 찍습니다. QQ plot을 손으로 그려보기 위해 분위수를 공부하게 되었고 분위수를 구하는 방법이 9가지나 된다는 것을 알게 되었습니다. 위키피디아에 quantile을 검색하면 나옵니다. (https://en.wikipedia.org/wiki/Quantile) 분.. 2018. 11. 6.
분위수(Quantile)를 구하는 9가지 방법(#11. Type9 방법) 통계패키지(R,점유율1위)에서 사용하는 분위수 계산방법에는 9종류가 있습니다. 이전 강의에서 언급했듯이 Type 1~3은 불연속 변수를 대상으로 하고, Type4~9는 연속 변수를 대상으로 합니다. 오늘은 불연속변수의 분위수 계산 방법인 Type 1~3을 가지고 분위수 계산을 해봅시다. 불연속 변수의 경우 '보간'을 사용하지 않고 샘플 중에서 분위수를 선정합니다. Type8 계산 방법 분위수라는 것은 결국 어떤 확률 p 위치에 있는 수가 무엇인지를 구하는 것입니다. 예를들어 4분위수는 확률 0.25,0.5,0.75 위치의 수를 구하는 것입니다. 따라서 아래와 같이 확률을 변수로 하는 분위수 값의 그래프를 그릴 수 있다면 어떤 분위수든 바로 계산이 가능해집니다. Q9(p)를 타입9의 방법으로 구한 분위수라.. 2018. 11. 6.
분위수(Quantile)를 구하는 9가지 방법(#10. Type8 방법) 통계패키지(R,점유율1위)에서 사용하는 분위수 계산방법에는 9종류가 있습니다. 이전 강의에서 언급했듯이 Type 1~3은 불연속 변수를 대상으로 하고, Type4~9는 연속 변수를 대상으로 합니다. 오늘은 불연속변수의 분위수 계산 방법인 Type 1~3을 가지고 분위수 계산을 해봅시다. 불연속 변수의 경우 '보간'을 사용하지 않고 샘플 중에서 분위수를 선정합니다. Type8 계산 방법 분위수라는 것은 결국 어떤 확률 p 위치에 있는 수가 무엇인지를 구하는 것입니다. 예를들어 4분위수는 확률 0.25,0.5,0.75 위치의 수를 구하는 것입니다. 따라서 아래와 같이 확률을 변수로 하는 분위수 값의 그래프를 그릴 수 있다면 어떤 분위수든 바로 계산이 가능해집니다. Q8(p)를 타입8의 방법으로 구한 분위수라.. 2018. 11. 1.
분위수(Quantile)를 구하는 9가지 방법(#9. Type7 방법) 통계패키지(R,점유율1위)에서 사용하는 분위수 계산방법에는 9종류가 있습니다. 이전 강의에서 언급했듯이 Type 1~3은 불연속 변수를 대상으로 하고, Type4~9는 연속 변수를 대상으로 합니다. 오늘은 불연속변수의 분위수 계산 방법인 Type 1~3을 가지고 분위수 계산을 해봅시다. 불연속 변수의 경우 '보간'을 사용하지 않고 샘플 중에서 분위수를 선정합니다. Type7 계산 방법 분위수라는 것은 결국 어떤 확률 p 위치에 있는 수가 무엇인지를 구하는 것입니다. 예를들어 4분위수는 확률 0.25,0.5,0.75 위치의 수를 구하는 것입니다. 따라서 아래와 같이 확률을 변수로 하는 분위수 값의 그래프를 그릴 수 있다면 어떤 분위수든 바로 계산이 가능해집니다. Q7(p)를 타입7의 방법으로 구한 분위수라.. 2018. 10. 29.
분위수(Quantile)를 구하는 9가지 방법(#8. Type6 방법) 통계패키지(R,점유율1위)에서 사용하는 분위수 계산방법에는 9종류가 있습니다. 이전 강의에서 언급했듯이 Type 1~3은 불연속 변수를 대상으로 하고, Type4~9는 연속 변수를 대상으로 합니다. 오늘은 불연속변수의 분위수 계산 방법인 Type 1~3을 가지고 분위수 계산을 해봅시다. 불연속 변수의 경우 '보간'을 사용하지 않고 샘플 중에서 분위수를 선정합니다. Type6 계산 방법 분위수라는 것은 결국 어떤 확률 p 위치에 있는 수가 무엇인지를 구하는 것입니다. 예를들어 4분위수는 확률 0.25,0.5,0.75 위치의 수를 구하는 것입니다. 따라서 아래와 같이 확률을 변수로 하는 분위수 값의 그래프를 그릴 수 있다면 어떤 분위수든 바로 계산이 가능해집니다. Q6(p)를 타입6의 방법으로 구한 분위수라.. 2018. 10. 25.
분위수(Quantile)를 구하는 9가지 방법(#7. Type5 방법) 통계패키지(R,점유율1위)에서 사용하는 분위수 계산방법에는 9종류가 있습니다. 이전 강의에서 언급했듯이 Type 1~3은 불연속 변수를 대상으로 하고, Type4~9는 연속 변수를 대상으로 합니다. 오늘은 불연속변수의 분위수 계산 방법인 Type 1~3을 가지고 분위수 계산을 해봅시다. 불연속 변수의 경우 '보간'을 사용하지 않고 샘플 중에서 분위수를 선정합니다. Type5 계산 방법 분위수라는 것은 결국 어떤 확률 p 위치에 있는 수가 무엇인지를 구하는 것입니다. 예를들어 4분위수는 확률 0.25,0.5,0.75 위치의 수를 구하는 것입니다. 따라서 아래와 같이 확률을 변수로 하는 분위수 값의 그래프를 그릴 수 있다면 어떤 분위수든 바로 계산이 가능해집니다. Q5(p)를 타입5의 방법으로 구한 분위수라.. 2018. 10. 23.
분위수(Quantile)를 구하는 9가지 방법(#6. Type4 방법) 통계패키지(R,점유율1위)에서 사용하는 분위수 계산방법에는 9종류가 있습니다. 이전 강의에서 언급했듯이 Type 1~3은 불연속 변수를 대상으로 하고, Type4~9는 연속 변수를 대상으로 합니다. 오늘은 불연속변수의 분위수 계산 방법인 Type 1~3을 가지고 분위수 계산을 해봅시다. 불연속 변수의 경우 '보간'을 사용하지 않고 샘플 중에서 분위수를 선정합니다. Type4 계산 방법 분위수라는 것은 결국 어떤 확률 p 위치에 있는 수가 무엇인지를 구하는 것입니다. 예를들어 4분위수는 확률 0.25,0.5,0.75 위치의 수를 구하는 것입니다. 따라서 아래와 같이 확률을 변수로 하는 분위수 값의 그래프를 그릴 수 있다면 어떤 분위수든 바로 계산이 가능해집니다. Q4(p)를 타입4의 방법으로 구한 분위수라.. 2018. 10. 22.
분위수(Quantile)를 구하는 9가지 방법(#2~5. Type1~3 방법) 통계패키지(R,점유율1위)에서 사용하는 분위수 계산방법에는 9종류가 있습니다. 이전 강의에서 언급했듯이 Type 1~3은 불연속 변수를 대상으로 하고, Type4~9는 연속 변수를 대상으로 합니다. 오늘은 불연속변수의 분위수 계산 방법인 Type 1~3을 가지고 분위수 계산을 해봅시다. 불연속 변수의 경우 '보간'을 사용하지 않고 샘플 중에서 분위수를 선정합니다. Type1 계산 방법 (올림 round up) 분위수라는 것은 결국 어떤 확률 p 위치에 있는 수가 무엇인지를 구하는 것입니다. 예를들어 4분위수는 확률 0.25,0.5,0.75 위치의 수를 구하는 것입니다. 따라서 아래와 같이 확률을 변수로 하는 분위수 값의 그래프를 그릴 수 있다면 어떤 분위수든 바로 계산이 가능해집니다. Q1(p)를 타입1.. 2018. 9. 26.
대표적인 정규성검정 방법 소개 (6가지) 대표적인 정규성 검정 방법에는 여섯가지가 있습니다. 1. Quantile-Quantile plot (QQ-plot) 2. Kolmogorov-Smirnov test (KS test) 3. Lilliefors test (LF test) 4. Cramer-von Mises test (CVM test) 5. Anderson-Darling test (AD test) 6. Shapiro-Wilk test (SW test) 앞으로 진행되는 강의에서 위 검정들을 하나씩 유도하며 원리를 이해할 계획입니다. 이번 강의에서는 몇가지 특징만 간단히 설명하고 넘어가겠습니다. QQ plot의 경우 p-value 를 계산해주지는 않기 때문에 정량적인 판단은 불가능하고, 육안으로 정성적인 확인만 가능합니다. 나머지 검정방법들은 p.. 2018. 8. 6.
[손으로 푸는 통계] 23. 통계적 가설 검정 감잡기 3 (유의수준 α, 유의확률 p-value) 오늘은 가설검정에서 사용되는 중요한 개념인 유의수준과 유의확률에 대해 배워볼 것입니다. 그 전에 지난 시간에 배운 내용을 간단히 복습하고 오늘 내용을 배워봅시다. 어떤 사람이 모집단의 평균이 $\mu$ 라고 주장하고 있습니다. 우리는 아니라고 생각합니다. 이를 밝혀내기 위해 두 가지 가설을 세웠습니다. 귀무가설 : $E[\bar{X}]=\mu$ (기존의 주장) 대립가설 : $E[\bar{X}] \neq \mu$ (기존의 주장에 반대하는 우리의 주장) 기존의 주장이 맞다고 가정하고 진행하겠습니다. 평균이 $\mu$인 모집단에서 크기가 n인 표본평균 분포함수를 정의했습니다. 표본을 뽑지 않아도 분포함수를 정의할 수 있다는 것을 이미 배웠습니다. 아래와 같습니다. $\bar{X} \sim N \left ( \.. 2018. 5. 16.
반응형