복원추출과 비복원추출을 잘못 이해하는 경우가 있어서 그 내용을 다뤄보려고 합니다. 제가 그랬었거든요.
추출 방법에는 복원추출과 비복원추출이 있습니다. 아마 아래와 같은 정의를 보셨을 것입니다.
비복원추출 : 한번 뽑은 표본을 모집단에 다시 넣지 않고 다른 표본을 추출
복원추출 : 한번 뽑은 표본을 모집단에 다시 넣고 다른 표본을 추출
이 정의 때문에 오해가 발생합니다.
아래 네가지 추출방법 중에서 복원추출과 비복원추출을 구분해보면서, 맞게 이해하고 있는지 확인해봅시다. 크기가 3인 표본을 2개 뽑는 상황을 가정하겠습니다.
1) 모집단에서 원소 3개를 한번에 뽑고 표본 1로 놓음. 원소 3개를 다시 모집단에 돌려놓고, 다시 원소 3개를 한번에 뽑아서 표본 2로 놓음.
2) 모집단에서 원소 3개를 한번에 뽑고 표본 1로 놓음. 원소 3개를 모집단에 돌려놓지 않고, 다시 원소 3개를 한번에 뽑아서 표본 2로 놓음.
3) 모집단에서 원소 3개를 뽑는데 하나를 뽑고 돌려 놓지 않고 연달아 3개를 뽑아서 표본 1로 놓음. 이 과정을 한번더 반복하고 표본 2로 놓음.
4) 모집단에서 원소 3개를 뽑는데 하나를 뽑을 때마다 돌려놓으며 연달아 3개를 뽑아서 표본 1로 놓음. 이 과정을 한번더 반복하고 표본 2로 놓음.
1번과 3번이 비복원추출이고, 4번이 복원추출입니다. 위 정의대로 생각하면 1번이 복원추출이고, 2번이 비복원추출이라고 착각할 수 있습니다.
1번과 3번은 달라보이지만 같습니다. 한번에 3개를 뽑는 것과, 하나씩 세개를 뽑는 것은 결국 3개가 비복원으로 뽑힌다는 면에서 같습니다. 1번과 3번을 구분하는 책들도 있습니다. 표본의 원소가 뽑히는 순서에 의미를 두는 경우입니다. 관점의 차이입니다.
복원의 대상이 되는 것은 '표본'이 아니라 표본 안에 있는 '원소'입니다. 하나의 표본을 뽑을 때, 원소들을 복원하고 다시 뽑는지 복원하지 않은 채로 뽑는지에 차이가 있는 것입니다.
정의를 다시 해봅시다. 최대한 오해가 없도록 정의해봤습니다.
비복원추출 : 크기가 n인 표본을 뽑기 위해, n개의 원소를 하나씩 뽑는다. 원소를 하나 뽑을 때마다 복원하지 않고 다음 원소를 뽑는다. n개의 원소를 다 뽑으면 모집단에 돌려놓는다.
복원추출 : 크기가 n인 표본을 뽑기 위해, n개의 원소를 하나씩 뽑는다. 원소를 하나 뽑을 때마다 복원하고 다음 원소를 뽑는다. n개의 원소를 다 뽑으면 모집단에 돌려놓는다.
이 정의가 오해를 줄일 수 있다고 생각합니다. 표본추출에서 원소들을 뽑을 때 복원이 적용되는 것이고, 그래야 복원추출에서 원소들 사이의 독립성이 보장됩니다. 이 독립성이 보장되어야 표본평균의 분산이 모분산/n 이라는 수식을 유도할 수 있습니다.(유도 링크 : https://hsm-edu.tistory.com/16)
'@ 통계 교양 > 통계 Tips (영상)' 카테고리의 다른 글
표본의 크기 vs 표본의 개수 (1) | 2020.11.08 |
---|---|
확률에 왜 질량과 밀도라는 말이 붙어있나 (확률밀도함수, 확률질량함수) (3) | 2020.09.27 |
책을 읽다 그래프에 등장하는 * ** 별표는 어떤 의미일까?? (0) | 2020.07.11 |
p값은 왜 ~보다 큰 쪽의 확률을 보고 판단하는 건가요??" (0) | 2020.04.25 |
상관분석을 할 때 주의할 점(이질적 하위표본 효과) (0) | 2020.02.01 |
양측검정 결과로 나온 유의확률을 단측검정으로 쓰려면 2를 곱해야할까 나눠야할까 (4) | 2019.12.13 |
통계 분야 논문 수, 한국은 몇위일까? (0) | 2019.11.05 |
표준오차가 뭔가요? 표준편차랑 다른건가요? (6) | 2019.10.26 |
댓글