본문 바로가기
@ 통계 교양/통계 Tips (영상)

복원추출과 비복원추출에 대한 오해

by bigpicture 2020. 4. 15.
반응형

 

 

복원추출과 비복원추출을 잘못 이해하는 경우가 있어서 그 내용을 다뤄보려고 합니다. 제가 그랬었거든요. 

 

추출 방법에는 복원추출과 비복원추출이 있습니다. 아마 아래와 같은 정의를 보셨을 것입니다. 

 

비복원추출 : 한번 뽑은 표본을 모집단에 다시 넣지 않고 다른 표본을 추출

복원추출 : 한번 뽑은 표본을 모집단에 다시 넣고 다른 표본을 추출

 

이 정의 때문에 오해가 발생합니다. 

 

아래 네가지 추출방법 중에서 복원추출과 비복원추출을 구분해보면서, 맞게 이해하고 있는지 확인해봅시다. 크기가 3인 표본을 2개 뽑는 상황을 가정하겠습니다. 

 

1) 모집단에서 원소 3개를 한번에 뽑고 표본 1로 놓음. 원소 3개를 다시 모집단에 돌려놓고, 다시 원소 3개를 한번에 뽑아서 표본 2로 놓음.

 

2) 모집단에서 원소 3개를 한번에 뽑고 표본 1로 놓음. 원소 3개를 모집단에 돌려놓지 않고, 다시 원소 3개를 한번에 뽑아서 표본 2로 놓음.

 

3) 모집단에서 원소 3개를 뽑는데 하나를 뽑고 돌려 놓지 않고 연달아 3개를 뽑아서 표본 1로 놓음. 이 과정을 한번더 반복하고 표본 2로 놓음.

 

4) 모집단에서 원소 3개를 뽑는데 하나를 뽑을 때마다 돌려놓으며 연달아 3개를 뽑아서 표본 1로 놓음. 이 과정을 한번더 반복하고 표본 2로 놓음.

 

1번과 3번이 비복원추출이고, 4번이 복원추출입니다. 위 정의대로 생각하면 1번이 복원추출이고, 2번이 비복원추출이라고 착각할 수 있습니다. 

 

1번과 3번은 달라보이지만 같습니다. 한번에 3개를 뽑는 것과, 하나씩 세개를 뽑는 것은 결국 3개가 비복원으로 뽑힌다는 면에서 같습니다. 1번과 3번을 구분하는 책들도 있습니다. 표본의 원소가 뽑히는 순서에 의미를 두는 경우입니다. 관점의 차이입니다. 

 

복원의 대상이 되는 것은 '표본'이 아니라 표본 안에 있는 '원소'입니다. 하나의 표본을 뽑을 때, 원소들을 복원하고 다시 뽑는지 복원하지 않은 채로 뽑는지에 차이가 있는 것입니다. 

 

정의를 다시 해봅시다. 최대한 오해가 없도록 정의해봤습니다. 

 

비복원추출 : 크기가 n인 표본을 뽑기 위해, n개의 원소를 하나씩 뽑는다. 원소를 하나 뽑을 때마다 복원하지 않고 다음 원소를 뽑는다. n개의 원소를 다 뽑으면 모집단에 돌려놓는다. 

 

복원추출크기가 n인 표본을 뽑기 위해, n개의 원소를 하나씩 뽑는다. 원소를 하나 뽑을 때마다 복원하고 다음 원소를 뽑는다. n개의 원소를 다 뽑으면 모집단에 돌려놓는다. 

 

이 정의가 오해를 줄일 수 있다고 생각합니다. 표본추출에서 원소들을 뽑을 때 복원이 적용되는 것이고, 그래야 복원추출에서 원소들 사이의 독립성이 보장됩니다. 이 독립성이 보장되어야 표본평균의 분산이 모분산/n 이라는 수식을 유도할 수 있습니다.(유도 링크 : https://hsm-edu.tistory.com/16)

 

 

반응형

댓글