본문 바로가기
@ 통계 교양/통계 Tips

자유도란 무엇이며, 표본과 모집단의 평균과 분산의 자유도는 무엇인가

by bigpicture 2022. 5. 12.
반응형

통계학에서 자유도가 어떻게 정의됐는지 알기 위해 위키피디아의 정의를 가져왔습니다. 

In statistics, the number of degrees of freedom is the number of values in the final calculation of a statistic that are free to vary.

"통계량의 최종 계산에서 자유롭게 바뀔 수 있는 값의 개수"

모집단에서 표본을 뽑아 평균을 구할 때 표본의 원소는 자유롭게 바뀔 수 있습니다. 반드시 얼마여야 한다는 조건이 없습니다. 표본을 뽑을 때마다 달라집니다. n개를 뽑는다면 n개 모두 표본을 뽑을 때마다 자유롭게 바뀔 수 있습니다. 따라서 표본평균의 자유도는 n입니다.  

표본분산의 자유도는 얼마일까요? 표본분산은 표본평균을 알아야 구할 수 있습니다. 표본분산을 구하는 식에 표본평균이 들어 있기 때문입니다. 표본평균이 결정 된 뒤에 표본 분산이 구해집니다. 표본의 크기가 n이고, 표본평균이 구해진 상태라면 n-1개의 값을 자유롭게 바꿀 지라도 마지막 n번째 값은 표본평균에 의해 결정됩니다. 예를 들어 표본평균이 10이고, 표본의 크기가 3이라면 $\frac{a+b+c}{3}=10$ 이 되어야 하므로 세 변수중 하나는 종속적입니다. 따라서 표본분산의 자유도는 n-1 입니다. 

표본 분산을 이용해서 구하는 또 다른 통계량이 있다면 이 통계량은 자유도가 n-2가 됩니다. 표본 평균에서 자유도 하나를 잃고, 표본분산을 구할 때 하나 더 잃기 때문입니다. 

모집단에도 자유도가 있을까요. 모집단이 {1,2,3,4,5} 라고 해봅시다. 모평균을 구한다고 합시다. 이 때 자유롭게 바뀔 수 있는 값이 있나요. 모집단의 원소들은 이미 결정된 값들이라서 변할 자유가 없습니다. 

반응형

댓글