반응형
평균, 중앙값, 최빈값은 자료를 하나의 값으로 요약해주는 대푯값입니다. 우리는 이러한 대푯값들을 자료의 종류와 상황에 알맞게 선택하여 사용해야 합니다.
자료는 수치형 자료와 범주형자료로 나눌 수 있습니다. 수치형자료는 숫자로 되어있는 자료입니다. 수치형자료의 대푯값으로는 평균과 중앙값이 사용됩니다.
범주형 자료의 대표적인 예시로는 성별이 있습니다.
아래와 같은 범주형 자료가 있다고 합시다.
남 남 남 여 여 여 여 여 여 여
이 자료에 평균이나 중앙값을 적용하는 것은 불가능합니다. 범주형 자료에서는 최빈값을 대푯값으로 사용할 수 있습니다. 위 데이터의 최빈값은 '여자'입니다.
다른 예시를 하나 더 살펴봅시다. 어떤 반 아이들에게 선호하는 직업을 조사했다고 합시다. 가장 많은 아이들이 선택한 직업이 아이들이 가장 선호하는 직업일 것입니다.
따라서 가장 선호하는 직업은 최빈값으로 계산됩니다.
반응형
'@ 통계 교양 > 통계 Tips' 카테고리의 다른 글
표준화 회귀계수가 뭔가요? (0) | 2023.10.25 |
---|---|
다중회귀분석에서 왜 수정된 결정계수를 사용하는가? (0) | 2023.10.24 |
표본 크기가 커지면 정규성을 따르지 않는 문제 (0) | 2023.09.19 |
머신러닝과 데이터마이닝의 차이 (0) | 2023.08.01 |
모집단이 정규분포를 따르면 표본평균은 항상 정규분포를 따를까? (0) | 2023.01.14 |
정규분포를 따르는 확률변수의 합의 분포 (0) | 2023.01.14 |
평균이 좋은 대푯값이 아닌 경우 (0) | 2023.01.12 |
표본의 크기 결정 방법 수식 설명 및 유도 (0) | 2023.01.11 |
댓글