본문 바로가기
@ 통계 교양/통계 Tips (영상)

데이터를 입력하는 두가지 방법 비교 (엑셀과 SPSS의 데이터 입력방식 비교)

by bigpicture 2019. 8. 26.
반응형

 

 

데이터를 입력하는 두가지 방법 비교 (엑셀과  SPSS의 데이터 입력방식 비교)

 

엑셀에서 남자와 여자키의 발크기를 비교하는 독립표본 t검정을 하려면 데이터를 아래와 같이 입력해야 합니다. 

 

 

엑셀에서는 위 데이터를 아래 빈칸에 입력하여 t검정을 수행합니다. 

 

 

이 데이터가 어떻게 구성되어 있는 것인지, 독립변수와 종속변수 입장에서 살펴봅시다. 

 

데이터가 정리된 형태 때문에 남자키가 독립변수고 여자키가 종속변수인 것 같아 보입니다. X와 Y같은 느낌을 받기 때문입니다. 때문에 t검정의 독립변수와 종속변수 모두 '연속형'이라고 착각합니다. 

 

위 데이터에서 독립변수는 '성별'입니다. 종속변수는 '키'입니다. 행방향으로 독립변수가, 열 방향으로 종속변수가 입력되어 있는 형태입니다. 아래와 같이 이해할 수 있습니다. 

 

 

독립변수(성별) = {남자,여자}

종속변수(키) = {키1, 키2, 키3, ....}

 

SPSS에서는 위와 같은 형태로 자료를 입력하면 독립표본 t검정을 할 수 업습니다. 아래와 같은 형태로 자료를 입력해야 합니다.

 

 

 

 

위와 같은 데이터에서는 첫번째 열이 독립변수이고, 두번째 열이 종속변수입니다. 독립변수가 범주형이라는 것이 한눈에 들어옵니다. 아래와 같이 이해할 수 있습니다. 

 

 

위와 같은 형태로 정리된 데이터를 받아들이는 SPSS는 엑셀과 입력방식이 다릅니다. 검정변수에 '종속변수'를 집단변수에 '독립변수'를 넣어주시면 됩니다. 

 

 

 

한눈에 비교하면 아래와 같습니다. 왼쪽을 행방식, 오른쪽을 열방식이라고 부르겠습니다. (왼쪽이 엑셀, 오른쪽이 SPSS)

 

       

 

왼쪽의 표현방식은 비교하려는 두 데이터를 한눈에 알 수 있지만, 독립변수의 종류가 두개 이상인 경우는 데이터를 하나의 표로 나타낼 수가 없습니다. 예를들어서 독립변수에 나이가 추가됐다고 해봅시다. 50을 기준으로 '이상' 과 '미만' 으로 나눈 데이터입니다. 나이는 연속형 데이터인데, 범위로 구분하여 범주형데이터화시킨 것입니다. 

 

 

엑셀과 같은 방식으로는 아래와 같이 둘로 나눠서 입력할 수 밖에 없습니다. 

 

 

방법의 우열이 있지는 않습니다. SPSS에서도 '대응표본 t검정'의 경우에는 행방식(엑셀)을 사용합니다. 처리 전과 후를 비교할 때는 행방식이 더 직관적이기 때문입니다. 설문조사 결과를 정리할 때는 열방식을 사용합니다. 두 방법의 차이를 알고 상황에 맞게 사용하시면 됩니다. 

 

반응형

댓글