본문 바로가기
@도전! 데이터분석/국가통계데이터 - 암

[도전! 데이터 분석 - 암cancer] #4. 변수 파악하기

by bigpicture 2020. 12. 24.
반응형

지난시간에 R에서 데이터를 불러온 상황에서 이어갑시다. 

 

 

View 함수를 md에 사용해봅시다. 

 

View(md)

 

 

변수를 살펴봅시다. 아래와 같이 6개의 변수가 있습니다. 

 

1) 24개 암종
2) 성별
3) 연령군
4) 시점
5) 발생자수[명]
6) 연령군 발생률[명/10만명]

 

독립변수와 종속변수로 나눠봅시다. 1,2,3,4 는 독립변수이고 5,6은 종속변수입니다. 독립변수는 범주형이라 level이 있습니다. 변수의 level 을 추가하면 아래와 같습니다. 

 

<독립변수>

1) 25 암종 (전체,24암종)
2) 3 성별 (전체,남,여)
3) 19 연령군 (전체,18연령군)
4) 19 시점 (1999~2017)

 

<종속변수>
5) 발생자수[명]
6) 연령군 발생률[명/10만명]



그릴 수 있는 단순한 그래프의 종류는 54150(25x3x19x19x2)개입니다. 탑다운 방식으로 분석하고 싶었는데 쉽지 않겠네요. 제가 관심있는 그래프부터 그려보아야 겠습니다. 

반응형

댓글