반응형
지난시간에 R에서 데이터를 불러온 상황에서 이어갑시다.
View 함수를 md에 사용해봅시다.
View(md)
변수를 살펴봅시다. 아래와 같이 6개의 변수가 있습니다.
1) 24개 암종
2) 성별
3) 연령군
4) 시점
5) 발생자수[명]
6) 연령군 발생률[명/10만명]
독립변수와 종속변수로 나눠봅시다. 1,2,3,4 는 독립변수이고 5,6은 종속변수입니다. 독립변수는 범주형이라 level이 있습니다. 변수의 level 을 추가하면 아래와 같습니다.
<독립변수>
1) 25 암종 (전체,24암종)
2) 3 성별 (전체,남,여)
3) 19 연령군 (전체,18연령군)
4) 19 시점 (1999~2017)
<종속변수>
5) 발생자수[명]
6) 연령군 발생률[명/10만명]
그릴 수 있는 단순한 그래프의 종류는 54150(25x3x19x19x2)개입니다. 탑다운 방식으로 분석하고 싶었는데 쉽지 않겠네요. 제가 관심있는 그래프부터 그려보아야 겠습니다.
반응형
'@도전! 데이터분석 > 국가통계데이터 - 암' 카테고리의 다른 글
[도전! 데이터 분석 - 암cancer] #3. R 스튜디오에서 데이터 불러오고 다듬기 (0) | 2020.12.24 |
---|---|
[도전! 데이터 분석 - 암cancer] #2. 데이터 다듬기 (0) | 2020.12.24 |
[도전! 데이터 분석 - 암cancer] #1. 프롤로그, 데이터 수집 (0) | 2020.12.23 |
댓글