본문 바로가기
v5 | Data Prep

데이터 프렙 챌린지: 용인시 인구 데이터 정리

by VizLab 2022. 2. 14.

Data from 주민등록 인구통계 행정안전부 https://jumin.mois.go.kr/

Challenge Designed by VizLab

 

Input: 첨부파일

202101_202101_연령별인구현황_월간.csv
1.16MB
202102_202102_연령별인구현황_월간.csv
1.16MB
202103_202103_연령별인구현황_월간.csv
1.15MB

 

Output

  • 월별로 csv 파일을 받아서 특정 폴더에 넣으면 최종 데이터셋이 계속해서 업데이트 되는 구조
  • 각 행의 데이터 레벨을 행정동 단위로 통일
  • 월별 / 성별 / 연령대별 / 행정동별 인구 확인  

 

Logic

  • 데이터 로딩과 동시에 유니온 구조 생성
  • 연월 정보 생성
  • 용인시 필터링
  • 열에서의 레벨을 성별 / 연령대별로 통일 (총인구수 등의 상위 개념 제거)*
  • 행정구역 정리 +  행정동 단위로 통일 (경기도 용인시 등의 상위 개념 제거)
  • 데이터 피벗 (새롭게 들어오는 데이터가 자동으로 피벗되도록 설정)
  • 성별 / 연령대별 정보 생성
  • 필드 정리

* 월별 인구 데이터 원본 파일의 필드명이 파일마다 다르기 때문에 Tableau Prep에서는 이 단계를 데이터 피벗 이후에 진행

 

Alteryx

YongIn Population.yxzp
0.37MB

 

Tableau Prep

YongIn Population.tflx
1.08MB