본문 바로가기
v5 | Data Prep

데이터 프렙 챌린지: Fill in the [Date] Gaps

by VizLab 2022. 2. 8.

Resource: Alteryx Weekly Challenge #126

 

Input: 첨부파일

exam.csv
0.00MB

 

Output: 각 일자별 국가별로 시험에 합격한 사람수를 기록한 데이터셋이다. 현재는 시험에 합격한 사람이 존재하는 일자에만 합격자수가 기록되어 있다. 이 데이터셋을 2017-10-01부터 2018-07-31 범위의 모든 날짜를 포함하면서 일자별 누적 합격자를 기록한 데이터셋으로 재구성해보자

 

Logic

  • 2017-10-01에서 2018-07-31까지 날짜 생성
  • 국가 정보를 결합하여 (국가개수) x (일수)로 행의 개수 뻥튀기
  • 뻥튀기 데이터 & 원본 데이터 Left Join 결합
  • 합격자수 정제(Null --> 0) 후 누적합계 계산

 

Alteryx

Challenge126.yxzp
0.00MB

 

Tableau Prep

Challenge126.tflx
0.01MB