Resource: Alteryx Weekly Challenge #126
Input: 첨부파일
Output: 각 일자별 국가별로 시험에 합격한 사람수를 기록한 데이터셋이다. 현재는 시험에 합격한 사람이 존재하는 일자에만 합격자수가 기록되어 있다. 이 데이터셋을 2017-10-01부터 2018-07-31 범위의 모든 날짜를 포함하면서 일자별 누적 합격자를 기록한 데이터셋으로 재구성해보자
Logic
- 2017-10-01에서 2018-07-31까지 날짜 생성
- 국가 정보를 결합하여 (국가개수) x (일수)로 행의 개수 뻥튀기
- 뻥튀기 데이터 & 원본 데이터 Left Join 결합
- 합격자수 정제(Null --> 0) 후 누적합계 계산
Alteryx
Tableau Prep
- 동일한 결과를 도출할 수 있지만, 기능상의 한계로 인해 추천하지 않음
- 참고자료: https://www.datablick.com/blog/2020/5/5/running-sum-in-tableau-prep
'v5 | Data Prep' 카테고리의 다른 글
데이터 프렙 챌린지: 아동패널 데이터 정리 (1) (0) | 2022.02.15 |
---|---|
데이터 프렙 챌린지: 용인시 인구 데이터 정리 (0) | 2022.02.14 |
데이터 프렙 챌린지: International Bank of Awesome Data - Part I (0) | 2022.02.11 |
데이터 프렙 챌린지: Where is the party? (0) | 2022.02.09 |
데이터 프렙 챌린지: Women's World Cup Wins (0) | 2022.02.07 |