본문 바로가기
v3 | Tableau Deep Dive

[2]-2. 피벗

by VizLab 2019. 10. 3.

Dissecting Tableau의 두번째 파트, Data Preparation 과정을 계속 이어가보겠습니다

 

지난 포스트에서는 데이터 해석기를 활용해 병합된 셀 등을 정리해보았습니다

Data Preparation 파트는 처음부터 내용이 이어지는 시리즈물(?)이기 때문에 앞쪽 포스트부터 순차적으로 확인하시면 좋습니다 :D

 

 

 

We Are Here


[1] Tableau Fundamentals

[2] Data Preparation

   ▪  Data Interpreter

   ▪  Pivot

   ▪  Split

   ▪  Data Source Filter

   ▪  Custom SQL

[3] Manipulating Data

[4] Building a Chart

[5] Analytics Pane

[6] Filter

[7] Table Calculation

[8] Parameter

[9] Level of Detail Expressions

[10] Map

[11] Dashboard Rendering

 

 

 

두번째, 피벗(Pivot)


계속해서 티머니 교통카드 데이터셋을 살펴보겠습니다, 여기에서 다운로드 받을 수 있습니다

 

 

태블로 관점에서 이 데이터셋의 세 가지 문제점을 짚었습니다

 

첫째, 시간대가 병합된 셀로 처리되어 있고,

둘째, 시간대가 가로로 길게 붙어 있으며,

셋째, 승/하차가 측정값으로 되어 있어, 차원으로 만들어줘야 합니다

 

이 중 첫번째는 데이터 해석기를 통해 해결했고, 오늘은 두번째 가로로 길게 된 데이터셋을 세로로 만들어주는 작업을 함께 해보겠습니다

 

지난 포스트의 마지막 화면이 다음과 같았지요, 이어서 진행해보겠습니다

 

 

04시대 승차 - 04시대 하차 - 05시대 승차 - 05시대 하차 - ...

이런식으로 시간대가 오른쪽 방향으로 뻗어가고 있습니다

 

가로로 길게 늘어져 있는 시간대를 아래 방향으로 정렬한 후 '시간대'라는 이름을 붙여주려고 합니다

그렇게 해야만 태블로로 데이터를 불러들였을 때 '시간'이라는 요소를 적절히 활용할 수 있습니다

 

먼저 지하철역 필드 바로 옆 4시 필드를 마우스 왼쪽 클릭한 후

시프트키를 누른 채로 제일 마지막 작업일시 바로 옆 3시 필드를 클릭합니다

 

 

 

그러면 위의 그림처럼 4시부터 3시까지 원하는 필드를 한꺼번에 잡을 수 있습니다

 

저 회색 부분 위에서 살짝 마우스 우클릭, 그리고 피벗 클릭

 

 

피벗이 성공적으로 수행되었다면 아래의 그림처럼 보일 것입니다

 

 

'피벗 필드명' 이라는 필드가 생성되었고, 00시 승차 부터 값이 쭉 들어가있습니다
'피벗 필드 값'이라는 필드에는 해당되는 시간대 및 승/하차의 인원수가 들어가있지요

사실 어려운게 아닌데, 이런 개념이 조금 낯설 수도 있으니 간단한 예시로 한 번 풀어보죠

원래의 데이터셋은 아래와 같았습니다

 


여기에 피벗을 적용하면 아래의 그림처럼 변하는 것입니다

 

 

가로로 길었던 원래의 데이터셋이 세로로 길어졌음을 쉽게 확인할 수 있습니다

전혀 어렵지 않죠? :D

 

 

 

태블로 데스크탑 데이터 정제 패키지의 2번 타자


앞선 포스트에서 '데이터 해석기 - 피벗 - (커스텀) 스플릿 - 데이터 원본 필터'는 패키지 개념으로,

복합적으로 사용되는 경우가 많다고 말씀드렸습니다

그 중에서도 저는 피벗 기능을 이 패키지의 핵심 구성요소로 보고 있습니다, 데이터의 구조 자체를 완전히 바꾸어버리는 기능이거든요 

흔히들 볼 수 있는 crosstab 형태의 데이터 구조를, 태블로에서 사용하기 편한 columnar 형태로 바꾸는 것이 바로 피벗입니다!

 

그런데 여기까지 왔다고해서 완벽하다고 보기에는 아직 무리가 있습니다

좋아하는 것과 싫어하는 것을 나타내는 항목을 '호불호'로 묶어내고, 호불호 대상이 되는 아이스크림과 과일을 '대상'으로 발라낼 수 있겠죠

 

바로 이 부분이 다음 포스트에 살펴볼 분할(split) 기능입니다

다음 포스트에서 마지막 분할 기능을 통해 '지하철 시간대별 이용현황'의 정제 작업을 마무리해보겠습니다 :D

 

'v3 | Tableau Deep Dive' 카테고리의 다른 글

[2]-4. 데이터 원본 필터  (1) 2019.10.05
[2]-3. 사용자 지정 분할  (1) 2019.10.04
[2]-1. 데이터 해석기  (1) 2019.10.03
[1]-3. Level of Detail  (2) 2019.10.02
[1]-2. 연속형과 불연속형 (3)  (1) 2019.10.02