본문 바로가기
v3 | Tableau Deep Dive

[2]-3. 사용자 지정 분할

by VizLab 2019. 10. 4.

태블로에서의 Data Preparation 관련 논의를 계속 이어갑니다

 

첫번째는 데이터 해석기를 활용하여 병합된 셀을 처리했었고,

두번째는 피벗을 이용하여 가로로 길게 있는 데이터셋을 세로로 길게 만들어주었습니다

 

오늘은 사용자 지정 분할 기능을 활용하여 데이터셋을 마지막으로 정리해보겠습니다

 

 

 

We Are Here


[1] Tableau Fundamentals

[2] Data Preparation

   ▪  Data Interpreter

   ▪  Pivot

     Split

   ▪  Data Source Filter

   ▪  Custom SQL

[3] Manipulating Data

[4] Building a Chart

[5] Analytics Pane

[6] Filter

[7] Table Calculation

[8] Parameter

[9] Level of Detail Expressions

[10] Map

[11] Dashboard Rendering

 

 

 

세번째, 사용자 지정 분할 (Custom Split)


이번에 살펴볼 사용자 지정 분할에 대해서도, 티머니 교통카드 데이터를 활용하여 계속 진행하도록 하겠습니다

데이터셋은 여기에서 다운로드 받을 수 있습니다

 

지난 시간까지 정제한 데이터를 한 번 보죠

 

 

피벗의 결과가 피벗 필드명과 피벗 필드 값으로 나타나있습니다

그런데 피벗 필드명에는 시간대와 승/하차 정보가 같이 들어가있습니다, 이것을 각각 분리해내는 작업을 해보겠습니다

 

먼저 피벗 필드명에서 마우스 우클릭 하면 '사용자 지정 분할' 기능을 활용할 수 있습니다

 

 

누르면 다음과 같은 화면이 나오게 되죠

 

 

먼저 첫번째 항목, '구분 기호 사용' 입니다

피벗 필드명의 데이터를 나눌건데(split), 무엇을 기준으로 나눌지를 입력해야합니다

흔히들, 구분자(delimiter)라고 하죠, 바로 그 구분자를 입력해주면 됩니다

 

우리가 가진 데이터셋은 다행히 시간대 정보와 승하차 정보가 스페이스바 한 칸으로 구분되어 있습니다

그래서 스페이스바 한 칸(' ')을 구분 기호로 사용하겠습니다

 

만약 다른 곳에 스페이스바 한 칸이 또 들어가 있으면, 거기서도 데이터가 잘리게 됩니다,

따라서, 구분 기호를 입력할 때 데이터값의 형태를 잘 보고 입력하셔야 원하는 결과물을 얻을 수 있습니다

 

두번째 항목은 '분할 해제' 입니다

말이 왜 이렇게 어렵게 되어있는지 모르겠습니다 -_-

 

위에서 자른 데이터 덩어리 중 무엇 무엇을 가지고 올지 명시해주는 것입니다

첫번째 덩어리만 가지고 올래? 뒤에서부터 두 덩어리만 가지고 올래? 아니면 다 가지고 올래?

이런 것들을 설정해주는 곳입니다

 

우리의 예시는 어떻게 가지고 와야 할까요? 

우리는 시간대와 승/하차 정보 모두 필요합니다

우리가 사용하는 구분 기호 스페이스 바 한 칸을 적용하면, 1번 덩어리는 시간대, 2번 덩어리는 승/하차 정보입니다

둘 다 가지고 와야겠지요

 

따라서, 구분 기호에는 스페이스바 한 칸을 치고, 분할 해제는 모두 선택하면 됩니다

모두 선택이니까 뒤의 숫자는 의미가 없겠죠, 자동으로 비활성화 됩니다

 

정확히 입력했다면 아래와 같이 나와야합니다

 

 

위의 그림에서 피벗 필드명 - 분할 1이 시간대이고, 피벗 필드명 - 분할 2가 승/하차 정보입니다

 

원하는 데이터는 다 나왔습니다, 약간의 정리 작업을 조금 더 해보겠습니다

우선 필드명입니다, 직관적인 필드명으로 바꾸도록 하겠습니다

 

 

필드명을 바꾸길 원하는 필드를 마우스 우클릭하면, '이름 바꾸기' 라는 항목이 보입니다

적절한 필드명으로 바꿔주면 되겠습니다

 

피벗 필드명 - 분할 1도 같은 방법으로 바꾸어주고, 피벗 필드 값도 역시 바꾸어주겠습니다

저는 시간대, 승하차, 인원수, 이렇게 각각의 이름을 붙여주었습니다

 

그리고 더 이상 피벗 필드명 필드는 필요가 없습니다, 이미 빼먹을거를 전부 다 빼먹었죠 :)

그리고 작업일시 필드는 데이터가 언제 만들어졌는지에 대한 정보이므로, 역시 필요 없습니다

 

이럴 경우에는 아래 그림과 같이 마우스 우클릭으로 필드를 숨길 수 있습니다

 

 

그리하여 최종적으로 완성된 데이터셋은 다음과 같습니다

 

 

아주 깔끔하군요 :D

 

 

 

태블로 데스크탑 데이터 정제 패키지의 3번 타자


지금까지 데이터 해석기 - 피벗 - 사용자 지정 분할로 이어지는 태블로에서의 데이터 준비 과정에 대해서 살펴보았습니다

 

사용자 지정 분할 기능은 어떤 값 속에서 일부분만 발췌하여 데이터로 활용하고 싶을 때 쓸 수 있는 기능으로,

데이터를 준비하는 창에서 뿐만 아니라, 실제 데이터를 작업하는 창에서도 많이 활용되는 기능 중 하나입니다

 

아울러 오늘 마지막으로 정리했던 사용자 지정 분할 기능에서는

이름 바꾸기(Rename), 숨기기(Hide)와 같은 부가적인 기능도 함께 익혀보았습니다

유용하게 사용할 수 있으니, 꼭 한 번 챙겨놓으시면 좋겠습니다

 

지금까지 익혔던 세 가지 기법들을 연습할 수 있는 시간을 한 번 가질 것인데,
그 전에 데이터 소스 필터(Data Source Filter)라는 유용한 기능을 하나만 더 소개하고 가겠습니다 :D

 

'v3 | Tableau Deep Dive' 카테고리의 다른 글

[2]-5. Data Prep Hands-On  (1) 2019.10.05
[2]-4. 데이터 원본 필터  (1) 2019.10.05
[2]-2. 피벗  (1) 2019.10.03
[2]-1. 데이터 해석기  (1) 2019.10.03
[1]-3. Level of Detail  (2) 2019.10.02