본문 바로가기
v3 | Tableau Deep Dive

[1]-2. 연속형과 불연속형 (2)

by VizLab 2019. 10. 2.

오늘은 연속형 vs. 불연속형 관련 논의를 조금 더 이어가보고자 합니다

연속형과 불연속형을 이야기하다보면 꼭 나오는 질문 중에 하나가 이것인 것 같습니다

 

"결국 연속형은 측정값, 불연속형은 차원 아닌가요?"

 

오늘은 이 질문에 대해 태블로는 어떻게 답하고 있는지 살펴보도록 하죠

 

 

 

측정값은 연속형, 차원은 불연속형?


태블로를 처음 접하는 기초 수준의 사용자를 대상으로 교육할 때는 그렇게 이해해도 된다고 말씀드립니다

 

실제로 많은 경우 그렇긴 하지만, 100% 사실은 아닙니다

 

Joe Mako는 태블로 화면에서 보여지는 필드들을 다음과 같이 네 가지로 분류하였습니다

 

 

특정 필드는 첫번째 포스트에서 살펴본 것처럼 차원과 측정값으로 나누어지고,

차원과 측정값은 각각 연속형과 불연속형으로 각각 구분되고 있습니다

 

우리에게 익숙한 개념이

Dimension - Discrete (Region), Measure - Continuous (SUM(Sales)) 이어서 그렇지,

Dimension - Continuous와 Measure - Discrete 이 없는게 아닙니다

 

정리하면, 측정값은 연속형, 차원은 불연속형이다, 이 문장은 틀렸습니다

 

 

 

연속형 차원 - Continuous Dimension


(1) 우리에게 조금 덜 익숙한 두 가지 개념 중 먼저 연속형 차원에 대해 확인해보겠습니다

 

먼저 수량(Quantity)을 불연속형(Blue Pill) 차원으로 열 선반에 올렸습니다

아래 그림에서 확인되듯이 매출이 수량에 따라 분기되어 있는 화면을 볼 수 있지요

 

 

수량이 불연속형으로 올라갔기 때문에 다음과 같은 사항들을 체크할 수 있습니다

 

▪  마크 카드에서의 자동 차트 타입이 바 차트,

▪  차트의 위쪽에 Quantity 레이블,

▪  아래쪽의 1, 2, ..., 14는 축이 아니라 각각의 레이블로 표시되어 있습니다

 

수량을 연속형으로 올리면 위의 그림과 어떻게 다를까요?

 

 

대비되는 결과를 중심으로 살펴보죠

 

▪  마크 카드에서의 자동 차트 타입은 라인 차트,

▪  차트 아래쪽에 Quantity 축제목,

▪  아래쪽의 0, 1, ..., 15는 레이블이 아니라, 축의 눈금선으로 표시됩니다 

 

결론을 내려보면 측정값을 불연속형으로 올리나, 연속형으로 올리나,

표현하는 방식에서 약간의 차이를 보일 뿐 차트가 말하고자 하는 바가 크게 달라지지는 않는 것 같습니다

또한 마크 카드의 자동 차트 타입은 강제로 바꿔줄 수 있는 것이어서,

Quantity를 어떤 형태로 올리든지 - 연속형이든 불연속형이든 -, 비슷한 모양의 차트를 만들어낼 수 있습니다 

 

 

 

불연속형 측정값 - Discrete Measure


(2) 이번에는 조금 더 애매한(?) 불연속형 측정값에 대해 살펴보죠

 

아래와 같이 계산된 필드를 통해 Profitability를 만들었더니 (왼쪽 그림),

Profitability 필드는 문자열을 의미하는 ABC로 표시되었고, 측정값에 들어갔습니다 (오른쪽 그림)

잘못 분류되었거니 싶어서, 끌어다 차원으로 올려봐도, 올라가지가 않습니다

 

 

버그인가...? 그렇진 않겠죠...?

 

Michael Treadwell은 이와 같은 필드가 - 차원이 아니라 - 측정값임을 두 가지 이유로 설명하고 있습니다

 

첫째, 이런 필드는 집계된 측정값 - 위의 예시에서는 합계 - 상응하는 문자열이라는 것입니다

(a string value that corresponds to a specific aggregate value)

 

즉, Profitability 문자열 필드는 결국 Profit의 합계(SUM(Profit))에 대한 레이블일 뿐, 본질은 SUM(Profit)이라는 것이죠

 

둘째, 특정 차원에 의해 분기될 있는 - 변할 있는 - 값이라는 것입니다

Profit을 Category로 분기하고, Profitability를 체크해보았습니다

 

 

모두 'Profitable' 값을 가집니다

이번에는 Profit을 Category & Sub-Category로 분기하고, Profitability를 체크해보았습니다

 

 

각 Sub-Category에 따라 Profit이 다르게 나타나고 있으며,

이에 따라 Profitability도 조건에 맞추어 - 10,000보다 크거나 작거나 - 다르게 나타나고 있습니다

 

정리해보면 Profitability 필드는 화면의 Level of Detail 따라 값이 변하고 있습니다

View LOD 따라 값이 변하는 특성은, 차원이 아니라 측정값에서 나타나는 것이지요 :D

(Level of Detail에 대해서는 다음 토픽에서 상세히 살펴봅니다)

 

참고로 하나의 테스트만 더 해보겠습니다

아래의 그림과 같은 계산된 필드를 만들어 위의 내용과 비교해보겠습니다

 

Raw Level을 Row Level로 바로잡습니다 :D

 

새롭게 만들어진 Profitability - Row Level 필드는 차원에 들어가있습니다
아까는 측정값이었는데, 이번에는 차원이라구요...?

Michael Treadwell의 설명을 그대로 적용해보면,

Profitability - Row Level은 집계된 수치 - 위의 예시에서는 SUM(Profit) - 에 대응하는 문자열이 아니라,
Profit으로 주어진 수치 하나 하나(Row Data 레벨)를 Profitable 또는 Unprofitable로 판단한 것입니다
따라서 집계된 측정값에 상응하는 문자열이라는 개념이 성립할 수 없습니다

또한 해당 필드는 Row Data 레벨에서 정의되었기 때문에 다른 차원에 의해 분기될 수도 없습니다

따라서 태블로는 Profitability - Row Level을 측정값이 아니라, 차원으로 보는 것이죠 

이 개념이 좀 어렵나요?
태블로의 Level of Detail 개념을 이해하면 조금 더 정확히 보실 수 있으리라 확신합니다
이에 대해서는 [1]-3에서 상세히 다루도록 하겠습니다 

거기로 넘어가기 전에,
연속형과 불연속형 논의에서 빠질 수 없는 이슈,
다음 포스트에서는 날짜 관련 내용을 한 번 정리해보겠습니다 :D

 

본 포스트에 대한 모든 아이디어는 다음의 리소스를 참고하였습니다

 

  Keith Helfrich, Master Tableau Concept
  Michael Treadwell, Tableau Pills: Measures and Dimensions
  Tableau Help, Dimensions and Measures, Blue and Green

 

'v3 | Tableau Deep Dive' 카테고리의 다른 글

[2]-1. 데이터 해석기  (1) 2019.10.03
[1]-3. Level of Detail  (2) 2019.10.02
[1]-2. 연속형과 불연속형 (3)  (1) 2019.10.02
[1]-2. 연속형과 불연속형 (1)  (1) 2019.10.01
[1]-1. 차원과 측정값  (5) 2019.10.01