본문 바로가기

Dissecting Tableau

[1]-3. Level of Detail

Level of Detail 태블로가 작동하는 근본 원리이자,

앞으로 펼쳐질 모든 논의의 기초가 되는 아주 중요한 개념입니다

 

Dissecting Tableau 시리즈를 시작하면서 제일 먼저 차원과 측정값에 대해 이야기했었습니다

그 개념을 이해하고 구별하는 것이 중요한 것임을 강조했었는데, Level of Detail은 그것과 바로 맞닿아 있는 주제입니다

 

이 개념에 대한 이해가 부족하다면 태블로는 그냥 차트를 조금 더 쉽고 빠르고 예쁘게 그릴 수 있는 툴에 불과하며,

태블로에 대한 이해를 더 깊은 수준으로까지 확장해나가기 어렵습니다

 

반면, 이게 감이 잡히면 화면에서 보여주는 숫자가 어떤 의미인지 정확하게 이해하게 되실 것이며,

향후 이어지게될 세부표현식(Level of Detail Expressions)도 자유롭게 활용할 수 있을 것입니다 

 

태블로에서 가장 중요한 이 개념, Level of Detail, 

하나 하나 단계별로 뜯어보도록 하죠 :D

 

 

 

We Are Here


[01] Tableau Fundamentals

   ▪  Dimension and Measure

   ▪  Continuous and Discrete

   ▪  Understanding Aggregation, Granularity, and Level of Detail

[02] Data Preparation

[03] Manipulating Data

[04] Building a Chart

[05] Analytics Pane

[06] Filter

[07] Table Calculation

[08] Parameter

[09] Level of Detail Expressions

[10] Map

[11] Dashboard Rendering

 

 

 

태블로는 집계한다


집계(Aggregation)는 나열된 숫자들을 한데 모아서 연산한다는 의미입니다

태블로는 그렇게 집계된 값을 우리에게 보여줍니다

 

집계 중 우리에게 가장 친숙한 개념은 '합계(SUM)'겠죠

하지만 집계가 꼭 합계만 있느냐, 그렇지는 않습니다

평균, 최대값, 최솟값, 중위수 등이 모두 집계의 방법들이며, 물론 태블로에서는 이와 같은 집계 방법들도 사용할 수 있습니다

 

예를 들어볼까요?

다음과 같이 'Value'라는 이름의 필드가 하나있습니다

 

Value = { 1, 1, 1, 2, 5 }

 

Value 필드를 태블로의 화면 안에 올리면 그 값 1, 1, 1, 2, 5를 그대로 보여주지 않습니다

(물론 그렇게도 할 수 있습니다, 하지만 태블로의 Default Setting은 그렇지 않다는 의미입니다)

아마도 합계(Value)로 해서 다섯개의 수치들을 모두 더한 10이라는 값을 반환할 것입니다

 

Value를 평균으로 집계하면 2,

최대값으로 집계하면 5,

최솟값으로 집계하면 1,

중위수로 집계하면 1,

이런식으로 다양하게 집계할 수 있습니다

 

특별한 조작(?)을 하지 않는 이상

태블로의 집계 Default Setting은

합계로 되어있기 때문에

다양한 집계 방법 중에서도

합계(Value) = 10을 반환하는 것입니다

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

정리하면, 태블로는 Raw Data의 값을 그대로 반환하지 않습니다. 태블로는 집계값을 보여줍니다

 

 

 

어떻게 썰 것인가?


이 질문은 어디서 한 번 본적이 있는 것 같습니다, 앞선 논의에서 차원을 설명하면서 던졌던 메시지입니다 

 

결국 태블로는 집계를 통해 데이터를 보여주기 떄문에,

우리가 보고 싶은 화면을 얻기 위해서는 우리가 원하는 바로 그 관점 - 제품, 고객, 지역 등 - 으로 집계값을 썰어줘야 합니다

 

결국 태블로를 활용한 데이터 시각화는 '데이터를 어떻게 썰어서 볼 것인가?' 라는 본질적인 질문에서 시작됩니다

 

Tableau is all about SLICING

저는 표현이 과하지 않다고 생각합니다 :D

 

그런데 말입니다,

 

똑같은 데이터를 똑같은 관점으로 썰어서 보는 것인데, 태블로는 왜 그렇게 다양한 차트들을 제공하는 것일까요?

 

여기에서 '표현방식'이라는 개념이 들어옵니다

우리가 던지는 질문의 포커스에 따라 가장 적절한 표현방식을 선택할 수 있는 것이죠

 

아래의 그림은 모두 매출(Sales)을 배송방법(차원)으로 썰어서 본 예시입니다

 

 

배송방법별로 매출액을 확인하고 싶으면 바 차트(Bar Chart)가 괜찮을 것이고,

각 배송방법이 전체 매출에서 차지하는 비중을 보고 싶으면, 파이 차트(Pie Chart)가 더 나을 것입니다

디자인 요소를 고려하고 싶으면 버블 차트(Bubble Chart) 또는 트리맵(Tree Map)도 고려해볼 수 있습니다

 

즉, 위의 네 가지 예시에서 매출(Sales)을 배송방법(Ship Mode)으로 썰어서 보는 것은 모두 똑같습니다

다만 그것을 표현하는 방식이 다를 뿐이고, 그 방식은 각자가 가지고 있는 Business Question에 따라 달라질 수 있는거죠

 

이 논의에 대해서는 차트를 다루는 섹션에서 더욱 구체적으로 살펴보도록 하겠습니다 :D

 

 

 

Level of Aggregation, Level of Granularity, and Level of Detail


태블로를 '슬라이스의 예술(?)'로 정의한다면,

그 다음으로 이어질 수 있는 스토리는 '얼마나 거칠게(coarse) 또는 잘게(fine) 썰 것인가?' 입니다 

 

태블로는 이것을 (View) Level of Detail이라고 부릅니다

Level of Detail은 한국말로 옮기려고 해도 마땅한 표현이 없어서, 영문 용어를 그대로 사용하겠습니다

(굳이 해석해보자면, '화면이 잘게 썰려진 정도')

 

(1) more aggregated = less granular = less detailed

(2) less aggregated = more granular = more detailed 

 

제가 즐겨쓰는 예시를 다시 한 번 소환해보겠습니다

무를 써는 다양한 방법이 있는데, ①에서 ④로 갈수록 aggregation의 정도는 낮아지고, detail의 정도는 높아지고 있는 것이죠

 

 

 

태블로에 올린 데이터도 위의 무와 크게 다를 바 없습니다

 

수익(Profit)을 제품 대분류(Category)로 보면, 꽤 높은 수준에서 집계되어 있습니다

Aggretation의 정도는 높고, Detail의 정도는 낮은 것이죠

(물론, 상대적인 개념입니다)

 

 

 

 

 

 

 

이 테이블은 어떤가요?

수익을 제품 대분류로 나누고,

제품 중분류로 한 번 더 분기했더니,

수익이 조금 더 잘게 썰려있는게 확인됩니다

 

마치 위의 무 예시에서

①이 ② 또는 ③으로 변하는 것처럼 말이죠

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

한 번만 더 썰어보죠, 위의 그림에 주문일자의 연도를 더 얹어보았습니다

 

 

훨씬 더 작은 단위로 조각난(broken down) 데이터를 확인하실 수 있습니다

Detail의 정도가 지금까지의 세 가지 그림 중 가장 높은 것으로 보시면 되겠습니다

 

이 즈음에서 질문을 하나 던져보겠습니다

 

"차원과 측정값  오직 차원만 화면의 Level of Detail 결정한다"

 

맞을까요? 틀릴까요?

 

세부표현식(Level of Detail Expressions)을 다루면서 답할 기회가 있을 것 같습니다

한 번 고민해보시는 것도 좋지 않을까 싶습니다 :D

 

 

 

Why LOD?


결국 LOD는 데이터를 어떻게 바라볼 것인지에 대한 문제입니다
Aggregation 레벨이 지나치게 높다면 구체적인 내용들이 잘 안보일 것이고,
Detail 레벨이 필요 이상으로 높다면 너무 시시콜콜한 것까지 보이니까 데이터의 핵심을 흐릴 수도 있겠죠

그래서 화면을 만드는 사람은 데이터를 어느 정도의 깊이에서 보는 것이 적절할지,
계속 고민하고 또 고민해야한다고, 저는 그렇게 생각합니다

그런데 말입니다,

우리가 던지는 Business Question이 LOD 관점에서 그렇게 단순하지 않을 수도 있습니다

 

'너네 회사 연봉 쌔냐? 업계 평균 대비 어느 정도야?'

너무 쉽게 던질 수 있는 질문이지만, 한동안 태블로를 활용해 이런 질문에 대한 답을 얻기가 쉽지 않았습니다

비로소 태블로 9 버전이 출시되어서야 좀 수월해졌는데, 그게 바로 Level of Detail Expressions를 통해서입니다

이 주제는 추후에 차례가 되면 아주 상세하게 다루어보도록 하겠습니다 :D

 

본 포스트의 내용은 다음 영상에서도 확인할 수 있습니다

 

▪  VizLab, Tableau Fundamentals: Tableau vs. Excel

▪  VizLab, 태블로 마스터 클래스 - LOD 표현식 ① VLOD

 

사업자 정보 표시
비즈랩 | 최정민 | 경기도 용인시 기흥구 중부대로746번길 21, 210-1503 | 사업자 등록번호 : 534-02-01239 | TEL : 070-8095-4524 | 통신판매신고번호 : 제2020-용인기흥-0205호 | 사이버몰의 이용약관 바로가기

'Dissecting Tableau' 카테고리의 다른 글

[2]-2. 피벗  (1) 2019.10.03
[2]-1. 데이터 해석기  (1) 2019.10.03
[1]-3. Level of Detail  (1) 2019.10.02
[1]-2. 연속형과 불연속형 (3)  (1) 2019.10.02
[1]-2. 연속형과 불연속형 (2)  (1) 2019.10.02
[1]-2. 연속형과 불연속형 (1)  (1) 2019.10.01