본문 바로가기

Tableau36

[Data Exploration] Think Data Thursday: How can I know my numbers are right? Validating data, calculations and joins Jonathan Drummey, Tableau Zen Master 명예의 전당에 이름을 올린 4명의 태블로 스페셜리스트 중 한 명 태블로에서 원하는 수치를 오류 없이 정확하게 만들어주기 위해서는 '디테일(Level of Detail)'에 대한 개념을 정확하게 이해하고 있어여 하는데, 이런 부분을 강조하고 있는 태블로 콘텐츠는 사실 그렇게 많지 않다 개인적인 생각으로는, 업무 현장에서 - 실험실 조건이 아닌 - 태블로를 자유롭게 활용하기 위해서는 내가 가지고 있는 데이터의 디테일에 대한 고찰이 반드시 필요하다고 믿고 있기 때문에 Jonathan Drummey의 이와 같은 자료는 유사품들이 더욱 많이 만들어져서 퍼져야 한다고 생각한다 지난 8월 원데이 세미나를 구상하는데, 가장 큰 영감을 주었던 영상, 태블.. 2019. 10. 6.
[2]-6. 사용자 지정 SQL 두번째 대주제, Data Preparation의 마지막 토픽입니다 사용자 지정 SQL, Custom SQL (편의상 본 포스트에서는 커스텀 SQL로 지칭하도록 하겠습니다) 쿼리를 좀 쓸 줄 아는 사용자들에게는 Data Prep 과정에서의 자유도를 높여줄 수 있으며, 잘 모르는 사용자들도 SELECT문 등 간단한 몇 개만 사용할 줄 알면, 아주 큰 도움을 받을 수 있는 히든 카드라고 할 수 있죠 :D 오늘은 여기에 대해서 이야기를 좀 해보도록 하죠 We Are Here [1] Tableau Fundamentals [2] Data Preparation ▪ Data Interpreter ▪ Pivot ▪ Split ▪ Data Source Filter ▪ Custom SQL [3] Manipulating Da.. 2019. 10. 6.
[2]-5. Data Prep Hands-On 이번 포스트에서는 지난 4회에 걸쳐 익힌 Data Preparation 과정을 실습을 통해 익혀보겠습니다 태블로 데스크탑에서 데이터 정제를 위해 활용하는 기능은 크게 아래의 세 가지 정도라고 말씀드렸습니다 ▪ 데이터 해석기 ▪ 피벗 ▪ 사용자 지정 분할 이와 함께 필요에 따라서 데이터 원본 필터를 적절히 사용하면, 성능 측면에서 더 나은 결과를 얻을 수 있다고 했지요 위의 기능들을 하나 하나씩 적용해보며, 그 용법을 되새겨보겠습니다 :D 첫번째, 데이터 해석기 (Data Interpreter) 오늘 실습에 활용할 데이터는 2018년 8월 기준 주민등록 인구 데이터입니다 행정안전부에서 매월 성/연령 기준으로 인구 데이터를 업데이트하고 있는데, 읍면동 레벨까지 데이터 확인이 가능합니다 (링크가 깨질 경우 구.. 2019. 10. 5.
[2]-4. 데이터 원본 필터 지난 포스트까지 세 차례에 걸쳐 태블로에서 제공하는 Data Preparation 기능들을 살펴보았습니다 ▪ 데이터해석기 - 병합된 셀 정리 ▪ 피벗 - 가로로 긴 구조의 데이터를 세로로 긴 구조로 바꾸기 ▪ 사용자 지정 분할 - 하나의 필드에 포함된 정보를 구분자를 활용하여 두 개의 필드로 나누기 오늘 소개할 기능은 필수적으로 활용하는 기능으로 보기는 어렵지만, 특히 대용량 데이터를 취급할 때 유용하게 쓸 수 있는 데이터 원본 필터(Data Source Filter)입니다 We Are Here [1] Tableau Fundamentals [2] Data Preparation ▪ Data Interpreter ▪ Pivot ▪ Split ▪ Data Source Filter ▪ Custom SQL [3].. 2019. 10. 5.
[2]-3. 사용자 지정 분할 태블로에서의 Data Preparation 관련 논의를 계속 이어갑니다 첫번째는 데이터 해석기를 활용하여 병합된 셀을 처리했었고, 두번째는 피벗을 이용하여 가로로 길게 있는 데이터셋을 세로로 길게 만들어주었습니다 오늘은 사용자 지정 분할 기능을 활용하여 데이터셋을 마지막으로 정리해보겠습니다 We Are Here [1] Tableau Fundamentals [2] Data Preparation ▪ Data Interpreter ▪ Pivot ▪ Split ▪ Data Source Filter ▪ Custom SQL [3] Manipulating Data [4] Building a Chart [5] Analytics Pane [6] Filter [7] Table Calculation [8] Parameter.. 2019. 10. 4.
[2]-2. 피벗 Dissecting Tableau의 두번째 파트, Data Preparation 과정을 계속 이어가보겠습니다 지난 포스트에서는 데이터 해석기를 활용해 병합된 셀 등을 정리해보았습니다 Data Preparation 파트는 처음부터 내용이 이어지는 시리즈물(?)이기 때문에 앞쪽 포스트부터 순차적으로 확인하시면 좋습니다 :D We Are Here [1] Tableau Fundamentals [2] Data Preparation ▪ Data Interpreter ▪ Pivot ▪ Split ▪ Data Source Filter ▪ Custom SQL [3] Manipulating Data [4] Building a Chart [5] Analytics Pane [6] Filter [7] Table Calculat.. 2019. 10. 3.
[2]-1. 데이터 해석기 두번째 토픽, Data Preparation을 시작해보려고 합니다 우리가 통계청, 공공기관의 웹사이트 등에서 다운로드 받은 데이터셋의 다수는 태블로가 읽어들여 분석하기 편한 포맷이 아닙니다 우리는 셀이 병합되어 있고, 가운데 정렬이 되어 있고, 눈의 초점이 흘러가는 오른쪽 방향으로 데이터가 나열되어 있어야 보기가 편한데, 태블로로 데이터를 처리함에 있어서 이런 요소들은 장애로 작용하게 됩니다 데이터셋을 태블로가 처리하기 좋은 형태로 만들기 위해 지금까지 우리는 여러가지 수작업들을 해왔던 것이지요 사람의 손이 많이 간다는 것은 바람직한 일이 결코 아닙니다 그래서 가급적 쉽고, 빠르고, 정확하게 처리할 수 있는 기술들이 쏟아지고 있는 중인지도 모르겠습니다 제가 사용하고 있는 Alteryx도 그렇고, 태블로에.. 2019. 10. 3.
[1]-3. Level of Detail Level of Detail은 태블로가 작동하는 근본 원리이자, 앞으로 펼쳐질 모든 논의의 기초가 되는 아주 중요한 개념입니다 Dissecting Tableau 시리즈를 시작하면서 제일 먼저 차원과 측정값에 대해 이야기했었습니다 그 개념을 이해하고 구별하는 것이 중요한 것임을 강조했었는데, Level of Detail은 그것과 바로 맞닿아 있는 주제입니다 이 개념에 대한 이해가 부족하다면 태블로는 그냥 차트를 조금 더 쉽고 빠르고 예쁘게 그릴 수 있는 툴에 불과하며, 태블로에 대한 이해를 더 깊은 수준으로까지 확장해나가기 어렵습니다 반면, 이게 감이 잡히면 화면에서 보여주는 숫자가 어떤 의미인지 정확하게 이해하게 되실 것이며, 향후 이어지게될 세부표현식(Level of Detail Expressions).. 2019. 10. 2.
[1]-2. 연속형과 불연속형 (3) 연속형과 불연속형과 관련된 마지막 논의로, 태블로에서의 날짜 이야기를 좀 해볼까 합니다 태블로에서는 날짜 포맷(필드명 옆의 달력 모양)을 별도로 표기해줄 수 있으며, 계산된 필드에서도 날짜와 관련된 다양한 함수들을 제공하는 등 날짜를 꽤나 중요한 요소로 취급하고 있는데, 여기에서는 날짜와 관련된 연속형 또는 불연속형 관련 내용만 정리해보겠습니다 :D 불연속형 날짜 태블로는 기본적으로 날짜를 불연속형으로 인식하고 있는 듯 합니다 날짜로 인식된 필드를 화면에 올려보면 불연속형 - 년(Order Date) - 으로 올라가고 있거든요 (왼쪽 그림) 날짜는 본질적으로 계층 구조(Hierarchy)를 가지고 있습니다 (오른쪽 그림) 년 - (분기) - 월 - 일 - 시 - 분 - 초 순으로 내려가죠 태블로에서 날짜.. 2019. 10. 2.