메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

핸즈온 데이터 시각화

효과적인 데이터 시각화 전략부터 20가지 시각화 도구 사용법까지

한빛미디어

번역서

판매중

  • 저자 : 잭 도허티 , 일리야 일라얀코우
  • 번역 : 김태헌
  • 출간 : 2022-07-04
  • 페이지 : 516 쪽
  • ISBN : 9791162245743
  • 물류코드 :10574
  • 초급 초중급 중급 중고급 고급
4.8점 (52명)
좋아요 : 5

실무에 바로 적용 가능한 데이터 시각화 방법을 모두 모았다! 

간단한 시각화 도구부터 사용자 반응형 고급 도구까지

 

한눈에 들어오는 차트와 지도는 글보다 강력하다. 문서가 글로만 빼곡히 채워져 있으면 사용자의 집중력을 저하시킬 뿐 아니라 설득력도 약해지기 마련이다. 하지만 적절한 타이밍에 등장하는 시각화된 데이터는 사용자의 주의를 환기시키고 주장을 더욱 강력하게 만든다. 이 책에서는 웹에서 제공하는 무료 시각화 도구를 이용해 데이터의 스토리를 생생하게 전달하는 방법을 설명한다. 데이터를 대화형(인터랙티브) 차트와 지도로 시각화하는 과정을 통해 데이터에 맥락과 스토리를 덧입혀 주장에 설득력을 더하는 효과적인 방법도 안내한다. 신뢰할 수 있는 데이터를 활용해 가치 있는 차트를 만들다 보면 자연스럽게 다양한 데이터로 만들어진 차트를 파악하는 안목도 생겨날 것이다.

 

 

상세페이지700_핸즈온 데이터 시각화.jpg

 

잭 도허티 저자

잭 도허티

미국 코네티컷 하트퍼드의 트리니티 칼리지 교육학 교수. 학생들이 지역단체와 협력해 자신만의 스토리를 대화형 차트나 지도로 표현하는 데이터 시각화 과정을 가르치고 있습니다. 역사학자 교육을 수료했고, 코네티컷 하트퍼드의 학교와 주거 지역에 대한 역사를 쉽게 공유하고자 데이터 시각화를 배웠으며, 그 내용을 『On the line』(애머스트 칼리지 출판부, 2021)에 실었습니다.

일리야 일라얀코우 저자

일리야 일라얀코우

코네티컷 데이터 컬래버레이티브(Connecticut Data Collaborative)의 시빅(civic) 기술자로 공공 데이터를 설명하고 탐색하기 위한 웹 기반 도구를 만듭니다. 트리니티 칼리지에서 컴퓨터 공학과 스튜디오 아트를 복수 전공했으며, 현재 영국 리즈 대학교에서 지리 정보 과학 석사 과정을 밟고 있습니다. 데이터를 분석하고 시각화하는 데 도움을 주는 디자인 기술 연구소 ‘픽처디짓(Picturedigits)’의 책임자이기도 합니다.

김태헌 역자

김태헌

하나금융융합기술원, IBM 등을 거쳐 외국계 소비재 기업에서 시니어 데이터 과학자로 일하고 있습니다. 베이징 대학교 졸업 후 캘리포니아 대학교 샌디에이고 캠퍼스(UCSD)에서 국제경제 석사 학위를 받았습니다. 『AI 소사이어티』(미래의창, 2022), 『퀀트 전략을 위한 인공지능 트레이딩』(한빛미디어, 2020)을 집필했고 번역서로는 『단단한 머신러닝』, 『데이터 과학자와 데이터 엔지니어를 위한 인터뷰 문답집』(이상 제이펍, 2020) 등이 있습니다.

 

CHAPTER 0 서문

0.1 왜 데이터 시각화인가

0.2 무엇을 믿을 수 있을까요

0.3 더 설득력 있는 그림

0.4 진실의 여러 가지 그림자

0.5 책의 구성

0.6 마치며

 

 

[PART I 기본 기술]


CHAPTER 1 스토리를 위한 도구 선택하기 

1.1 데이터 스토리 스케치하기

1.2 도구를 선택할 때 고려해야 할 10가지 요소

1.3 추천 도구

1.4 패스워드 관리자 사용

1.5 마치며

 

CHAPTER 2 스프레드시트 스킬 강화하기

2.1 스프레드시트 도구 선택

2.2 CSV 또는 ODS 형식으로 다운로드하기

2.3 구글 시트 복사본 만들기

2.4 구글 시트 공유하기

2.5 구글 시트 업로드하고 변환하기

2.6 구글 시트에서 주소 지오코딩하기

2.7 구글 설문지로 데이터 수집하기

2.8 데이터 정렬 및 필터

2.9 수식을 사용해 계산하기

2.10 피벗 테이블을 사용해 데이터 요약하기

2.11 VLOOKUP을 사용해 열 매칭하기

2.12 스프레드시트와 관계형 데이터베이스

2.13 마치며

 

CHAPTER 3 데이터를 찾고 질문하기

3.1 검색을 위한 질문 가이드

3.2 공공 데이터와 개인 데이터

3.3 민감한 데이터를 가리거나 집계하기

3.4 오픈 데이터 저장소

3.5 데이터 출처 남기기

3.6 불량 데이터 인식하기

3.7 데이터에 대해 질문하기

3.8 마치며

 

CHAPTER 4 지저분한 데이터 정리하기

4.1 구글 시트 스마트 클린업

4.2 찾기 및 바꾸기

4.3 행과 열 바꾸기

4.4 데이터를 서로 다른 열로 나누기

4.5 데이터를 한 열에 합치기

4.6 타불라를 사용해 PDF에서 테이블 추출하기

4.7 오픈리파인으로 데이터 정리하기

4.8 마치며

 

CHAPTER 5 의미 있는 비교하기

5.1 비교를 정확히 기술하기

5.2 데이터 정규화하기

5.3 편향된 비교 주의하기

5.4 마치며

 

 

[PART II 시각화 구축]

 

CHAPTER 6 차트 만들기

6.1 차트 디자인 원칙

6.2 구글 시트 차트

6.3 막대 차트와 열 차트

6.4 히스토그램

6.5 원형 차트, 선 차트, 영역 차트

6.6 데이터래퍼 차트

6.7 주석이 달린 차트

6.8 범위 차트

6.9 분산형 차트와 버블 차트

6.10 태블로 퍼블릭 차트

6.11 태블로 퍼블릭으로 만드는 분산형 차트

6.12 필터링된 선 차트

6.13 마치며

 

CHAPTER 7 데이터를 지도로 시각화하기

7.1 지도 디자인 원칙

7.2 코로플레스 색상과 간격 디자인

7.3 코로플레스 지도 데이터 정규화하기

7.4 구글 내 지도로 만드는 포인트 지도

7.5 데이터래퍼로 만드는 심벌 포인트 지도

7.6 데이터래퍼로 만드는 코로플레스 지도

7.7 태블로 퍼블릭으로 만드는 코로플레스 지도

7.8 소크라타 오픈 데이터로 만드는 실시간 지도

7.9 마치며

 

CHAPTER 8 테이블을 활용한 시각화

8.1 테이블 디자인 원칙

8.2 스파크라인으로 만드는 데이터래퍼 테이블

8.3 기타 테이블 생성 도구

8.4 마치며

 

CHAPTER 9 웹에 임베딩하기

9.1 정적 이미지와 대화형 iframe

9.2 임베드 코드 또는 iframe 태그 가져오기

9.3 코드 또는 iframe을 웹사이트에 붙여넣기

9.4 마치며

 

 

[PART III 코드 템플릿과 고급 도구]


CHAPTER 10 깃허브로 코드 수정하고 호스트하기

10.1 간단한 리플릿 맵 템플릿 복사, 수정, 호스팅하기

10.2 깃허브 페이지 링크를 iframe으로 변환하기

10.3 깃허브에 새로운 레포 만들고 파일 업로드하기

10.4 깃허브 데스크톱과 아톰 텍스트 편집기를 사용해 효율적인 코딩하기

10.5 마치며

 

CHAPTER 11 Chart.js와 하이차트 템플릿

11.1 Chart.js로 만드는 막대 또는 열 차트

11.2 Chart.js로 만드는 오류 바

11.3 Chart.js로 만드는 선 차트

11.4 하이차트로 만드는 주석이 달린 선 차트

11.5 Chart.js로 만드는 분산형 차트

11.6 Chart.js로 만드는 버블 차트

11.7 마치며

 

CHAPTER 12 리플릿 맵 템플릿

12.1 구글 시트로 만드는 리플릿 맵

12.2 구글 시트로 만드는 리플릿 스토리맵

12.3 구글 시트 API 키 가져오기

12.4 CSV 데이터로 만드는 리플릿 맵

12.5 CSV 데이터로 만드는 리플릿 히트맵 포인트

12.6 검색 가능한 리플릿 포인트 지도

12.7 오픈 데이터 API로 만드는 리플릿 맵

12.8 마치며

 

CHAPTER 13 지도 데이터 변환하기

13.1 지리 공간 데이터와 GeoJSON

13.2 GeoJSON 경계 파일 찾기

13.3 GeoJson.io를 사용해 그리고 편집하기

13.4 맵셰이퍼를 사용해 편집하고 병합하기

13.5 압축된 KMZ를 KML로 변환하기

13.6 맵 워퍼로 지오레퍼런스하기

13.7 미국 통계청 지오코더를 사용해 대량으로 지오코딩하기

13.8 포인트 데이터를 폴리곤 데이터로 피벗하기

13.9 마치며

 

 

[PART IV 진실하고 의미 있는 스토리 전달하기]


CHAPTER 14 거짓을 발견하고 편향 줄이기

14.1 차트로 거짓말하는 방법

14.2 지도로 거짓말하는 방법

14.3 데이터 편향 인지하고 줄이기

14.4 공간 편향 인지하고 줄이기

14.5 마치며

 

CHAPTER 15 데이터 스토리 말하고 보여주기

15.1 스토리보드에 내러티브 작성하기

15.2 의미에 주의를 기울이세요

15.3 출처와 불확실성 인정하기

15.4 데이터 스토리 형식 결정하기

15.5 마치며

 

APPENDIX 자주 발생하는 문제 해결법

A.1 도구 또는 플랫폼 문제 

A.2 다른 브라우저 사용해보기 

A.3 개발 도구로 진단하기 

A.4 맥 또는 크롬북 문제 

A.5 불량 데이터 체크하기 

A.6 흔히 발생하는 iframe 에러 

A.7 깃허브에서 코드 수정하기

구글 시트부터 깃허브를 통한 코드 템플릿 수정까지, 

데이터 스토리텔링 기술 A to Z 

 

데이터로 이야기를 전달하기 위해 필요한 절차는 무엇일까요? 먼저 여러분의 주장을 설득력 있게 만들어줄 데이터를 찾고, 지저분한 데이터를 정리해 적절한 분석 범위와 비교 기준을 설정해야 합니다. 그리고 현상을 가장 잘 나타낼 만한 시각화 도구와 차트 유형을 선택해 유의미한 시각화 결과로 구현해야 합니다. 만약 사용자가 시각화된 결과와 직접 상호작용하거나 관심 있는 패턴을 직접 탐색할 수 있다면 더할 나위 없겠죠. 이 책은 앞서 설명한 데이터 스토리텔링의 절차대로 여러분을 데이터 시각화 여정으로 친절히 안내합니다. 

 

먼저 시각화 도구를 선택할 때 고려해야 할 10가지 요소부터 스프레드시트 기초 사용법을 살펴봅니다. 그리고 데이터에서 의미 있는 비교를 하는 방법, 다양한 대화형 차트와 지도를 구현하는 여러 가지 무료 도구 사용법과 깃허브로 오픈 소스 코드 템플릿을 수정하고 호스트하는 법을 안내합니다. 더 나아가 차트와 지도로 거짓을 말하는 방법을 배워 여러분이 함정에 빠지지 않도록 주의시킵니다. 코드를 수정해본 경험이 없더라도 걱정하지 마세요. 단계별로 따라 하다 보면 어느새 데이터를 보기 좋게 시각화할 수 있는 코더가 된 자신을 발견할 겁니다.

 

 

주요 내용

  • 효과적인 차트와 지도를 설계하는 원칙 이해하기
  • 데이터 시각화 개념을 기반으로 올바른 도구 선택하기
  • 구글 시트, 데이터래퍼, 태블로 퍼블릭으로 웹사이트에 적합한 대화형 차트와 사용자 맞춤 지도 제작하기
  • 깃허브에서 Chart.js, 하이차트, 리플릿으로 작성된 오픈 소스 코드 템플릿 편집하기
  • 다른 사용자가 만든 차트와 지도에서 편향을 인지하는 법 터득하기

 

추천사

 

이 책은 신의 선물입니다! 명확한 설명을 통해 데이터 시각화 개념을 단계별로 학습할 수 있습니다. 시각화를 아름답고 인터랙티브하게 만드는 방법뿐만 아니라 전체적인 스토리와 요점을 전달하는 방법도 설명합니다. 경험이 많은 프로그래머에게도 유용하고 입문자에게도 완벽한 책입니다. 

_아나, 아마존 독자

 

첫 번째 데이터 시각화 프로젝트를 시작하는 데 필요한 모든 정보를 담고 있는 책입니다.

_데릭 에더, 데이터메이드(DataMade) 설립자이자 파트너

 

https://m.mk.co.kr/news/society/10482768

 

스마트폰의 보급이 일반화되고, 짧은 시간동안 빠르게 소비할 수 있는 컨텐츠가 인기를 끌고 있다. 그래서인지 책을 읽는 사람이 줄고, 신문을 읽는 사람도 줄어들고있다.

 

 

http://star.ohmynews.com/NWS_Web/OhmyStar/at_pg.aspx?CNTN_CD=A0002505357

 

1분 미만의 빠르게 소비할 수 있는 컨텐츠는 인기를 끌고 있다. 많은 정보를 얻기 위해서는 시간을 줄여야하기 때문인것 같다.

 

이 글에서도 위의 네 줄의 문장을 읽고난 후 사진을 보고, 문장과 사진이 어떤 말을 하려는지 생각했을 것이다. 이때 주장을 뒷받침하기위해 사진이 아니라 줄 글로 여러 문장을 썼다면 이해하기 힘들었을 것이다. 작성자가 하려는 말이 무엇인지 기억해야 하고, 주장에 대한 근거들을 각각 기억해야하고, 근거들의 변화량을 분석하고 기억해야하기 때문이다.

 

하지만 주장을 하고, 그 근거를 사진자료를 인용해서 이해하기 빨랐을 것이다. 이처럼 시각화된 자료는 독자의 피로도를 낮출뿐아니라 이해를 쉽게만들어준다. 이것이 데이터를 글이 아닌 그래프, 이미지로 만드는 것 즉, '데이터 시각화'이다.

 

글로 된 데이터를 시각화하기 위해서는 일정한 기준에 맞춰 데이터를 분류하고, 분류된 데이터를 시각화 목적에 맞게 가공해야한다. 가공된 자료는 의도를 잘 나타낼 수 있는 시각화 방법 또는 도구를 이용해 표현한다.

 

이 때 데이터 시각화를 담당자가 표현 방법을 잘 모르고 있거나, 독자를 기만하고자한다면 위협이 될 수 있다.

 

 

같은 자료를 시각화 한 두 개의 그래프다. 분명 찬성 82.9%, 반대 12.6%, 모름/무응답이 4.5%로 데이터는 같다. 하지만 이 데이터를 시각화하는 과정이 다르다. 올바른 데이터를 잘 다루어야 정확한 시각화 자료가 되는 것이다.

 

 

《핸즈온 데이터 시각화》

 

이번에 리뷰하는 《핸즈온 데이터 시각화》가 이런 목적에 딱 들어맞는 책인듯하다.

핸즈온(Hands-on) : (말만 하지 않고) 직접 해 보는
말은 스토리를 전달하지만 시각화는 정량적이고 이성적이며 공간의 패턴을 이미지로 변환시켜 데이터 스토리를 보여준다.

《핸즈온 데이터 시각화》는 무료 도구들을 이용하여 직접 데이터를 시각화해볼 수 있도록 구성되어 있다. 책은 크게 '데이터 수집 > 데이터 가공 > 시각화'를 주제로 구성되어 있다. 마지막 장에는 데이터로 상대를 어떻게 속이는지, 데이터를 바르게 표현하기 위해 무엇을 해야 하는지를 사례 중심으로 보여준다. 그리고 데이터를 다루며 겪을 수 있는 실수, 오류들을 줄이는 팁이 수록되어 있다.

 

 

책을 읽고 메모지 한 장에 요약정리를 해볼 생각이다.

'요약정리본 1장, 책 부록자료(링크) 출력본 1부' 이렇게 들고 다닌다면 적재적소에 책에서 소개한 툴을 사용하여 활용할 수 있을것 같다.

 


 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
리뷰를 위해 한빛미디어에서 책을 제공받았지만 주관적인 생각을 그대로 적었습니다.

누구나 한번쯤 발표 자료를 만들다보면 수집된 데이터를 어떤 식으로 청중들에게 보여줄 것인지에 대해 고민해본 적이 있을 것이다. 나 자신도 차트 등에 익숙하지 않은 관계로 이 책을 선택하게 되었다. 처음 이 책의 제목을 접했을 때 데이터로 차트를 그리기 위해서 여러 코딩 기술을 가르쳐주는 책인가 지레 짐작을 했었다. 하지만 막상 책을 읽어보니 실제 코딩에 대한 내용은 거의 없고, 컴퓨터만 어느 정도 사용할 수 있다면 누구나 멋진 차트를 손쉽게 그릴 수 있다는 사실을 알게 되었다.

 

이 책의 구성은 크게 3개의 부분로 구성되어 있다.

1부 기본 기술

여기서는 구글 시트와 같은 데이터 정리에 필요한 기본적인 도구들을 소개하고 데이터들을 수집하고 정리하는 방법을 설명한다.

 

2부 시각화 구축

2부에서는 앞에서 정리한 데이터를 바탕으로 여러 다양한 차트를 생성하는 방법을 설명한다. 특히 다양한 종류의 차트을 소개하고 어떠한 상황에서 사용하기 적절한지가 잘 정리되어 있어서 좋았다.

 

3부 코드 템플릿과 고급 도구

2부에서는 인터렉티브한 UX를 통해 손쉽게 차트를 만들 수 있는 방법을 설명했다면 여기서는 코딩을 통해 좀 더 차트를 정교하게 만들 수 있는 방법을 설명하고 있다. 코딩이라고는 하지만 복잡한 부분은 제외하고 핵심적인 부분을 단순화해서 설명하고 있기 때문에 초보자도 쉽게 따라해볼 수 있을 것으로 생각되었다.

 

4부 진실하고 의미 있는 스토리 전달하기

아무리 멋진 차트를 보여주더라도 핵심은 그 속에 포함된 의미가 다른 사람에게 잘 전달되도록 하는 것이다. 여기서는 데이터를 다루면서 빠질 수 있는 다양한 편향과 차트 생성에 관한 기본 원칙들을 설명한다. 오해의 소지가 있는 잘못된 예제들을 통해 이러한 편향과 원칙들에 대해 잘 이해할 수 있도록 돕는다.

 

총평

이 책을 읽으면서 데이터 시각화에 대해 많은 걸 배울 수 있었다. 다양한 차트들과 그것들을 각각 언제 사용해야 하는지 그리고 이러한 차트들을 손쉽게 생성할 수 있는 다양한 무료 도구들까지...

특히 튜토리얼 방식으로 각 도구들의 사용법을 단계 별로 실제 화면을 하나하나 보여주고 있어서 쉽게 따라해볼 수 있었다. 나중에 발표 자료 등을 만들면서 차트가 필요할 때 이 책을 레퍼런스로 참고하면 유용할 것 같다는 생각이 들었다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 
 

스크린샷 2022-12-31 오전 12.22.55.png

 

 
안녕하세요 괴짜 개발자 namedboy 입니다.
 
요즘은 많은 영역에서 데이터 시각화를 다루고 있어 많은 직군에서 활용하는 것 같습니다.
 
여러분은 데이터 시각화 하면 어떤 이유로 만들려고 하시나요?
- 내부 사업팀의 설득을 위해?
- 성과 공유를 위한 자료를 위해?
- 데이터의 현재 상태에 대한 공유?
 
사실 무엇이 되었든 데이터를 제대로 정리하는게 중요하고 무엇을 보여줄 것인지 기준점을 잡는 것이 중요할 것입니다.
 
때에 따라서는 효과적인 툴을 사용해 적은 노력으로도 큰 효과를 낼 수 있도록 하는 것도 중요할 것입니다.
 
그런면에서 이책 핸드온 데이터 시각화는 높은 활용도를 가진 스킬들을 제안합니다.
 
데이터를 다루는데 정말 기초적이고 절대 빠질 수 없는 툴인 스프레드 시트를 처음 소개 하고 있다는 점에서 저는 제대로 현업에서 쓸 수 있게 소개하고 있다는 생각이 들었습니다.
 
제 주변에더 데이터를 정말 기가 막히게 정리하시는 분이 계시는데 그분은 거의 모든 것을 스프레드 시트 하나로 정리합니다.
 
아주 가끔 차트가 필요한 경우에만 다른 툴을 활용해 차트를 만들어내죠.
 
그만큼 활용도가 높은 툴이라고 평소에도 생각을 가지고 있었는데 이렇게 책에서 소개하는 내용을 보니 더욱더 신뢰감이 생겼습니다.
 
그 이후에는 데이터를 정리하는 방식 데이터를 풀어서 설명하는 방식 - 일종의 스토리웨이죠.
그리고 풀어낸 데이터를 가지고 차트나 도구들을 활용해 한눈에 볼 수 있도록 하는 것.
 
거기에 더해서 코드 템플릿까지 제공하고 있어 평소에 생각하고 있는 데이터 시각화에 필요한 많은 것들을 제공해주고 있습니다.
 
만약 데이터 시각화를 어떻게 하는지 잘 모르겠다거나 하기는 해야 하는데 해본적이 없어 너무 어렵다면 이 책이 도움이 될꺼라 생각합니다.
 
이 리뷰 내용은 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.  
책의 내용이 궁금하다면 [이곳]을 통해 확인할 수 있습니다.

20여종의 다양한 도구를 통해 시각화 자료를 생성할 수 있게 구성된 점이 장점인 책으로 프로그래밍이나 시각화의 기본을 몰라도 퀄리티 있는 시각화 업무를 수행할 수 있게 도와주는 책이다.

훌륭한 데이터 시각화 책이 많은데 이 책도 충분히 훌륭한 책이라는 생각이 든다. 다만 독자의 책을 선택하는 목적과 수준 상태에 따라 때로는 양서가 혹평을 받기도 하고 때로는 대부분의 베스트셀러 책이 그렇듯 기본만 충실한 책이 각광받기도 한다.

이 책의 특징은 프로그래밍 스킬이 거의 등장하지 않는다. 프로그래밍 언어 처럼 생겨먹은 것은 오직 구글 시트에 활용되는 짧막한 수식, 임베딩 코드를 활용하여 시각화 자료를 웹으로 배포하기 위한 HTML, 가장 어려운 프로그래밍은 chart.js 코딩 정도가 등장한다.

chart.js는 자바스크립트를 기본적으로 알고 있다면 이해하는데 큰 무리가 없지만 굳이 자바스크립트를 모른다고 할지라도 데이터를 기반으로 시각화하는 것이기에 이 책 혹은 튜토리얼 사이트의 예제만 따라할 줄 알아도 충분히 훌륭한 시각화 자료를 생성할 수 있다.버블차트
버블차트코드

즉, 프로그래밍 스킬이 부족하지만 데이터 분석 업무에 종사하거나 일반 사무직 종사자가 퀄리티 있는 시각화 자료를 생성하고 싶을 때 이 책은 좋은 선택이 될 것 같다.

물론 프로그래머 역시 코드에는 능할지 몰라도 시각화 표현 능력은 별도의 문제이기 때문에 이 책을 통해 데이터 스토리 텔링을 작성하는 방법이나 시각화 표현의 기본기를 습득하고 소개되는 다양한 도구에서 프로그래밍의 유연성을 어떤 방향으로 이끌어 나갈지 정하는데 도움이 될 것이다.

이 책의 가장 큰 특징은 다양한 시각화 도구들이 등장한다는 것이다.도구

위 도표가 이를 잘 정리하고 있는데 흔히 알려진 구글 시트를 비롯해서 앞서 언급한 chart.js 그 외에도 유명 시각화 도구인 태블로나 데이터 래퍼 등의 다양한 도구를 사용할 수 있는 기회가 제공된다는 점이 책의 또 하나의 장점이다.

프로그래머 입장에서는 되려 프로그래밍으로 표현할 수 있는 폭넓은 유연성이 되려 장벽이 되기도 한다. 이럴 때 이 책에 소개되는 도구들을 활용해보고 방향성을 잡을 수 있을 듯 하다. 좋은 예제를 따라해보며 일종의 시각화를 위한 좋은 선입견이 자리잡을 수 있을 것이다.

실제로 예제를 하나씩 따라해보며 시각화 세계에 이렇게 많은 오픈 소스들이 존재한다는 것에 놀라지 않을 수 없었다. 생각 이상으로 다양하고 편리한 기능들이 제공되며 생성된 시각화 자료들의 퀄리티는 말 할것 없이 뛰어나다.

예를 들어 태블로 퍼블릭이 그러한 도구 중 하나인데 지원하는 기능이 너무 다양하여 이를 한번씩 활용하는 것도 며칠의 시간이 필요할 만큼 기능적으로 확장성과 유연성이 뛰어나다는 생각이 들었다.태블로퍼블릭

데이터래퍼 역시 지도 기반의 시각화 및 데이터를 가공하는데 많은 도움을 주는 도구이다.데이터래퍼

특히 이 책에서 소개되는 도구 중 가장 많이 소개되는 툴은 구글 스프레드 시트이다. 평소 클라우드의 장점 덕분에 많이 활용하고는 있었지만 그저 엑셀의 클라우드 버전이라고만 생각했지 이렇게 다양한 기능이 숨겨져 있는지 몰랐다.구글시트

마치 Python으로 전처리하는 수준으로 데이터를 클렌징, 클리닝, 대체 하는 기능들이 모두 활용 가능하며 마치 RDBMS와 유사한 데이터 저장 기능으로도 활용할 수 있다는 것이 놀라웠다.

또한 책에서 소개되는 것처럼 이를 차트, 도표 등의 시각화 자료로 생성하는데 있어서도 뛰어난 기능을 제공한다는 사실을 이번에 이 책을 통해 처음으로 알게 되었다. 프로그램을 활용할 수 없는 환경이나 상황에 처한다면 꽤 요긴하게 사용할 수 있을 듯 하다.

또 하나의 특징은 시각화 입문서 답게 각 시각화 단위 유닛을 생성하는 예제가 꼼꼼히 정리되어있다는 점이다. 히스토그램이나 원형 차트 등 흔히 쓰이는 시각화 단위 유닛을 하나하나 실습해 볼 수 있다.유닛

시각화 자료를 생성하면서 유닛 별로 주의해야 할 사항들이 아래와 같은 예제로 유형별로 하나씩 꼼꼼하게 소개된 점도 마음에 들었다.유의사항

그 외에 데이터를 구할 수 있는 사이트가 잘 정리되어있는 등 전반적으로 시각화 업무를 수행하는데 있어 독자가 매우 편리하게 이 책만 잘 따라하면 다양한 팁을 얻을 수 있게 구성된 점이 인상적이었다.출처

기본적인 시각화 보고서를 통한 스토리 텔링 부분도 짧막하게 정리되어있는데 개인적으로는 이 부분의 분량이 더 많았다면 좋겠다는 생각이 들었다. 기본적인 연필과 종이만으로도 좋은 결과물을 작성하기 위한 방법이 잘 소개되어있어 개인적으로 많은 도움을 받았다.스토리텔링

전반적으로 시각화 생태계를 한 눈에 조망할 수 있게 해주고, 기본적인 시각화 데이터 생성 역량을 키워주며, 다양한 툴들을 활용하여 표현력과 업무 유연성을 발휘할 수 있게 해준다는 점이 인상적인 책이었다.

앞서 언급한대로 전문적인 퀄리티를 표현하고 싶은 비 프로그래머 분들, 다양한 표현방식의 경험을 쌓고 싶은 프로그래머 분들께 추천하고 싶은 책이다.


 

오늘 리뷰할 도서는 [핸즈온 데이터 시각화] 입니다.

먼저 이 책에 대한 느낌을 한마디로 말하면 "아름답다" 입니다.

https://www.hanbit.co.kr/store/books/look.php?p_code=B1996635146

책 표지의 "호아친" 이라는 아마존에 사는 새도 아름답지만, 책의 모든 페이지가 컬로 인쇄로 되어 있다는 점과,

데이터 시각화에 필요한 대부분의 토픽을 모두 다루고 있다는 점에서도 아름답다 는 표현이었습니다.

이 책을 빠르게 보면서 과연 얼마나 많은 도구와 기법들을 설명하는지 보면서 상당히 놀랐습니다.

제가 그동안 개발하면서 경험했던 많은 내용들이 이 책에 담겨 있는거였는데,

이 말은 아직 경험해보지 못한 독자들에게는 간접 경험을 빠르게 전달 가능하다는 것입니다.

처음에는 가장 흔하게 사용하는 구글 시트에 대해 설명하고 있으며, VLOOKUP에 대해서도

다루고 있습니다. VLOOKUP 은 아주 오래전에 엑셀에서 사용해봤는데 아주 유용했던 경험이 있네요.

책에서는 전반적으로 시각화 도구에 대한 설명과 데이터 분석/처리 업무에 대한 내용도 다루고 있습니다.

4장의 지저분한 데이터 정리하기, 이 부분이 바로 데이터 분석/처리 업무에서 상당히 중요한 부분을 차지하는

데이터 전처리 또는 클리징 단계에 대한 내용이 되겠네요.

이후로는 차트를 어떻게 효율적으로 표현할지, 이렇게 하면 챠트를 보면서 오해의 소지가 생긴다던지 등의

예시를 잘 설명하고 있습니다. 지도를 잘 이용하는 방법도 자세한 설명들이 참 좋았습니다.

차트를 사용할거라면 반드시 6.1.1 챠트 분해하기를 보시기를 권합니다.

차트의 각 세부 요소들에 대한 설명이 자세히 나와 있습니다.

오래전에 차트 개발하면서 용어를 몰라서 헤메던 경험이 있었는데, 그때 이 책을 알았더라면 삽질을 덜 했겠네요.

그리고 제가 예전에 모니터링 솔루션을 개발하면서도 유용하게 사용했던 "스파크라인" 도 등장합니다.

작은 차트이지만 여러 데이터를 효과적으로 보여주고 싶을때 추천합니다.

책의 후반부에는 다양한 지도를 다루고 표현하는 방법에 대해 상당 분량이 나옵니다.

지도를 이용하는 개발자 또는 사용자에게는 큰 도움이 될거 같습니다.

4부의 거짓을 발견하고 편향 줄이기는 정말 중요하고 재미 있는 부분 입니다.

같은 데이터라도 어떻게 표현하느냐에 따라 오해를 사거나 거짓이 될 수 있는 부분들에 대한 설명이니까 읽어보면

아주 재미 있습니다. 이제 마무리를 하자면...

데이터를 다루는 엔지니어나 시각화가 필요한 독자들에게 이 책은 큰 도움이 될거 같습니다.

저도 빅데이터 쪽으로 프로젝트를 해본 경험이 있는지라, 이런 경험은 정말 얻기 힘든 것들 입니다.

이 책을 통해서 그런 좋은 경험이나 인사이트를 얻을 수 있다는건 정말 큰 장점이 되겠네요.

꼭 이 책을 보시기를 권합니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

핸즈온 데이터 시각화.jpg

인공지능, 딥러닝을 얘기하는 기사가 점점 더 많아지고 있습니다.

딥러닝이 있으려면 무수히 많은 데이터가 있어야 합니다.

그리고, 데이터가 있는 곳에는 편향이 존재할 가능성이 있으므로 주의해야 합니다. 편향이 개입된 데이터가 판단과 결정을 왜곡시킬 수 있기 때문입니다.

시각화도 데이터를 바탕으로 한다는 점에서 비슷한 맥락을 가진다고 생각합니다.

오히려 시각화가 가지는 힘 때문에 더 주의를 기울여야 합니다.

 

데이터를 살피다

전달하려는 내용이 담겨있는 데이터. 그 데이터를 어떻게 다루어야 하는지 알 수 있습니다.

데이터가 내용을 가지고 있기는 하지만 주어진 그대로 사용할 수 있는 경우는 거의 없다고 봐야 합니다.

데이터가 만들어지기까지 시간이 걸리고 참여한 사람도 늘어납니다. 그 얘기는 데이터 안에 다양한 예외 상황이 존재할 가능성이 높다는 뜻입니다. 숫자 형식, 날짜 표기, 자료 누락 등.

더하여 기초 자료는 있으나 원하는 값이 없어서 주어진 자료를 이용하여 필요한 데이터를 산출해야 할 수 있습니다.

이렇게 데이터를 찾고 비교, 정리하기 위해 필요한 기술들을 알려줍니다.

굳이 시각화가 아니더라도 자료 정리에 큰 도움이 되리라 생각합니다.

 

시각화를 위한 도구들

시각화를 구축하는 도구들을 알려줍니다.

대표 시각화 도구인 차트, 지도, 테이블만 다룹니다.

각각을 디자인하는 원칙과 종류, 사용하는 방법을 지나치다 싶을 정도로 상세하게 단계별로 알려줍니다.

그리고 이렇게 시각화한 결과를 어떻게 공유하는지 알 수 있습니다.

대화형 시각화 도구로써 깃허브와  차트 라이브러리, 지도 데이터 전용 프로그램 사용법을 설명합니다.

각 단원이 거의 독립적이어서 그때그때 찾아보기에도 좋습니다.

 

다시 스토리

Part 4를 읽으며 데이터를 바라보는 시야가 바뀌어 가는 걸 느꼈습니다.

미처 생각하지 못했거나 문화나 주어진 환경, 상황에 의해 배제되어 인식하지 못했던 부분이 있을 수 있다는 데까지 생각이 나아가는 자신을 발견할 수 있습니다.

데이터를 제대로 보고 전달하려는 고민을 볼 수 있습니다.

'이 정도까지 생각하는 구나'

'내 시야가 스스로 생각하는 것보다 많이 좁구나'

 

진실한 얘기를 오해 없이 전달하는 데이터 시각화 안내서로서 좋은 선택이라 생각합니다.

단순히 차트, 지도 만들기로 접근해도 괜찮고,

스프레드 시트 다루는 기술만으로도 만족하실 분도 계실 듯합니다.

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."



 

이 글은 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

 

데이터와 시각화가 왜 중요한가

 

 

"대한민국은 빈부 격차가 심하다"

"외국인은 내국인보다 낮은 임금을 받는다"

"소프트웨어개발자는 다른 직종보다 업무 시간이 많다"

 

 

위 문장들은 그럴듯 해보이지만, 뒷받침하는 데이터가 없기 때문에 문장 만으로 진실 여부를 판단하기 어렵다. 살면서 하는 모든 생각들을 데이터로 검증하기는 어렵지만, 적어도 다른 사람에게 어떤 주장을 할 때는 뒷받침을 할 수 있는 충분한 데이터가 필요하다. 연구를 하거나, 성능 최적화를 할 때도 마찬가지로 설득력이 있는 데이터가 필요하다. 하지만 데이터가 설득력이 있다고 해서 한 눈에 들어오는 것은 아니기 때문에, 보는 사람이 쉽게 파악할 수 있도록 데이터에 따라서 적절하게 시각화하는 것도 중요하다.

 

 

데이터 시각화를 쉽게 배울 수 있는 책

 

이 책은 내가 최근에 읽은 IT 관련 서적 중 가장 진입장벽이 낮다. 프로그래밍을 해보지 않았어도 구글 스프레드시트, 에어테이블, Chart.js, 하이차트 등의 다양한 도구로 데이터 시각화 방법을 어렵지 않게 배울 수 있다.

 

 

데이터를 수집하고 올바르게 시각화하기

다른 사람이 이해하기 쉽게 데이터를 시각화하는 것도 중요하지만, 그보다도 중요한 것은 데이터가 편향되지 않고 정확하며, 오해를 불러일으키지 않도록 하는 것이다. 어떤 자료들은 데이터의 출처가 명확하지 않거나, 의도적으로 오해하기 쉽게 만들어졌을 수 있다. 이 책은 이러한 함정에 속지 않도록 도와줌과 동시에 독자가 부정확하거나 부적절한 시각화 자료를 만들지 않도록 도와준다.

 

 

데이터는 정말 활용하기 나름이라고 생각합니다. 상황에 따라 크게 신경쓰이지 않을수도, 혹은 정말 중요한 키가 되어 전략의 핵심으로도 쓰일 수 있습니다. 하지만 단순한 객관적인 데이터들을 나열한다고 해서 설득이 저절로 되는 건 아니며, 내가 의도하는 스토리가 무엇이고 데이터들이 어떻게 쓰이는 지, 그리고 이 데이터들이 정말 진실된 내용인지에 대해 명확히 이해해야 할 것입니다.

 

이 책은 데이터를 더욱 효과적으로 시각화하는 방법에 대해 배워보며, 진실하고 의미 있는 스토리를 만들기 위해선 어떤 기술이 필요하고 어떤 툴들이 효과적인지, 어떤 템플릿이 좋으며 이 과정에서 거짓되지 않고 진실되고 의미 있는 스토리로 전달하기 위해선 어떤 점들을 고려해야 하는지에 대해서도 생각을 할 수 있습니다. 이 과정에서 컴퓨터 활용 능력 등의 사전 지식은 크게 필요하지 않고, 사용하는 툴들 또한 다양하게 소개해주고 있으므로 부담을 갖지 않고 접근할 수 있어 좋습니다.

 

이 책은 디자인 원칙과 단계별 튜토리얼을 통해 정보에 기반한 분석과 주장을 보다 통찰력있고 설득력 있게 만드는 방법에 대하여 이야기 해줍니다. 근거와 소스에 관한 노트를 추가하면 문장이 더욱 설득력이 있는 것 처럼, 데이터 기반으로 작성된 글도 적합한 테이블, 차트, 지도와 결합될 때 더욱 강력해진다고 합니다. 말은 우리에게 스토리를 전달하지만, 시각화는 정량적이고 이성적이며 공간의 패턴을 이미지로 변환시켜 데이터 스토리로 보여지게 됩니다.

 

​다양한 무료의 데이터 시각화 디지털 도구를 다루게 될텐데, 차트, 지도, 테이블, 인포그래픽 등의 정의에 대해 먼저 이야기 해주며 이들을 효과적으로 다루는 툴에 대하여 하나둘씩 천천히 설명해줍니다. 입문자들이 주요 개념을 이해하는 과정에서 단계별 튜토리얼을 경험해보며 더욱 시야가 넓어질 수 있겠습니다. 게다가 단순한 정적 시각화 뿐만이 아닌, 상호작용하는 대화형 테이블, 차트, 및 지도를 만드는 방법에 대해서도 알려주고 이를 온라인 상에 배포하는 내용 또한 담고 있어 활용도가 높게 느껴졌습니다.

 

1부 기본 기술에서는 도구와 데이터를 이용해 데이터 스토리를 구상하는 기초 기술을 배우고, 2부 시각화 구축에서는 사용하기 편한 드래그 앤 드롭 툴을 활용하면서 많은 시각화 실습을 해보게 되는데, 이 과정에서 무엇이 가장 적절한 지에 대해서도 알아볼 수 있습니다.

 

​3부 코드 템플릿과 고급 도구에서는 어떤 툴이 더욱 효과적이고, 특히 시각화의 모양을 사용자가 어떻게 입맛대로 정의할 수 있는 지에 대해서도 알 수 있습니다. 4부 진실하고 의미 있는 스토리 전달하기에서는 진실하고 의미 있는 스토리를 전달하는 것으로 단순히 청중들을 속이는 것이 아닌, 왜 해석이 중요한 지에 대한 근거를 이야기하는 데에 도움이 되는 진실한 내러티브 구축 과정에 대해 이야기 해주며 책을 마무리하게 됩니다.

 

특히 이 책은 사람들이 오도할 수 있는 잘못된 데이터 시각화를 하는 것을 피하고, 대화형 데이터 시각화를 통해 진실하고 의미있는 스토리를 전달하는 과정에 대해 배울 수 있단 점이 인상깊습니다. 그리고 매우 쉬운 튜토리얼부터 시작하여 어떤 데이터들을 구현하고 싶은지, 그리고 어떤 것들이 중요하며 이 과정에서 효과적이면서도 오해없는 방향으로 데이터를 보여줄 수 있단 점을 배울 수 있어 좋게 느껴졌습니다.

 

​데이터 시각화를 통하여 다양한 전략을 짜고 싶으신 분들께, 혹은 데이터 시각화에 대해 관심이 조금이라도 생긴 분들께 입문용 서적으로 추천드립니다.

 

핸즈온 데이터 시각화_02.png

 

이 책은 데이터 시각화를 위한 특정한 하나의 프로그램을 깊이있게 다루기 보다, 데이터 시각화가 무엇이고 왜 필요한지, 그리고 어떠한 도구들이 있으며, 어떤 식으로 학습해 나가야 하는지를 안내해주는 종합적인 입문서이다.

 

이미 다들 경험을 해봤듯이, 재무제표와 같이 수많은 숫자들이 들어 있는 표를 볼때와, 그것을 차트와 같이 그림으로 표현을 해주면 이전의 숫자들과의 차이를 한눈에 쉽게 알수 있고 이해하기 빠르기 때문에 이미 실제 업무등에서도 많이들 사용하고 있다.

 

이러한 시각화를 위해서 이 책에서는 드래그앤 드롭으로 쉽게 사용 사용할수 있고, 무료인 도구들을 여러개 소개를 해주고 있어서, 어떤때 어떤 도구를 사용하는게 좋은지를 알수 있고, 다양한 도구들을 사용해서 이미 공개되어 있는 데이터들을 가지고 바로 실습을 따라하면서 학습할수 있어서 이해하는데도 도움이 된다.

 

 

 

 

 

핸즈온 데이터 시각화_03.png

 

 

시각화를 하기 위한 데이터들을 표로 작업하기 위해서 스프레드시트로 엑셀을 많이들 사용하고 있는데, 이 책에서는 무료로 사용할수 있는 도구들 위주로 설명을 해주고 있기 때문에, 엑셀과 비슷한 기능을 가지고 있으면서 무료로 이용할수 있는 구글시트(구글 스프레드시트)를 가지고 실습을 하고 있으며, 스프레드시트 작업에 익숙하지 않은 분들을 위해서 책의 앞부분에서는 일정부분을 할애하여 이 책을 학습하는데 필요한 정도의 스프레드 스킬 향상에 도움을 주고 있어서, 엑셀등을 사용해보지 않았거나 사용에 익숙하지 않은 분들이라도 따로 엑셀 책을 공부하지 않더라도 교재에서 소개하는 예제들을 따라하면서 학습하는데 어려움이 없다.

 

 

 

 

 

 

핸즈온 데이터 시각화_06.png

 

교재 157 페이지에 있는 "6.1 차트 디자인 원칙" 부분은 차트를 만들때 도움이 되는 가이드라인으로, 꼭 한번씩 읽어두면 엑셀에서 차트 작업을 할때나 문서 작업을 할때도 많은 도움이 될거 같아서, 모든 사람들이 한번씩은 꼭 읽어보는 것을 추천하고 싶다.

 

 

 

 

 

 

 

핸즈온 데이터 시각화_07.png

 

 

이 책을 통해서 새롭게 알게 되었고, 흥미로웠던 부분은 챕터7 부분에 '데이터를 지도로 시각화하기'로 데이터를 구글지도 플랫폼상에 표현을 해서 시각화 지도를 만드는 방법에 대해서 설명을 해주고 있는데 정말 이 책이 아니였다면 저는 이러한  방법에 대해서 어떻게 만들어지는지도 모르고 일일이 수작업으로 만들어야 하는지 알았는데, 이번 기회에 활용을 해서 국내 데이터를 가지고 국내 지도로 한번 만들어 보려고 한다.

 

 

 

 

 

 

핸즈온 데이터 시각화_05.png

 

이 책의 총 4개의 파트중에서 핵심이 되는 파트는 중간에 2, 3으로 파트2에서는 무료로 제공하는 도구들을 이용해서 드래그앤 드롭식으로 따로 코딩을 할필요 없이 데이터를 가지고 원하는 차트를 만들어 낼수 있으며, 파트3은 고급 수준의 파트로 Github에 등록하고 자바스크립트 라이브러리인 Chart.js와 하이차트를 사용해 대화형 차트를  만드는 것을 학습하게 되는데 깊이 있는 프로그래밍까지 하고 싶지 않은 분들은 파트3 부분은 그냥 참고로만 읽어보고 넘기시면 된다.

 

이 책에 대해서 아쉬웠던 부분은 아무래도 번역서라서 그런지 예제에 활용한 데이터들은 미국등 외국에 대한 자료라서, 실제로 이 책을 통해서 학습하는 분들중에 이러한 데이터를 필요로 하는 분들도 거의 없을 것이기에, 바로 업무적으로 적용을 하면서 학습을 하기에는 조금 쉽지 않을수 있다는 점이다.

 

이러한 번역서라서 아쉬운 부분이 있기는 하지만, 데이터 시각화에 대해서 공부를 하고자 하거나 업무적으로 필요하신 분들에게 최고의 입문서가 아닌가 싶어서 추천한다.

 

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

한때 '정보의 바다'라는 말로 수 많은 데이터를 표현하였으나 이제는 옛말이 되버린지도 오래. 무수한 데이터속에서 유의미한 의미를 끄집어 내고 이를 통해 의미있는 스토리를 전달 할 수 있는 데이터 시각화 기술이 필요한 시대에 살고 있습니다.

이 책은 특정 언어(파이썬, R 등)에 종속적이거나 코딩 지식을 요구하는 서적은 아닙니다. 초심자들도 무료로 사용할 수 있는 여러 온라인 도구를 사용하여 쉽게 따라할 수 있는 데이터 시각화 입문 도서입니다. 책은 데이터 시각화에 대한 간단한 소개 및 중요성에 대한 설명을 시작하고 있습니다. 이어,

 

스토리를 위한 적절한 도구 선택하기,

자주 사용하는 스프레드시트를 이용하여 데이터 수집,

데이터에서 숨어 있는 이해관계에 대한 심도 있는 질문과 통찰력 얻기,

데이터 가공하기

 

이렇게 정제된 데이터를 가지고 실제 시각화로 이끌고 있습니다.

 

훌륭한 도구를 이용한 차트 작성,

데이터를 지도에 표시하기,

테이블 활용하기,

웹을 통해 온라인에 공개하기

 

등의 순서 및 기초적인 시각화에 이어 좀더 고급기술로 안내합니다.

책은 여기서 순서를 마무리 하는 것이 아닌 마지막 2장을 할애하여 시각화를 잘못하여 한쪽으로 치우친 결과를 보여주거나 거짓에 대한 사례를 통해 의미만 있는 것이 아닌 데이터 표현의 진실된 스토리를 전달하는 방법을 안내하고 있습니다. 타 데이터 시각화 서적과 차별화된 부분으로 향후 개정판에서 좀더 분량을 늘려도 좋지 않을까 생각해 봅니다.

 

데이터 시각화가 막막하거나 여러 도구를 적재적소에 활용하고자 하는 통찰력을 얻고자 하는 이들에게 유익하고 친절한 안내서가 될 것입니다.

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공 받아 작성된 서평입니다.

데이터를 시각화하는 데 유용한 책입. 데이터를 어떻게 시각화할 수 있는지 방법을 알려 주며, 시각화하기 위해 데이터를 어떻게 이해할 수 있는지도 알려 줍니다. 또한 자바스크립트 라이브러리인 chart.js를 통해 시각화하는 방법에 대해서도 다룹니다.

이 책은 데이터 시각화를 처음 배우고 싶은 사람에게 딱 어울리는 그런 책입니다. 보통 데이터 시각화를 다루는 책이 파이썬의 판다스, 맷플롯립 같은 라이브러리를 활용하는 경우가 많은데 이 책은 이런 프로그래밍적인 내용을 빼고도 정말 제대로 데이터 분석, 시각화를 설명합니다. 물론 10장 부터 코딩을 조금 맛보게 되는데 아주 기초적인 내용이라 따로 공부하지 않아도 따라 할 수 있는 수준입니다. 초보자도 따라할 수 있는 책이라고 하지만 그 내용은 아주 방대합니다. 대학 교재로 사용한다면 한 학기 또는 1년 정도의 내용이라 생각합니다. 꼼꼼하게 공부하면 시간이 제법 많이 들 것 같습니다. 

 

구글 스프레드시트를 가장 많이 사용하지만 하나의 툴로 데이터 시각화를 설명하지 않고 그때그때 필요한 여러 툴을 사용합니다. (무엇보다 구글 시트로는 정말 다양한 일을 할 수 있습니다.) 작업마다 필요한 도구가 무엇인지 이 책을 통해서 배울 수 있습니다. 이런 사이트(도구)를 많이 알아야 데이터 처리, 분석, 시각화 작업을 할 때 편합니다.

 

책에 정말 다양한 차트, 지도가 나옵니다. 어떤 데이터에 어느 차트, 지도를 효율적으로 사용해야 하는지 다양한 사례로 배울 수 있습니다. 데이터 시각화 스킬만 배우는 것이 아니라 왜 이렇게 하는지 질문을 계속하는 구조입니다. 단순한 차트/지도로 그치는 것이 아니라 웹에 임베딩해서 사용자와 상호작용하는 것 까지 경험할 수 있습니다. 개인적으로는 10장부터 나오는 깃허브 사용부터가 흥미로웠습니다. 이 책을 통해 깃허브와 아톰 텍스트 편집기로 코딩을 입문할 수 있습니다. 처음 코딩을 할 때 이런저런 세팅이 참 귀찮은데 이 책을 따라하다보면 쉽게 개발환경을 준비할 수 있습니다.

 

데이터 시각화하는 기술적인 부분도 중요하지만, 책의 마지막 부분에서는 데이터 시각화를 잘 하는 비기술적인 부분도 다룹니다. 신문이나 뉴스를 보면 다양한 차트로 데이터를 왜곡시키는 것을 볼 수 있는데 이 때 사용하는 방식이 무엇이며 이것을 어떻게 피할 수 있는지 설명합니다. 그리고 자신이 가지고 있는 데이터의 의미를 잘 전달할 수 있는 데이터 스토리 노하우도 배울 수 있습니다.

 

데이터 시각화 책이라고 하지만 거의 데이터 분석, 데이터 과학의 기초 내용을 포함하고 있습니다. 쉽지만 깊이있는 책, 공들여 만든 책이라 생각합니다. 회사나 여러 사이트에서 제공하는 데이터로 뭔가 재미있는 작업을 해보고 싶은 분에게 추천하고 싶은 책입니다. 지금 이 책의 내용을 빠르게 한번 살펴봤는데 개인적으로 시간이 날 때마다 책을 다시보면서 노하우를 습득할 생각입니다. 이 책의 내용만 어느정도 자기 것으로 만들어도 회사는 물론 정말 다양한 곳에서 쓸모가 있을 것 같습니다. 배울 점이 참 많은 책이네요. 이 책을 기점으로 데이터 관련 다양한 분야를 도전해보면 재미있을 것 같습니다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


일을 하다보니 점점 데이터를  모으고, 정리하고, 분류하고, 통계내고, 차트그리고....

이런 일이 많아 지고 있다.


그러던중 올해 마지막 서평 책 중에 이 책이 눈에 들어 왔다.

결론부터 말하자면 나에게 상당히 도움이 되는 책이다.


책 내용의 구성은 먼저 데이터 시각화에 관한 설명으로 시작한다.


이후에 데이터 스토리를 위한 도구의 선택을 시작으로 스프레드시트 잘 사용 하는 방법, 데이터를 찾고 모으는 방법,

데이터를 정리하고 비교하는 방법등의 기본 기술에 관한 내용으로 파트1을 구성하고 있다.


여기서 엑셀이 아니라 스프레드시트를 사용한 것은 반길 만한 일인것 같다.

엑셀은...국내에선 대부분 기업이 사용하긴 하지만 점점 오픈소스 오피스 어플리케이션으로 넘어 가는 추세도 보이고 있고해서

여러 비슷한 종류의 프로그램들과 호환성을 생각한다면 좋은것 같다.


데이터를 찾는 내용은 사실 기술적인 내용 보다는 그냥 여러 데이터 수집 경로를 설명하고 있는듯 하다.

데이터 수집처가 확실 하다면 가볍게 읽고 참고 정도만 해도 좋을것 같다.


파트2로 넘어가면 차트 만들기를 시작으로 본격적인 시각화에 관한 내용을 다룬다.

특히 차트 챕터는 다양한 차트를 만들어 내야 하는 입장에서 상당히 도움이 되는 내용을 많이 다루고 있다.


이후에 지도로 시각화 하는 내용과 테이블을 사용하는 방법, 웹에 임베딩 하는 방법에 관하여 다루고 있다.


파트3에서는 깃허브를 이용하여 코드 공유하여 사용하는 내용, Chart.js등 차트 템플릿 이용하는 방법, 리플릿 맵 템플릿 사용법과 지도 데이터를 변환하여 다루는 내용으로 이어진다.


파트4는 데이터의 스토리에 관한 내용을 다루고 있다.


내 경우에는 데이터 수집? 축출? 을 위해서 파이썬을 사용중이고...

데이터 정리를 위해서는...엑셀, 경우에 따라서는 RDBMS 등을 사용중이라...

다른것 보다 차트관련 내용이 일단 가장 마음에 드는듯 하다.


연말에 인사이동으로 좀 어수선 + 마음이 붕~ 상태이긴 한데

앞으로 가야 할 부서가 데이터 분석쪽으로 정해 지면서 리뷰 도서가 왠지 내 운명을 말해주는 듯한 느낌이랄까....


한 해를 마무리 하면서 마지막 리뷰 도서가 마음에 들어서 좋다.



데이터에 대해 이렇게 끊임없이 질문을 해올 수 있음을 다시 깨달았다.

책은 스토리텔링을 어떻게 할 것인가 그리고 그걸 어떻게 표현할 것인가를 알려주는 것이 주인 것 같다.

그리고 그 표현을 하기 위한 툴도 소개해주는데 내가 알고 있는 툴은 엑셀,최근에 알게된 태블로.. 정도였는데 여기서는 다양한 툴을 사용한다.

중요 포인트는 툴은 그저 표현을 위한 도구지 중요한 건 가진 데이터를 어떻게, 무엇을 표현할 것인데? 이거다.

얻은 데이터를 어떻게 얻을 것인지, 무엇을 나타낼 것인지, 민감한 데이터는 어떻게 할 것인지 등. 나는 이렇게 데이터를 얻고나서 끊임없이 질문해본 적이 있나? 그냥 썼던 거 같은데 말이다.

시각화 구축에도 엑셀에서 다양한 차트가 있는데 써봐도 선 차트나 원형차트나 잠깐 대충 써봤는데 이걸 모두 한번씩 보여준다. 다양한 툴로.

데이터를 어떻게 시각화 하는지 보여주니까.. 근데 또 어떻게 장난질 칠 수도 있겠다는 것도 있으니 한번 읽어보면 좋을 거 같다.



screencapture-blog-naver-rapperkjm-222834995390-2022-08-04-18_11_35.png

 

효과적인 데이터 시각화 전략

20가지 시각화 도구 사용법

 

개인적으로 데이터 분석에 관심이 많습니다. 그래서 데이터 분석에 관한 여러 가지 툴과 기술에 대한 책들을 보며 공부하고 있습니다. 그동안엔 R이나 파이썬 같은 데이터 분석 툴에 집중해서 공부를 해 왔다면 이번에 보게 된 "핸즈온 데이터 시각화"는 그와 달리 조금 특별한 책이었습니다.

 

핸즈온-데이터-시각화-01.jpg

 

 

 

데이터 분석에 관한 다른 책들에도 기본적으로는 데이터 시각화에 대한 이야기를 다룹니다. R에서는 gglpot, googleVis, 파이썬에서는 matplotlib, seaborn 같은 시각화 라이브러리를 활용하여 다양한 차트들을 그릴 수 있습니다.

 

이 책 "핸즈온 데이터 시각화"는 이보다 훨씬 다양한 여러 가지 데이터 시작화 도구들을 소개합니다. 

 

핸즈온-데이터-시각화-02.jpg

 

 

  • 구글 스프레드시트/차트
  • 리브레오피스 캘크 스프레드시트/차트
  • 에어테이블 관계형 데이터베이스
  • 태블로 PDF 테이블 추출기
  • 오픈리파인 데이터 클리너
  • 데이터래퍼 차트/지도/테이블
  • 태블로 퍼블릭 차트/지도/테이블
  • Chart.js 코드 템플릿
  • 하이차트 코드 템플릿
  • 구글 내 지도 간단한 지도 제작기
  • 리플릿 맵 코드 템플릿
  • 깃허브 편집 & 호스트 코드
  • 깃허브 데스크톱 & 아톰 코드 편집기
  • GeoJson.io 편집 & 그리기 지오데이터
  • 맵세이퍼 편집 & 조인 지오데이터
  • 맵 래퍼 지오레퍼런스 이미지

 

다루고 있는 도구의 양과 종류가 엄청 많습니다. 책에서 설명한 대로 초심자도 쉽게 배울 수 있는 두 개의 도구(구글 스프레드시트와 데이터 래퍼 차트)만으로도 입문 수준의 거의 대부분을 완료할 수 있어서 큰 부담 없이 읽을 수 있었습니다. 처음 보는 생소한 도구들도 많이 만나볼 수 있었습니다.

 

이 책은 특정한 데이터 시각화 툴을 깊이 있게 A-Z까지 알려주는 종류의 책은 아닙니다. 디지털 도구 자체에만 초점을 맞추기보다는 데이터를 이용하여 스토리를 만드는 과정에 대해 충실하게 다루고 있는 책입니다. 

 

스토리를 만들기 위한 스케치 과정은 무엇인지, 그래서 어떤 도구를 선택할 것인지, 그리고 그 도구를 어떻게 활용할 것인지에 대한 이야기들이 담겨 있습니다. 예를 들어 데이터를 수집하기 위해서는 어떤 도구가 효과적인지, 정리하거나 차트로 나타내기에 유용한 도구는 무엇이며 어떻게 사용하는지의 형태로 정리되어 있습니다.

 

예전에 읽어 보았던 데이터 스토리(낸시 두아르테 지음. 한빛미디어)라는 책(이 책도 개인적으로 추천합니다!!)이 (시각화한) 스토리 자체에 좀 더 초점이 맞춰져 있다면 핸즈온 데이터 시각화는 거기에 좀 더 기술적인 면이 가미된 책이라고 볼 수 있을 것 같습니다. 기존의 데이터 분석 책들에 비한다면 조금 더 스토리에 초점이 맞춰진 것 같고요.

 

 

개인적으로 흥미 있었던 주제는 지도로 시각화하는 부분과 대화형 차트를 만들기 위해 Chart.js를 활용하는 부분이었습니다. 매번 구글 스프레드시트나 엑셀로 막대 차트와 원형 차트만 만들어본 사람의 입장에서 신기한 종류의 차트들을 만들어 볼 수 있어서 신선했습니다. 어쩔 수 없이 샘플 예제의 지도가 미국 지도였던 것이 아쉽기는 했지만 재미있는 분석들을 볼 수 있었고, Chart.js는 자바스크립트를 활용해서 차트를 만들어 본다는 것이 신기했습니다.

 

 

핸즈온-데이터-시각화-03.jpg

 

핸즈온-데이터-시각화-04.jpg

 

 

 

데이터 시각화의 목표는 정보를 '진실하고 통찰력 있는 스토리를 포착하는 이미지'로 인코딩하는 것입니다.

 

핸즈온-데이터-시각화-05.jpg

 

 

데이터 시각화의 How만 이야기하지 않고 Why에 대한 이야기도 놓치지 않았던 아주 멋진 책이었습니다.

 

다양한 종류의 데이터 시각화 도구를 경험해보고 싶다면, 데이터 시각화 개념을 단계별로 학습해보고 싶다면 이 책 꼭 읽어보세요.

 

이 서평은 한빛미디어 <나는 리뷰어다 2022> 서평단 활동으로 무상으로 도서를 제공받아 작성하였습니다. 서평단 활동과 별개로 저의 관심과 필요에 따라 책을 읽고 객관적으로 서평을 작성하려고 노력하였습니다.

 

출처: https://it4edu.tistory.com/213

책의 구성은 하나의 시각화 툴을 기반하고 있지 않고 다양한 툴들을 '도구'로서만 책 내용에 담고 있습니다. 기초 통계 보다는 데이터 스토리텔링을 할 때 할 수 있는 왜곡들에 대해 다룬 책입니다. 편향이나 정규화에 대해서도 다뤄볼 수 있다는 점이 이 책만의 특별한 점입니다. ??

(중략)

핸즈온 데이터 시각화이기 떄문에 직접해볼 수 있는 툴들을 기반으로 설명한다는 점이 좋지만, 너무 여러 도구를 사용하기 때문에 책의 두께에 비하면 TMT(Too Much Tools)로 보입니다. 아무래도저자의 의도는 툴보다 스토리텔링이었기 때문에 도구는 수단이고, 주로 데이터 스토리텔링을 어떻게 하는지를 초점으로 두고 있습니다. 하지만 책의 두께가 그리 두껍지 않고 매 도구마다 간단하게라도 도구에 대한 설명이 들어가기 때문에 위의 리스트의 반으로라도.. 도구의 범위를 줄였으면 하는 아쉬움이 있었습니다.
추가로 아쉬운 점은 책에서 종종 발견되는 오타도... 있었습니다.  

출처: https://vg-rlo.tistory.com/302 [vg-rlo:티스토리]

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

 

20220725_111157.jpg

 

20220725_111230.jpg

 

 

 

저는 현업 개발자로서 위치기반의 서비스나 다양한 차트를 이용한 통계분석 프로그램 그리고 재난 관련 전문 모니터링 프로그램 등을 개발하고 있습니다.

 

이러한 프로그램을 개발할때 데이터 수집부터 가공 그리고 최종 결과 표시를 하기까지 다양한 데이터 시각화 기술을 활용하고 있습니다.

 

경험이 부족했을 때는 포털의로그 분석 프로그램이나 해외 오픈 소스를 참조했지만 우리가 개발하는 프로그램과 지향하는 목표가 다르다 보니 결과 그래프나 표 등에서 효과적인 의사전달을기대하기 힘들었습니다.

 

간혹 엑셀 관련 서적에서효과적인 차트 설계 시 주의사항 등을 단편적으로 학습할 수 있었지만 올바른 데이터 시각화는 오로지 개인적인 경험에 의존해야만 했습니다.

 

그런데 운이 좋게 지난달에 구글의 스프레드시트(구글 스프레드시트 제대로 파헤치기, 강남석저)를 공부하게 되었고 이번 달에는 구글 시트를 기반으로 효과적인 데이터 시각화 전략과 20가지나 되는 다양한 시각화 도구 사용법까지 다룬 이 책을 리뷰하게 되었습니다.

 

본 책이 500 페이지 정도 분량이지만 개념 설명 부분을 꼼꼼히 읽다 보면 끝까지 학습하기까지 꽤 오랜 시간이 걸렸던 것같습니다.

 

혹시나 엑셀을 이용한 데이터과학 분야까지 정복하고 싶은 분은 엑셀만 알아도 할 수 있는 데이터 과학, 한빛미디어을 읽어 보시 길 추천 드립니다.

 

개발자라면 데이터 분석까지끝나고 결과를 보통 차트를 많이 활용하는데 이 책에서는 현업에서도 자주 사용하는 Javascript 라이브러리인HightChartsChart.js에 대해 상세히 다루고있습니다.

 

그리고 위도, 경도 혹은 주소 데이터로 지도 서비스를 구축할 때 디자인 원칙, 시각화기술에 대해서도 학습하게 됩니다.

 

후반부에서 다루고 있는차트, 지도 데이터를 표시할 때 잘못된 시각화로 데이터를 왜곡할 수 있어 주의가 요구되는 예제에 대해배우는데 초보 개발자들이 의도와 다르게 범하기 쉬운 실수에 대해 언급하고 있습니다.

 

목차를 보면 데이터 시각화에대해서 저자가 매우 방대한 지식을 체계적으로 잘 정리해 놓았다는 것을 알 수 있습니다.

 

수집된 데이터를 리포트로만들거나 온라인 서비스를 위해 차트, 지도 등으로 개발하고자 한다면 이 책에서 제공하는 올바른 효과적인시각화 설계법에 대해서 한번 상세히 읽어 보시 길 바랍니다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

 

복잡한 데이터들을 어떻게 시각화 하느냐에 따라 그 전달력은 많은 차이가 날것이다.이책은 그런 데이터들의 시각화를 어떻게 하면 도움이될지를 가이드 해주는 책이다.

 

먼저 상황이나 데이터에 따라 많은 시각화 유형과 유료툴보다는 무료로 사용할수있는 다양한 툴들을 소개 와 사용법을 알려줘서 고마운 책이었다.

 

 

 

1. 구글시트

구글 시트만으로도 고급화된 피벗테이블이나 함수들을 활용하여 엑셀을 대채해서 사용가능한 기능을 안내 한다.

 

스마트 클린업 같은 (데이터 > 데이터 정리 > 정리 제안 사항 ) 기능을 활용하면 데이터 정리대상도 확인해볼수 있다.

 

 

1.jpg

2. 오픈리파인.

 

데이터 정리 툴로 오픈리 파인을 추천했다. 데이터들을 정재 하거나 스펠링이 비슷한 데이터들을 군집화 한다거나 하는 데이터 정리가 가능했다.

매우 좋은 툴을 새로 알게 되었다.

 

2.jpg

3. 테블로 퍼블릭.

 

데이터 시각화로 유명한 태블로도 무료로 사용할수있는 태블로 퍼블릭이라는 제품이 있었다.

무료버전인 만큼 제작한 데이터 시각화 결과물이 모두 공개된다는 단점이 있다고 한다.

보안에 민감한 데이터는 사용하지 말아야 될거같다.

 

 

4.jpg

그 외에 leaflet을 활용한 지도를 시각화하는 방법들이 수록되어있고,

 

대다수 무료 툴로도 다양한 시각화를 표현할수 있고, 개발자가 아닌 데이터를 시각화하고 싶은 사람누구나 책을 접해서 익힐 수 있는 쉬운내용이 수록되어 있다.

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

데이터를 분석하고 분석된 결과물을 바탕으로 머신러닝 혹은 딥러닝 모델을 구현하거나 그 구조를 정의하여 학습을 수행하는 일련의 과정. 구축한 머신러닝 혹은 딥러닝 모델을 서비스에 적합한 파이프라인과 함께 시스템화 하는 과정

위 두 과정을 실제 실무에서 적용할 때, 꼭 같이 추가해줘야 할 부분이 바로 시각화 영역이라고 생각합니다. 왜? 그래서 왜? 뭐가 좋은건데? 뭐가 바뀌는건데? 다양한 질문들이 나오는 현실에서 시각화를 통해 보다 쉽게 다른 사람이 파악하는 부분이 중요하다고 생각하기 때문입니다.

화면 캡처 2022-07-25 005010.png

 

이 책은 이런 부분에 있어 다양한 경험을 쌓을 수 있도록 도와줌에 있어 큰 역할을 한다고 여겨집니다. 책을 통해 실제 데이터를 시각화하는 경험을 정말 방대하게 쌓을 수 있습니다.

또한 책이 풀컬러본임에 따라 눈에 확 들어와 읽히는 부분에 막힘이 없었습니다.

실제 현장에서 데이터를 다루며 설명가능한 모델 or 파이프라인 구축 or 분석가 분들에게 강추드립니다.

데이터 분석, AI 등을 공부하는 학생, 직장인 분들에게도 시각화를 통해 효과적인 EDA를 할 수 있게 도와줄 것이라 확신합니다.

데이터 시각화는 우리 주변에서 흔히 사용되고 있습니다. 하루치의 신문도 많은 그래프를 포함하고 있고, 과거 자료와 연관시켜 통계를 표현한 그림을 확인할 수 있습니다. 최근 머신러닝과 데이터 과학 대한 관심이 증가함에 따라 주어진 데이터를 사전에 분석하고 통계 내기 위한 데이터 시각화가 주목받고 있지만, 머신러닝 책에서 사용했던 몇 가지 시각과 시각화 방법이나 캐글이나 GitHUB의 기법/코드들을 깊게 생각하지 않고 가져다 사용하는 경우가 많이 있습니다. 이 책은 데이터 시각화 만을 다루는데, 이를 정의하고 어떤기술이 필요하며 좋은 차트/지도/테이블의 기준은 무엇이고, 마음가짐이나 주의할 점은 어떤 것들이 있는지에 대해 쉽게 설명하고 따라 할 수 있는 식으로 만들어진 서적입니다. 데이터 시각화 관련 관심이 있는 입문자를 대상으로 하여, 비단 데이터 과학자 뿐만 아니라 다른 이들이 만든 그래프, 차트 등을 블로그나 보고서에 포함시키고 싶은 분들에게 유용합니다.

 

저자는 교육학 교수로 학생들에게 개인의 자료를 차트나 지도로 표현하는 시각화 과정을 가르치고 있습니다. 아마도 입문자 수준의 학생들을 대상으로 하였을 것이고, 많은 피드백을 받으며 이들에게 최적화된 교육 방법이 무엇인지 고민했던 것 같으며, 이 부분은 책 전반에 녹아들어 있습니다. 책 전반에 걸쳐 책을 쓰는 사람의 관점뿐만 아니라 책을 보는 관점에서 놓칠 수 있는 부분이나 시행착오를 기술해 놨기 때문에 책을 실습하면서 생기는 많은 궁금증 들을 미리 해결할 수 있습니다. 

 

챕터0에서 데이터 시각화를 이용하여 의미를 자연스럽게 왜곡시킬 수 있으므로 주의하라는 마음의 환기를 시켜주는데, 다른 책이였으면 뒷부분에 나올 법 한 내용이지만 책의 서두에 가장 주목받는 부분에서 이를 간략히 언급하는 것이 인상적이였습니다.

챕터1에서는 구글 퓨전테이블(Google Fusion Tables) 등 개정판 이전에 기술되었던 내용이라도 변경되거나 없어진 제품이 있다면 내용에 반영하여 최신 내용을 반영했다는 내용과 함께  비트워든(Bitwarden, 패스워드관리도구)을 추천하는 등 입문자들이 최대한 실습에 도움이 되고 활용할 수 있도록 내용이 구성되어 있습니다. 마치 착한 대학강사가 학생들에게 실질적 도움을 주기 위해 구두로 설명해 주는 팁을 알려주는 것 같습니다.

챕터2를 통하여 구글 설문지를 통한 데이터 수집, 각종 스프레드시트를 통한 데이터 확인 방법을 알아봅니다. 데이터를 확인하는 가장 기본적인 방법인 스프레드시트 선택, 기본적인 연산 방법, 포멧의 종류 등을 설명하며, 입문자들은 별도의 스프레드시트 내용을 학습할 필요 없이 기본적인 내용부터 기본 기술과 개념을 배울 수 있습니다.

챕터3에서는 데이터를 얻을 수 있는 위치와 주의사항에 대해 설명합니다. 역자분께서 이 챕터에 국내 데이터를 얻을 수 있는 다양한 위치를 덧붙였다면 더 활용도 높은 도서가 될 수 있었을 것 같아 아쉬운 부분이였습니다.

챕터4에서는 테이블을 구글 시트에서 정리하고 타불라로 PDF에서 추출하며, 오픈리파인을 이용해 정리하는 과정 등을 실습하고 올바르게 시각화를 위한 결측값, 잘못된 값, 형식이 다른 값 등을 보정하는 방법과 기술에 대하여 설명합니다.

챕터5에서는 데이터 비교를 위해 정규화 등의 일반적인 전략을 소개합니다.

파트2에서는 파트1에서 설명한 지식을 기반으로 본격적으로 시각화를 설명합니다. 챕터6의 차트, 챕터7의 지도, 챕터8의 테이블을 설명하며 이 책의 핵심 내용입니다.

챕터6에서는 스토리를 차트에 반영하는 전반적인 방법에 대하여 알아보며 미적 지침 등에 따라 좋은 차트를 만드는 법을 배웁니다. 챕터7에서는 포인트와 폴리곤을 활용하여 스토리를 전달하고 디자인 원칙에 따라 지도를 통한 좋은 시각화 방법에 대하여 설명합니다. 챕터9를 통해 웹페이지에 시각화 자룔르 임베딩하는 방법을 실습하고 있습니다. 파트3에서는 데이터가 있을 때 외부 템플릿을 이용하는 방법으로 고급스러운 시각화를 만드는 방법을 설명합니다.

 

저와 같이 시각화에 대해 궁금하여 도서를 선택하고자 한다면 파트2 부분을 읽어보고 선택하시면 도움될 것 같습니다.

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

이 책은 제목 그대로 보고 따라 할 수 있는 데이터 시각화 입문서이다.

 

물론 평소 시각화에 관심이 많으며, HTML, Javascript, CSS, GitHub를 알면 훨씬 이해하기 수월할 것이다.

하지만 이것마저 몰라도 보고 데이터 시각화의 관심과 그저 따라 할 수 있는 인내심만 있으면 저처럼 재미있게 읽을 수 있으며, 

막연했던 차트나 지도들이 이제는 구체화 되며 자신감을 가지게 되는 신기한 경험을 할 것이다.

지도는 완전 전문가 수준으로 도약 가능하겠다. ^^

 

책의 구성은 전체 4부로 구성되어 있으며, 1부는 시각화 도구에 대한 설명과 시각화 도구 선택 방법, 스프레드(엑셀) 스킬, 데이터 찾기, 

데이터 전처리, 데이터 분석 및 정규화 전략에 관해서 설명한다. 

2부 부터는 다양한 시각화 도구로 시각화하는 방법, 즉 차트, 지도, 테이블, 웹에 게시하는 예제를 함께 따라 해본다. 

3부에서는 깃허브로 오픈 소스 시각화 코드 템플릿을 가져와서 적용하는 방법, Chart.js, 하이 차트, 리플릿 맵 템플릿, 

지도로 시각화하기 위한 데이터 변환에 대해서 자세히 배우며, 

마지막 4부는 차트와 지도로 말미암은 거짓된 정보 표현을 줄이는 방법과 진실한 정보로 데이터 스토리텔링 하는 방법을 다룬다.

특히 부록에서는 예제를 진행하면서 빈번히 발생할 수 있는 오류에 대한 대처법과 팁에 관해서 설명하고 있다.

 

사실, 이 책을 읽고 많이 반성하고 있다.

여태까지 프로젝트에서 차트 요구사항이 오면 고객의 요청으로 단순히 툴을 통해 그리거나 차트를 미리 정의해 달라고만 했었다.

어떻게 하면 고객의 니즈를 효과적으로 구현할 수 있는지는 나의 관심사가 아니었다.

 

이 책을 읽고 난 이후로는 지금까지 내가 아는 시각화는 협의의 단순한 도구 활용법이었음을 알게 되었으며,

앞으로는 데이터의 시각화를 위해서 먼저 고려해야 할 사항과 효과적인 표현 방법,

완성된 차트가 요구사항에 대해 제대로 들어맞는지 다시 질문하게 되는 과정을 거치게 될 것이다. 생각만큼 어렵지 않다.

 

저자도 책에 많은 부분을 할애하며 데이터로 스토리텔링 하는 과정과 데이터 찾기, 추출, 전처리하는 방법,

그리고 그 과정에서 발생할 수 있는 오류를 파악하고 줄이며, 진실한 내용을 전달하는 법에 대해서 계속 설명하고 있다.

저 역시도 이제는 완전히 공감하는 내용이다.

스토리텔링은 시간이 지나도 변하지 않으며, 차트를 구현하는 것은 시대에 따라 도구들은 계속 개선되면서 변화하기 때문이다.

 

시각화에는 반드시 데이터의 출처를 반드시 남기며, 차트와 데이터에 대한 오류가 없는지 확인할 것이며,

표현하고자 하는 내용에 오해는 없는지, 제대로 전달되었는지, 더 나은 방법이 없는지 끊임없이 자문해야 할 것이다.

 

책을 읽으면서 가장 마음에 드는 문구로 이번 리뷰를 마무리하고자 한다.

 

데이터 시각화의 목표는 정보를 

'진실하고 통찰력 있는 스토리를 포착하는 이미지'로 인코딩하는 것입니다.

14장 거짓을 발견하고 편향 줄이기, p453

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

빅데이터 시대라는 이름처럼 거의 모든 곳에서 데이터로부터 얻는 인사이트를 중요시하고 있다. 하지만 아무리 좋은 데이터를 많이 가지고 있어도 누군가에게 데이터의 의미와 가치를 제대로 전달하려면 특별한 방법이 필요하다.

데이터를 분석하고 해석하는 일은 항상 해오던 일이었다. 학생 때는 발표 자료나 논문을 위해, 창업에 도전했을 땐 시장성, 고객 반응, 성과 등의 자료로 성공적인 IR을 위한 자료를 완성하기 위해 셀 수 없이 많은 데이터로부터 이야기를 끌어냈었다. 이렇듯 학생, 교육자, 연구원, 직장인, 사업가 등 누구나 해왔던 일이다.능력은 '데이터 리터러시'라는 이름을 붙이면서 더 많은 관심이 쏟아지고 있다. 엔지니어로 일하고 있는 지금도 대시보드를 포함해 다양한 데이터 시각화 작업을 하고 있다. 또한 질병과 전쟁 등으로 많은 어려움이 이어지고 있는 근 몇 년간 질병의 확산 추이나 경제 지표 등 다양한 사회적 상황을 데이터에 기반하여 심각성을 강조하고 있기도 하다.

하지만 전달하려는 의미를 직관적으로 시사하면서 시각적으로 매력적인 시각화 자료를 만드는 일은 항상 어렵다. 수많은 데이터 시각화 툴 사이에서 헤매다가 화려하기만 하고 막상 전달하려는 내용은 잘 전해지지 않는 자료를 만드는 일도 있다. 비슷한 고민을 했던 사람이라면 이 책이 가이드라인이 되어줄 것이라고 믿는다.

 

이 책은

✔️ 다양한 예시로 센스있는 시각화 아이디어를 얻을 수 있다.

사실 데이터 시각화에서 가장 어려웠던 것은 데이터를 시각화하는 기술보다는 시각화 방법에 대한 아이디어를 내는 것이었는데, 어떤 데이터를 시각화하든 결론은 막대그래프와 파이 차트 둘 중 하나일 정도로 아이디어가 부족했었다.

이 책은 코로플레스 지도 디자인 원칙이라고 하는 데이터 시각화 색상과 색상의 간격에 대한 개념이나 포인트(점)와 폴리곤(선)의 개념 등 효과적인 시각화를 위한 디자인적인 개념을 알려준다. 이에 더해 다양한 시각화 예시를 통해 좋은 예와 나쁜 예를 비교하여 보여주기도 하고, 데이터에 따라 어떤 차이를 보이는지 설명해주기도 하는 등 다채로운 시각화 아이디어를 낼 수 있도록 도와준다.

✔️ 대화형(인터랙티브) 시각화에 대해서 알려준다.

대화형 시각화는 정적 시각화와 다르게 시청자들이 웹 브라우저를 통해 데이터와 직접적으로 상호작용할 수 있다고 한다. 다시 말해 마우스 커서의 움직임이나 클릭, 스크롤 등과 같은 이벤트를 통해 데이터를 정렬하거나 검색하는 등 사용자가 능동적으로 정보를 활용할 수 있는 방식이라는 뜻이다.웹/앱 디자인은 모두 반응형 디자인으로 변화하는 흐름에서 JPG, PNG, 또는 PDF 형식의 정적 시각화 방식을 고수하는 데에는 한계가 있다. 다른 흐름과 같이 시각화 방식도 대화형(인터랙티브) 차트와 지도로 데이터를 단순한 숫자의 나열을 넘어 이야기를 가질 수 있도록 변화하는 추세이며, 이러한 자료가 더 많은 관심과 흥미를 불러일으킬 수 있다. 이 책에서 이러한 대화형 시각화 방식에 대해서 이해하기 쉽게 알려준다.

✔️ 데이터를 기반으로 이야기를 전하고 싶은 모든 사람을 위한 책이다.

이 책에서는 어떤 이야기를 할지 고민하는 단계부터 데이터를 시각화하고 이를 공유하는 다양한 방법을 가르쳐주고 있다. 특히 시각화한 데이터로 효과적인 스토리텔링을 하는 방법도 가이드해주어서 유용했다. 그 외에도 수많은 데이터 시각화 툴과 시각화 방법 가운데 어떤 방식을 택해야 할지, 데이터를 어떻게 이해하고 활용해야 할 지 등을 가이드해준다.

✔️ 예제에서 구글 시트를 주로 사용한다.

예전에는 엑셀로 대부분의 작업을 했다면 이제는 온라인에서 협업이 가능한 구글 시트가 그 자리를 대체하고 있다. 이 책 대부분의 예제에서 구글 시트를 주로 사용하여 데이터를 가공하는 방법부터 이를 공유하여 활용하는 방법 등을 알려주고 있어 실용적인 도움을 받을 수 있다.

 

출처: teki.tistory.com

데이터의 시각화의 목적은 다순히 숫자에 대한 그림을 그리는 것이 아니라 독자들에게 우리들의 해석이 어떻게 그리고 왜 중요한지 설득할 수 있는 진실한 내러티브를 만든 것이라 설명합니다.

말하고, 보여주고, 왜 인지 설명하라

스토리보드를 만들고, 텍스트와 컬러로 의미 있는 데이터에 관심을 모으고, 출처와 불확실성을 인정하고, 독자에게 맞는 스토리텔링 형식에 대해 창의적으로 생각하기 등, 좋은 데이터 시각화를 위한 전략을 이 책에서 전수해주고 있습니다.

 

데이터 기반의 빠른 의사결정이 필수인 현대 비즈니스 환경에서는 효과적이고 정확한 데이터 시각화가 갈수록 중요해지는데요. 데이터 시각화의 기본기를 확실하게 익힐 있는 핸즈온 데이터 시각화를 소개합니다.

 

이번 핸즈온 데이터 시각화 책은 파이썬, R 프로그래밍 언어를 통해 데이터 시각화 방법을 표현하는 방식의 학습서가 아닌 코딩 지식 없이도 누구라도 보고 따라 있는 데이터 시각화의 기본적인 개념 원리를 다루고 있습니다. 쉽고 무료로 사용할 있는 온라인 도구를 이용해 각종 차트뿐만 아니라 자리 정보를 전달하는 지도까지 쉽게 따라 하면 있는 핸즈온 예제까지 제공합니다.

 

데이터 시각화의 입문서라고 있는 핸즈온 데이터 시각화는 웹에서 무료로 사용할 있는 간단한 도구로 스토리텔링 하는 방법을 알려주는데요. 간단한 드래그 앤드 드롭으로 사용할 있는 구글 시트, 데이터래퍼, 태블로 퍼블릭을 시작으로 웹사이트를 위한 대화형 차트와 맞춤형 지도를 디자인하는 방법까지 알아 있는 시간입니다.

 

단계적인 튜토리얼, 실전 예제, 온라인 리소스를 통해 깃허브에 있는 Chart.js, 하이차트, 리플릿, 등의 오픈소스 코드 템플릿을 수정하는 방법의 내용까지 담고 있는 매력적인 입문서입니다. 주로 책에서 나오는 예제가 한국을 관련된 내용들은 아니지만, 기본기를 배우기엔 좋은 예제들을 담고 있습니다.

 

핸즈온 데이터 시각화하는 4부로 구성되어 있는데요. 장마다 핵심 목표는 데이터로 진실하고 의미 있는 스토리를 만들기 위한 과정들을 담고 있습니다. 서문에선 데이터 시각화가 중요한 이유와 차트, 지도, 단어가 스토리 속으로 끌어당기는 방법과 진실로부터 속이는 방법을 다룹니다. 눈으로 확인하시어 데이터 시각화가 의미하는 무엇인지 알아가시길 바랍니다.

 

1 기본 기술은 스토리를 위한 도구 선택과 스프레드 스킬 강화, 데이터를 찾고 질문하기, 지저분한 데이터 정리하기, 의미 있는 비교하기를 통해 데이터를 분석하고 정규화하기 위한 전략을 배울 있습니다.

 

2 시각화 구축에선 차트 만들기, 데이터 지도로 시각화하기, 테이블을 활용한 시각화, 웹에 임베딩하기 여러 가지 유형을 가지고 데이터 시각화 구축하는 방법에 관해 설명합니다.

 

3부는 깃허브로 코드 수정하고 호스트하기, Chart.js 하이 차트 템플릿, 리플릿 템플릿, 지도 데이터 변환하기 경험해보지 않은 코드 템플릿과 고급 도구들을 사용하는 방법과 인기 있는 플랫폼의 인터페이스를 살펴봅니다.

 

4 데이터 시각화의 마지막을 장식하는 만큼 진실하고 의미 있는 스토리를 전달하기 위한 거짓을 발견하고 편향 줄이기, 데이터 스토리 말하고 보여주기 등을 통해 모든 장의 내용을 복습하고 데이터 시각화가 단순한 숫자에 대한 것이 아닌 독자를 설득하는 진실한 이야기가 담겨있습니다.

 

저자는 사람들이 통계의 진실성을 경계하는 것처럼 데이터 시각화의 진실성을 경계해야 한다고 주장하면서 진실하고 의미 있는 스토리를 전달하는데 필요한 데이터 시각화 기술을 배우길 바라는 마음이 전달되고 있는 내용들입니다.

 

이번 기회에 데이터 시각화의 정확한 개념을 이해하고 익힐 기회가 되시길 바랍니다.

 

  "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

		

 

한빛미디어의 '핸즈온 머신러닝'은 이미 오랜 기간 사랑받아온 머신러닝 계의 베스트셀러이자, 교과서입니다.

덕분에 책의 이름만으로도 데이터 시각화 분야의 교과서가 등장했구나, 하고 짐작할 수 있었는데요. 

사실 시각화는 참 매력적이면서도 어려운 분야입니다.

단순히 시각화 도구 하나를 쓸줄 안다고 해서, 원하는 시각화를 자유자재로 할 수 있는 것이 아닙니다. 또, 대부분의 케이스에서 다양한 배경 지식과 풍부한 경험을 필요합니다. 데이터를 다루는 데에도 능숙해야 합니다. 심지어, 도구도 너무나 다양합니다.

 

본 도서는 하나의 도구에 치중하는 것보다, 여러 케이스에 대응할 수 있는 다양한 경험을 할 수 있도록 하는 것을 목적으로 합니다. 또, '시각화 도구'보다는 '시각화' 그 자체에 집중하고 있습니다.

저 또한 Python의 Matplotlib, Seaborn부터 시작해서, R의 ggplot, Tableau 등 몇몇 툴을 사용해본 경험이 있지만, 이렇게 다양한 케이스의 시각화를 학습하는 경험은 처음이었습니다. 

 

굳이 책에서 사용되는 메인 도구를 찝어낸다면, 스프레드시트가 될 것입니다. 초반부에서도 스프레드시트를 이용하여 간단히 시각화 하는 방법을 학습하고, 이후의 챕터에서도 반복적으로 스프레드시트가 등장합니다. 하지만, 항상 스프레드시트를 사용하는 것이 아니라, 특정한 주제 (ex. 데이터 정제, 다양한 차트 생성 등)에서 스프레드시트를 도구로 사용하는 상황에 등장하게 됩니다. 즉, 비슷한 케이스를 스프레드시트로도 시각화하고, 태블로로 시각화하는 경우도 있습니다.

 

가장 인상적이었던 챕터는 'Chapter 7. 데이터를 지도로 시각화하기' 였습니다.

데이터를 지도로 표현하는 것은 무척 강력한 시각화 기법입니다. 하지만 그만큼 어려운 일이기도 합니다. 해당 챕터에서는 효과적으로 지도를 디자인 하는 방법과, 적절하게 데이터를 지도상에서 표현하는 방법, 여러 타입의 지도 생성 실습 등을 해볼 수 있었습니다. 특히, 데이터 정제와 디자인에 많은 주의를 기울여야 하는 코로플레스 지도 디자인을 학습하며, 앞으로 무척 써먹을 곳이 많을 것 같다는 생각이 들기도 했습니다.

 

생성된 시각화 자료를 웹 상에 임베딩하는 방법, 깃허브를 사용하여 시각화 코드를 관리하는 방법 등이 삽입된 것도 인상적이었습니다. 단순히 '시각화 하는 법'을 배우는 것이 아닌, '시각화를 활용하는 것' 자체를 배우는 콘텐츠이기 때문입니다. 이처럼, 세심함이 느껴지는 부분이 참 많았습니다. 

아무래도 한 권에 다양한 콘텐츠를 꽉꽉 눌러담은 만큼, 초심자가 읽기에는 다소 어려운 내용일 수 있겠습니다. 특히, 데이터를 다루어본 경험이 많이 없는 독자분들이라면 끝까지 완독하기에 어려움을 느낄 수 있습니다. 책의 구성 자체가, 초심자에게 기초를 하나하나 가르쳐준다기 보다는, 이미 어느정도 경험이 있는 이들에게 데이터 시각화를 담당하는 실무자가 알아야 할 필수사항, 디테일한 노하우, 다양한 방법론을 전수해주는 형태이기 때문입니다. 저 또한 읽으면서 상당히 어렵게 느껴지는 부분이 많았지만, 그만큼 새로운 지식과 기술을 많이 배울 수 있었습니다. 

 

보다 진지하게 데이터 시각화를 학습하고 익혀야 할 필요성을 느끼시는 분들에게는, 그 어떤 것보다 값진 콘텐츠가 꽉꽉 들어차 있다고 할 수 있겠습니다. 특히, '데이터 시각화의 교과서'가 필요하신 분들에게 강력 추천 드립니다.

 

 

 
 

핸즈 온 시리즈가 시각화까지 나왔다. 정말 다양한 IT 관련 서적들을 출판하는 것 같다.

 

시각화는 굉장히 중요하다고 생각한다. 1000원짜리 꽃 한 송이를 사더라도 이걸 어떻게 포장하느냐에 따라서 달라지는 것처럼, 같은 결과라도 이를 어떻게 만드느냐에 따라서 고급 선물이 되기도 하고, 싸구려 선물이 되기도 한다.

 

그러면 시각화를 잘하려면 어떻게 해야 하나? 우선 좋은 그림, 잘 그린 그림을 많이 봐야 한다고 생각한다. 한 번도 보지 못한 세계를 그린다는 것은 정말로 재능, 상상력이 뛰어나야지 가능한 일이고, 우리 같은 평범한 사람은 잘 그린 그림을 많이 봐야 한다.

 

그렇다면 잘 그린 그림이란 무엇인가? 잘 그린 그림은 한 번 딱 그림을 보고, 그 그림이 말하고자 하는 것이 직관적으로 와닿는 그림이다. 두 번, 세 번 이 그림이 의미하는 것을 곱씹어 보는 것이 아니라, 나의 뇌에 총알 한 발을 쏘듯이 이해되는 그림.

 

그런 그림을 그리는 법을 훈련하기 위해서 "핸즈 온 데이터 시각화"라는 책을 구매했다. 기본적인 시각화 기술, 좋은 그림의 예시와 나쁜 그림의 예시를 잘 설명하고 있는 듯싶다.(좋은 그림, 나쁜 그림의 이해보다는 기본적인 시각화 기술에 초점이 맞춰져있다) 시각화에 기본기가 있는 사람에게는 추천하지 않지만, 기본기를 쌓고 싶은 사람에게는 추천한다.

 

데이터에 대한 질문을 던지는 것. 데이터에 대한 설명과 출처가 있는 메타데이터를 읽으세요. 그리고 콘텐츠를 검토해 명시적으로 설명된 부분과 감춰진 부분을 찾아내 데이터의 근원, 맥락, 한계에 대해 더 잘 이해해야 합니다. 이 과정은 컴퓨터로 프로그래밍할 수 없습니다. 화면에 표시되는 문자와 숫자 이상을 보려면 비판적 사고를 토대로 해석해야 합니다.

책 내용중 일부

 

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 



 


[도서 소개]

실무에 바로 적용 가능한 데이터 시각화 방법을 모두 모았다!

간단한 시각화 도구부터 사용자 반응형 고급 도구까지

한눈에 들어오는 차트와 지도는 글보다 강력하다. 문서가 글로만 빼곡히 채워져 있으면 사용자의 집중력을 저하시킬 뿐 아니라 설득력도 약해지기 마련이다. 하지만 적절한 타이밍에 등장하는 시각화된 데이터는 사용자의 주의를 환기시키고 주장을 더욱 강력하게 만든다. 이 책에서는 웹에서 제공하는 무료 시각화 도구를 이용해 데이터의 스토리를 생생하게 전달하는 방법을 설명한다. 데이터를 대화형(인터랙티브) 차트와 지도로 시각화하는 과정을 통해 데이터에 맥락과 스토리를 덧입혀 주장에 설득력을 더하는 효과적인 방법도 안내한다. 신뢰할 수 있는 데이터를 활용해 가치 있는 차트를 만들다 보면 자연스럽게 다양한 데이터로 만들어진 차트를 파악하는 안목도 생겨날 것이다.



[대상 독자]

 학생, 교육자, 커뮤니티 활동가, 비영리단체, 사업가, 지역 정보 관계자, 기자, 연구원 또는 데이터를 통한 스토리텔링 방법을 배우고 싶은분


[주요 내용]

- 효과적인 차트와 지도를 설계하는 원칙 이해하기

- 데이터 시각화 개념을 기반으로 올바른 도구 선택하기

- 구글 시트, 데이터래퍼, 태블로 퍼블릭으로 웹사이트에 적합한 대화형 차트와 사용자 맞춤 지도 제작하기

- 깃허브에서 Chart.js, 하이차트, 리플릿으로 작성된 오픈 소스 코드 템플릿 편집하기

- 다른 사용자가 만든 차트와 지도에서 편향을 인지하는 법 터득하기 


[서평]

구글 시트부터 깃허브를 통한 코드 템플릿 수정까지,

데이터 스토리텔링 기술 A to Z


데이터로 이야기를 전달하기 위해 필요한 절차는 무엇일까요? 먼저 여러분의 주장을 설득력 있게 만들어줄 데이터를 찾고, 지저분한 데이터를 정리해 적절한 분석 범위와 비교 기준을 설정해야 합니다. 그리고 현상을 가장 잘 나타낼 만한 시각화 도구와 차트 유형을 선택해 유의미한 시각화 결과로 구현해야 합니다. 만약 사용자가 시각화된 결과와 직접 상호작용하거나 관심 있는 패턴을 직접 탐색할 수 있다면 더할 나위 없겠죠. 이 책은 앞서 설명한 데이터 스토리텔링의 절차대로 여러분을 데이터 시각화 여정으로 친절히 안내합니다.


먼저 시각화 도구를 선택할 때 고려해야 할 10가지 요소부터 스프레드시트 기초 사용법을 살펴봅니다. 그리고 데이터에서 의미 있는 비교를 하는 방법, 다양한 대화형 차트와 지도를 구현하는 여러 가지 무료 도구 사용법과 깃허브로 오픈 소스 코드 템플릿을 수정하고 호스트하는 법을 안내합니다. 더 나아가 차트와 지도로 거짓을 말하는 방법을 배워 여러분이 함정에 빠지지 않도록 주의시킵니다. 코드를 수정해본 경험이 없더라도 걱정하지 마세요. 단계별로 따라 하다 보면 어느새 데이터를 보기 좋게 시각화할 수 있는 코더가 된 자신을 발견할 겁니다.


각 장은 우리의 핵심 목표인 데이터로 진실하고 의미 있는 스토리를 만들기 위한 하나하나의 과정으로 구성되고 있습니다.


이책의 서문에서는 데이터 시각화가 중요한 이유를 설명하고, 차트, 지도, 단어가 우리를 스토리 속으로 끌어당기는 방법과 진실로부터 속이는 방법을 보여줍니다.


1부 기본 기술

1장 ‘스토리를 위한 도구 선택하기’에서는 스토리를 스케치하고 스토리를 효과적으로 전달하는 데 필요한 시각화 도구를 선택하는 방법을 살펴봅니다.


2장 ‘스프레드시트 스킬 강화하기’에서는 기초부터 시작하여 피벗 테이블과 룩업 수식을 사용해 데이터를 구성하고 분석하는 방법과 지오코딩 추가 도구 및 온라인 양식을 사용하여 데이터를 수집하는 방법을 설명합니다.


3장 ‘데이터를 찾고 질문하기’에서는 신뢰할 수 있는 정보를 구체적인 전략을 알아보고, 데이터가 나타내는 것과 그 속에 숨어 있는 이해관계에 대한 심도 있는 질문을 던집니다.


4장 ‘지저분한 데이터 정리하기’에서는 스프레드시트 및 고급 도구를 사용해 불일치와 중복을 찾아서 수정하는 방법과 디지털 문서에서 추가 테이블을 만드는 방법을 소개합니다.


5장 ‘의미 있는 비교하기’에서는 편향된 방법을 주의하면서 데이터를 분석하고 정규화하기 위한 통상적인 전략을 제공합니다.


2주 시각화 구축

6장 ‘차트 만들기’에서는 배우기 쉬운 드래그 앤드 드롭 도구를 사용해서 시각화하는 방법과 다양한 데이터 스토리에서 가장 잘 작동하는 도구가 어떤 것인지 설명합니다


7장 ‘데이터를 지도로 시각화하기’에서는 공간 성분을 포함한 여러 가지 유형의 시각화 구축에 대해 설명하고, 유의미한 지도를 만드는 것에 대한 어려움을 논의합니다.


8장 ‘테이블을 활용한 시각화’에서는 섬네일 시각화인 스파크라인을 포함해 대화형 테이블을 만드는 방법을 설명합니다.


9장 ‘웹에 임베딩하기’에서는 이전 장들의 내용을 종합해 임베드 코드를 복사 및 수정하여 여러분만의 시각화 결과물을 온라인상에 공개하여 더 많은 청중과 작업을 공유하는 방법을 알아봅니다.


3부 코드 템플릿과 고급 도구

10장 ‘깃허브로 코드 수정하고 호스트하기’에서는 오픈 소스 시각화 코드 템플릿을 수정하고 공유하는데 널리 사용되는 인기 있는 플랫폼의 웹 인터페이스를 살펴봅니다.


11장 ‘Chart.js와 하이차트 템플릿’에서는 오픈 소스 코드 템플릿을 활용해 웹 어디서나 사용자 동의하고 호스팅할 수 있는 차트를 만드는 방법을 배웁니다.


12장 ‘리플릿 맵 템플릿’에서는 오픈 소스 코드 템플릿을 사용하여 데이터 스토리를 전달하기 위한 다양한 지도를 구축합니다.


13장 ‘지도 데이터 변환하기’에서는 지리 공간 데이터를 더 자세히 배우고, 배우기 쉬운 도구를 활용해 지도에 적합한 데이터를 사용자 정의하는 방법을 배웁니다.


4부 진시랗고 의미 있는 스토리 전달하기

14장 ‘거짓을 발견하고 편향 줄이기’에서는 차트와 지도로 거짓을 이야기하는 방법을 살펴보고, 진실한 이야기를 전하는 방법을 배웁니다.


15장 ‘데이터 스토리 말하고 보여주기’에서는 앞선 모든 장의 내용을 복습하고 데이터 시각화가 왜 단순히 숫자에 대한 것이 아닌 독자를 설득하는 진실한 이야기인지에 대해 살펴봅니다. 그리고 여러분의 해석이 중요한 이유에 대해서도 이야기합니다.


디지털 트랜스포메이션이라는 단어가 클리셰처럼 느껴질 정도로 많은 기업들이 데이터 기반의 의사결정을 위한 비즈니스 구조 전환을 시작했지만 현장에서는 여전히 기본적인 데이터를 다루는 일에도 어려움을 느끼는 사람들이 많습니다. 이 책은 파이썬, R 등 프로그래밍 언어 코드를 통한 데이터 시각화 방법이 아닌 프로그래머가 아닌 사람도 쉽게 따라할 수 있는 데이터 시각화 입문서 입니다. 

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

0. 도서 정보

 1) 도서 명 : 핸즈온 데이터 시각화

 2) 저자 : 잭 도허티, 일리야 일라얀코우

 3) 링크

 

 

1. 서평

 먼저, 파이썬 R 등의 언어를 통해 시각화를 하는 방법을 알고 싶은 분에게는 적합하지 않다. 해당 도서는 코딩이 필요없는 GUI 툴을 이용하여 시각화를 하는 방법을 알려주는 도서이다. google spread sheet, tableau, chart.js 등으로 차트를 그리는 방법을 알려준다. 개인적으로 이러한 툴을 소개해 주는 부분 보다는 차트마다 이쁘게 그리는 방법을 알려주는 방법과, 데이터를 볼 때 주의해야 할 부분을 알려주는 부분이다. 이 부분만 봐도, 괜찮다고 느껴지며 만약 학생이라면 파트3 에 있는 깃허브로 코드 수정핟고 호스트하는 부분이 포트폴리오 생성시 유용하다고 생각이 든다.

 

최근들어 데이터 분석에 대한 관심도가 높아지고, 디지털 트랜스포메이션이 추세가 되며

 

데이터를 기반으로 한 의사결정이 많아지고 있습니다.

 

데이터를 단순히 엑셀로 표현한다거나 db에서 갓 조회해온 raw상태로 보여줘도 되지만,

 

당연히 의사결정자들 혹은 클라이언트들은 단순하게 나열된 데이터들을 이해할 수 없습니다.

 

또한, 빅데이터라 불리는 방대한 양의 데이터에서 여러가지 인사이트들을 도출하기 위해서라도

 

데이터 시각화는 꼭 필요한 영역이라고 볼 수 있습니다.

 

 

이 책 "핸즈온 데이터 시각화" 에서는 여러가지 데이터 시각화 툴을 이용하여,

 

데이터에서 인사이트를 추출하거나, 의사결정에 도움이 될 수있는 자료를 만들어 낼 수 있는 방법들을 알려주고 있습니다.

 

엑셀로 된 데이터를 단순히 차트로 표현하는 걸 '정적 시각화' 라고 하는데 

 

이 책은 단순한 '정적 시각화'부터 사용자들이 상호작용할 수 있는 대화형 테이블, 차트 및 지도를 만들고

 

이를 온라인에 배포하거나 다른 서비스에 포함하는 방법까지 상세히 나와 있습니다.

 

풀컬러로 표현된 책 내용을 통해 시각화 예제들을 더 직관적으로 볼 수 있었고,

 

단순히 로우 데이터를 차트나 테이블 같은 시각화 자료로 표현하는 것 부터

 

데이터를 봐야 할 의사결정자, 클라이언트 들에게 데이터에 대한 해석이 어떻게 그리고 왜 중요한지

 

 설득할 수 있는 진실한 내러티브를 만드는 "데이터 스토리텔링"까지 데이터 시각화에 대한 많은 것들을 배울 수 있었습니다.

 

현직 데이터사이언티스트 및 데이터를 기반으로 프로젝트를 기획하는 기획자, 데이터 관련 프로젝트를 진행하는 개발자까지

 

데이터를 다루는 모든분들이 한번쯤 읽어보면 많은 인사이트를 얻을 수 있는 좋은 책입니다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

111111111.jpg

 

데이터 시각화는 왜 필요한 것일까?

이런 질문을 해본 사람에게 필요한 책이 ‘핸즈온 데이터 시각화’이다. 

 

수 많은 데이터를 수집하고, 분석해서 결과를 내렸을 때, 다른 사람들이 올바른 판단을 하도록 

이 수치를 이해하기 쉽게 보여주면 설득하는데 많은 도움이 된다고 한다. 

 

글로 쓴 것보단 데이터 수치화 한 것을 표로 보여주는게 더 쉽게 파악할 수도 있고, 표 보다는 

그래프나 차트로 보여주면 다른 수치들과 함께 한 눈에 보여줄 수 있어 좋다. 

 

물론 이렇게 시각화를 하다보면 데이터를 표기하는 방식에 따라서 실제 데이터가 나타내는 내용을

왜곡할 수도 있으니 제대로 알고 시각화를 해야 한다고 한다.

 

그래서 ‘3장의 데이터를 찾고 질문하기’ 챕터는 재미 있었습니다. 

데이터로 찾고자 하는 질문은 무엇이며, 공공데이터와 개인 데이터, 민감한 데이터를 가리거나 집계하기

그리고 데이터 출처를 남기거나 불량 데이터 인식 등 누구나 데이터를 다루면서 궁굼해 할만만 내용을

다루고 있었습니다.

 

또한 차트를 만들고, 데이터를 지도로 시각화하고, 테이블을 활용한 시각화 그리고 웹에 임베딩하는 등 

다양한 방법으로 시각화 하는 방법을 알려줍니다.

 

그래서 아래와 같이 다양한 추천 도구들을 다루고 있습니다. 

 

2222222222.jpg

 

 

 

 

 

끝으로 이 책은 시각화를 하기 위해서 알아야 하는 것들을 골고루 다루고 있습니다. 시각화를 하기 위해

알아야 할만한 내용을 고루 담은 교과서 같은 책입니다. 예제가 원서 그대로 다뤄져 조금 아쉽긴 했지만

읽고, 다시 국내 데이터를 활용하여 실습을 해봐도 의미있는 공부일 것 같습니다. 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

일을 하며 항상 그래프를 대략적으로 보니, x축과 y축의 척도나 상한, 하한을 제대로 체크하지 못해 잘못된 판단을 내리기도 한다.

 

이번에 핸즈온 데이터 시각화를 읽으면서 가장 흥미로웠던 부분은, 데이터들을 통해 의미 있는 비교를 하는 방법이었다.

예를 들어 상관 관계과 반드시 인과 관계를 의미하지는 않는다는 것이나, 실무에서도 서로 규격, 척도가 다른 데이터를 취급할 때, 이를 고려해서 공통 기준을 마련하거나 비율로 설정해 데이터를 정리해야 하는 것 등이다.

 

특히 작업 중에는 이런 것 들을 놓치기 쉬워, 보는 사람이 데이터를 이해하기 어렵게 만들기도 한다.

 

책의 예시 중 미국 주별 자동차 사망자 수를 비교할 때 많은 생각을 하게 됐다. 나는 주 인구 당 사망자 수를 비교한다면 충분히 공정한 비교가 된다고 생각했다. 하지만 책에서는 안전한 대중교통 인프라가 있는지도 고려하여 차량 주행거리를 수식에 추가하였다.

또한 시계열 데이터 비교 시 인플레이션 등을 감안하여, 이런 수식 다듬기를 통해 실제와 유사한 해석이 가능하다.

다만 내가 생각하기에, 이런 사항들을 하나하나 고려하기는 힘들 것 같다. 실제로 관계가 단순히 선형이 아닐 수도 있고, 나누지 않고 오히려 곱하는 등 다양한 각도로 의미를 찾아야 하기 때문이다.

 

실험 데이터를 다루는 입장에서, 그래프를 그리기 위한 전략들이 있는 것 또한 큰 도움이 되었다. 데이터의 종류가 몇 개인지, 비율이 중요한지, 연속 데이터인지 등에 따라 차트 종류를 달리하거나, 최소한의 색 및 선 굵기 조절 등을 통해 데이터 차이 명확화가 가능하였다. 특히, 필터링된 선 차트 등은 이번에 처음 알았는데, 다양한 데이터를 한번에 볼 때가 많은데 적극적으로 사용해야겠다고 생각했다.

 

단순 데이터를 차트로 만드는 것 뿐만 아니라, 구글 스프레드시트를 이용한 기본적인 처리부터 데이터로 지도를 시각화하거나 웹에 임베딩하는 등 다양한 것들을 소개해주고 있어, 관련 실무자들이 쓰기에는 적합한 책이라고 생각한다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다

어떤 목적에 의해 데이타를 수집해서 남에게 설명해야 한다고 했을때 단순히 글로 설명하는 방법보다는
표형태로 보여주는것이 좀 더 보는 사람 입장에서 간결하니 이해하기 좋습니다.
좀 더 나아가서 표를 차트로 표시하면 문장으로 적지 않았던 내용까지도 어떤 추세같은거나 숨어있는 의미도 파악할 수 있습니다.
지명같은것은 지도위에 표시하면 지역명보다 좀 더 직관적으로 느껴지게 됩니다.

이처럼 이 책은 전달하고자 하는 데이타를 시각화해서 보여주기 위한 방법 및 도구에 대한 내용을 담고 있습니다.
프로그래밍할 필요도 없고, 통계나 수학 지식이 없어도 무방합니다.

엄선된 여러 무료 Tool(10여개)들을 이용해서
데이터수집 목적 정의 - 데이터 수집 - 데이터 정제 -  시각화  - 해석의 과정을 따라하기만 하면 됩니다.


하나의 잘 만들어진 툴만 사용할 수도 있겠지만 그 툴을 제공하는 회사가 서비스를 접을수도 있고
A도구의 어떤 기능을 B도구에서도 제공하는데 좀 더 다양하거나 나은 기능을 제공하는 경우등도 있기 때문에
테이블, 차트, 지도 등의 시각화를 설명할 때 중복된다는 느낌이 들 수도 있지만 다른 도구를 통해서도 할 수 있는 방법도 같이 설명해 주고 있습니다.

데이터 수집단계에서는
구글폼을 이용한 구글시트 데이타 수집, 외부 csv import , 피봇테이블을 이용한 일종의 테이블 join같은 작업, 열 분리, 병합, 계산, 스마트 멍키를 이용한 geodata 생성등 여러 유용한 기능들을 배울 수 있었고,

차트만들기 단계에서는
각 차트별 차이점 어떤 경우에 어떤 차트로 그려야하는지 부터 주요 옵션들의 의미들의 차이점(옵션을 잘못 썼을때 데이타는 이상이 없더라도 시각화가 달라짐에 따라 의미가 어떻게 왜곡될 수 있는지)등에 대해 배웠습니다.

지도 시각화에 대해서도 꽤 많이 다루고 있었으며

일반적으로 나는 데이타는 준비되어있는데 각 용도별 시각화를 쉽게 하고 싶을때, 잘 만들어진 템플릿을 가져와 약간의 수정만으로
시각화를 가능케 하는 템플릿 챕터도 유용했던거 같습니다.

책의 시작부분부터 시각화는 의미를 왜곡할 수 있다는 것을 알려주고 중간중간 계속해서 이런 왜곡될 수 있는 부분들을 잘못되지 않게 짚어주고 
설명해주는게 좋았습니다. 주로 외국데이타를 이용한 예제가 많았는데 앞으로 우리나라 데이타로 만들어진 예제등이 들어간 책이 나오면 좋을거 같습니다.

 

데이터 파이프라인과 데이터 시각화에 관심이 있어 이 책을 읽어 보았다.

책을 읽으면서 가장 먼저 든 생각은 ‘이 책 정말 친절하게 자세히 설명해준다'라는 것이었다.

제목이 ‘Hands-On Data Visualization’인만큼 책을 보면서 실제로 모든 과정을 쉽게 따라할 수 있게 도와주어서 좋았다.

책을 읽은 후 정리해 본 각 장의 내용은 아래와 같다.

CHAPTER 0 서문

  • 우리가 데이터 시각화를 하는 목적은 무엇일까

[PART I 기본 기술]

CHAPTER 1 스토리를 위한 도구 선택하기

  • 어떠한 점을 유념해서 도구를 사용해야 할까?

CHAPTER 2 스프레드시트 스킬 강화하기

  • 여러 장점이 많은 구글 스프레드시트를 사용하는 법을 알아보자

CHAPTER 3 데이터를 찾고 질문하기

  • 시각화를 하기 위해 어떠한 데이터를 사용해야 할까?

CHAPTER 4 지저분한 데이터 정리하기

  • 가장 처음의 데이터는 깔끔하지 않다. 이것을 어떻게 정리해서 우리가 원하는 형태로 이용할 수 있을까?

CHAPTER 5 의미 있는 비교하기

  • 비교를 하는데에 있어서 유의할 점은?

[PART II 시각화 구축]

CHAPTER 6 차트 만들기

  • 차트를 구성하는 다양한 디자인 방법의 특징을 알아보자

CHAPTER 7 데이터를 지도로 시각화하기

  • 지역적 특성과 함께 존재하는 데이터라면 그 특징을 잘 표현해보자

CHAPTER 8 테이블을 활용한 시각화

  • 테이블로 특징을 잘 드러낼 수 있는 데이터라면 테이블을 호라용해보자

CHAPTER 9 웹에 임베딩하기

  • 웹을 이용해서 시각화 결과를 공유하자

[PART III 코드 템플릿과 고급 도구]

CHAPTER 10 깃허브로 코드 수정하고 호스트하기

  • 깃헙을 이용해보자

CHAPTER 11 Chart.js와 하이차트 템플릿

  • 자바스크립와 Chart.js를 이용해서 더 다양하고 효율적인 시각화 결과를 도출해보자

CHAPTER 12 리플릿 맵 템플릿

  • Leaflet을 사용해서 더욱 강력한 대화형 지도 시각화 결과를 도출해보자

CHAPTER 13 지도 데이터 변환하기

  • 지도 데이터를 제대로 이용하기 위한 다양한 변환 및 편집 방법을 알아보자

[PART IV 진실하고 의미 있는 스토리 전달하기]

CHAPTER 14 거짓을 발견하고 편향 줄이기, CHAPTER 15 데이터 스토리 말하고 보여주기

  • 데이터 시각화에 있어서 지켜야할 원칙

APPENDIX 자주 발생하는 문제 해결법

  • 자주 발생하는 문제들에 대한 팁

위에서 적은 목차를 보면 책의 내용이 정말 자세하고, 데이터 시각화를 처음 다루려는 사람에게 아주 적합하다는 것을 단번에 알아차릴 수 있을 것이다.

개인적으로 구글 스프레드 시트를 자주 사용해왔음에도 이것으로 데이터 시각화를 도전해볼 생각은 못 했어서 좋은 영감을 받을 수 있었다.

순차적으로 따라가기 수월하게 되어 있는 책의 목차 외에도 인상깊었던 점은 아래와 같다.

  • 각 챕터에서 다루려는 내용과 그 의의에 대한 자세한 언급
    • 특정 툴의 사용법이나 코드만을 열거해놓은 것이 아닌 ‘우리가 지금 이것을 왜 해야하고, 이것을 할 때에는 어떠한 기준을 가지고 하는 것이 좋은지'에 대한 철학에 대해 계속해서 일깨워준다.
    • 개발을 하다보면 어느새 특정 결과를 내는 데에만 매몰되어서 큰 그림을 보지 못하는 경우가 많은데, 이 책은 자세한 목차와 함께 특정 데이터가 지니는 의미와 그 의미를 어떻게 시각화할 수 있을지에 대해 끊임없이 생각하게 만들어주어서 좋았다.
  • 다양한 툴의 자세한 사용법
    • 스프레드 시트, 깃헙 등 모두 굉장히 편리할 툴이지만, 처음 사용하면 도메인의 용어에 익숙하지 않아서 어려울 수 있다. 이 책에서는 그 사용법에 대해 아주 자세히 서술되어 있고, 번역 또한 매끄럽게 잘 되어 있어서 꼭 시각화가 아니더라도 이 책에서 배운 방법대로 다른 개발에 적용해 볼 수 있도록 도와주어서 좋았다.
  • 시각화를 할 수 있는 다양한 방법들의 특징들
    • 차트 종류가 워낙 다양하다보니 한 가지 데이터를 어떠한 차트로 다루는 것이 가장 효율적일지, 차트 디자인을 결정한 이후에도 수많은 번복이 이루어지기 마련이다. 이 책에서는 좋은 예와 좋지 않은 예를 미리 알려주어서 미리 피해갈 수 있는 다양한 인사이트를 주어서 좋았다.

시중에 판매되는 모든 데이터 시각화 책을 읽어본 것은 아니지만, 읽어본 몇 권의 책 중에서는 가장 자세하고 친절하게 시각화에 대해 알려준 책이다.

데이터 시각화에 관심이 있고, 어떻게 시작해야할지 망설이고 있다면 이 책을 강력 추천한다.

 

■ 대상 독자

· 데이터를 무언가로 표현하고 싶은데, 어떤 차트 타입(bar, pie, histogram등등) 선택장애을 가지고 계신분

· 시각화에 대해서 다양한 사례를 통해서 고민해보고 싶은신 분

· 시각화를 위해서 필요한 데이터를 바라보는 관점에 대해서 궁금하신분

· 다양한 시각화 도구에 대해서 경험을 해보고 싶으신 분

 

■ 책의 목차를 통해 구성요소 살펴보기

총 4개의 Part로 구성되어 있습니다.

 

▷ Part1. 기본기술

· 정말 다양하게 많은 기술들이 있고, 처음 데이터 시각화를 진행하는 입장에서는 주요사용기술에 대한 검토를 진행할 것입니다.

A,B,C기술이 있는데, 실무에서 현업에서 무엇을 사용해야지 선택지가 너무 많아서 고민을 하게 됩니다.

책을 통해서 다양한 도구를 예를 들면서 소개하고 있어서 사용도구의 장단점 및 비교를 할수 있어서 좋습니다.

 

 

· 데이터를 다루는 입장

시각화를 하기 위해서는 기본적으로 데이터가 있어야 합니다.

이것은 실제 서비스에서 수집한 데이터일수도 있고, 외부에서 공개된 공공데이터일수도 있고, 2차3차 가공을 통해서 수집된 데이터등 다양한 출처등이 있습니다.

다양하게 수집된 데이터 들이 Merge되어야 할 필요도 있습니다. 이런경우 고려해야 하는 부분들이 있습니다.

날짜의 형식 일치하기, 공백등 결측치에 대한 부분, 금액등의 포맷등등 있을것이고, Tool을 통해서도 이러한 데이터 보장하는 방법등을 

설명하고 있습니다.

 

 

▷ Part2. 시각화 구축

 

비주얼하는 것이 정답이 없어서 더욱 고민되는 부분입니다.

데이터는 동일한데, 해당 비주얼을 어떻게 구성하고 표현하는 방식에 따라서 

해당 서비스를 이용하는 사용자의 경험치는 매우 달라집니다.

서비스 제공하는 입장에서는 "원했던 의도"가 잘 전달되어지록 고민해야 합니다.

차트별로 어떻게 기준을 잡고, 서비스를 구성해야 할지 잘 설명되어 있습니다.

 

 

 

▷ Part3. 코드 템플릿과 고급도구

개발자분들은 해당 부분에 더 관심이 있을실 거라고 생각이 듭니다.

chart라이브러리의 경우 별도의 단일본으로 책이 출간되기 어렵습니다.

(d3.js의 경우에는 단일본의 책도 있지만, 예전 버전에 대한 책이고 현재 최신본의 책은 없습니다.)

사용 메뉴얼이 잘 되어있는 경우도 있지만, 적용이 상대적으로 쉽고 다양한 라이브러리가 있기 때문입니다.

 

여기에서도 많은 라이브러리를 다루지는 않습니다.

chart.js을 통해서 차트 구성시 X-Axis, Y-Axis등을 통해서 차트 구성의 개념을 파악할수 있습니다.

지도 구성시 폴리곤의 개념 및 위도 경도의 사항을 학습할수 있습니다.

다른 차트에서도 기본적인 개념은 동일하기 때문에, 조금더 활용을 쉽게 활용할수 있을것입니다.

 

▷ Part4. 진실하고 의미있는 스토리 전달하기 

· 소제목 : 거짓을 발견하고 편향 줄이기 가 있습니다.

다양한 분야에서 데이터 비쥬얼이 사용됩니다. 부동산, 주식, 선거, 데이터로 표현이 안되는것이 없습니다.

이것을 의도적으로 사용자가 느낄수 없게 결과를 조작하지는 않았지만, 사용자가 느끼기에 잘못된 결과로 받아들일수 있게

잘못 구성되는 사례가 많이 발생할 수 있습니다.

이러한 부분에 대해서 설명을 하고 있어서 한번 익혀 놓으면 좋은 정보입니다.

이런 차트가 가장 조작(?) 하기 쉬운 패턴입니다. X-Axis축을 범위의 조절에 따라서 그래프 모양에 차이를 많이 나타나게 됩니다.

 

 

 

 

그래서 결론이 몬데, 무엇을 말하고 싶은데?

 

써머리, 한장정리, 원페이지 보고서, 인포그래픽 다 하나로 귀결됩니다.

빠른 의사결정, 빠른 문제 인지입니다.

보고서, 리포팅, 모니터링 다 동일합니다. 

그렇게 시대요구상에 따라 어느정도 정착하게 되었는데,

또 다른 허들에 자꾸만 걸리고 있습니다.

 

그럼 그 근거만 무엇인데, 데이터로 보여줘?

 

그것은 분명 시각화 자료가 일상화되어서 인 거 같습니다. 광고와 서비스들에 대한 설명들도 다 데이터 시각화로 표현되는 시대라서 고객과 소비자의 눈높이는 높아만 가고 있습니다. 이것에 이런 데이터 분석으로 정리해서 간략하게 보여줄 수 없을까요?

텍스트만으로는 눈에 안들어오고, 이해가 되지 않네요?

 

그래서 몇년 전부터 대시보드, 시각화, 그런 관련된 자료에 관심이 높는 것도 사실이다. 하지만 대개는 특정 사용 툴과 제품의 소개와 활용으로 마무리가 되어서, 자칫 목적을 잃어버릴 때가 많았는데, 금번 데이터 시각화는 다양한 툴과 본연의 질문을 놓치지 않고 가고 있다는 것이다.

특히 누구도 사용할 수 있는 구글 스프래드시트의 활용의 실제예가 있어서 바로 업무에 적용도 가능합니다. 

 

"효과적인 데에터 시각화 전략부터 20가지 시가화 도구 사용법까지" 책 표지 우 하단의 내용이 책을 대변하고 있습니다

 

20220723_205315.jpg

실무에 바로 적용 가능한 데이터 시각화 방법

2022-07-23-12-49-46-948.jpg

데이터 시각화 규칙

2022-07-23-18-21-25-017.jpg

 

실제 사례들

원형 차트

2022-07-23-18-26-06-452.jpg

막대 차트

2022-07-23-18-26-20-898.jpg

수평 막대 차트

2022-07-23-18-26-42-692.jpg

논리적 배열

2022-07-23-18-26-58-758.jpg

중요한 부문

2022-07-23-18-38-19-605.jpg

테이블 디자인 원칙

2022-07-23-18-53-22-369.jpg

지도 관련

2022-07-23-19-07-36-874.jpg

내러티브 작성

2022-07-23-19-15-36-482.jpg

 

2022-07-23-19-15-54-537.jpg

 

데이터 시각화 실제 활용서입니다. 여러모로 실무에 도움이 될 거 같습니다. 사무실 책상 한편에 두고 두고 필요할 때만다 참조할 만 한 책입니다.

 

21년부터 매달 나는 리뷰어다 활동을 통해 책을 다 읽고 작성하게 됩니다.

 

fX7T10VeX3aMj1otFkUtanEq3nc_brunch.png

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

* 전체 후기

초반에 구글 스프레드 시트 설명만 주구장창 나올 때만 해도 지겨웠다.

csv xls xlsx 이런 설명이 나온다던가, vlookup 설명 등..

내가 보기엔 좀 그렇다고 생각했는데 큰 착각이었다.

이는 빙산의 일각일 뿐이었더라.

다양한 시각화 도구에 대해 자세하게 설명이 나와 있어서 좋더라.

책 후반부에는 깃허브 사용법까지 나와 있다.

몸으로 배워서(?) 알고 있었던 Repository 생성에 대해 책으로 읽으려니깐 안 읽혀져서 이 부분은 슥슥 지나치긴 했다.

책을 받아서 보기 전에는 도구 사용법에 대한 글인 줄 알았다.

그런데 해석에 대해 주저리주저리 말이 많아서 처음에는 지겹다고 생각했다.

지겨운 스프레드 시트 해석 부분을 넘어가고 나니, 빼곡한 말들이 다 피와 살이 될만한 내용이더라.

방대한 자료 및 데이터 분석 도구가 엄청 많더라.

이걸 책 한 권에 집대성한 작가님도 참 대단하더라.

다만 미국식이 많다. 지도, 통계, 참고문헌 등등..  

WorkPress를 쓴다던지, 지도는 구글을 쓴다던지 하는 것 모두 좀 어색하긴 하다.

미국인이 봤다면 별 5개짜리, 한국사람에게는 별 4.8~4.9짜리 책인 것 같다.

기타 URL오타로, 이런 게 있다.

PDF에 346 - 4 Chart.js 샘플 주소로

https://oreil.ly/YskDA 를 언급했는데,

하이차트 샘플 페이지로 이동을 한다.

아마도 이것을 의도했겠지?​

https://www.chartjs.org/docs/latest/samples/information.html

 

또 하나 더 있었는데.. 워낙 URL이 많아서 못 찾겠다. ㅋ

후기를 쓰다 보니 

나이팅게일 도표(크림전쟁 시, 비위생적인 병원에서 사망자 수자 더 많음을 보여주었던 차트)가 생각나서 찾아봤다.

Nightingale-mortality.jpg

출처: 

https://namu.wiki/w/%ED%94%8C%EB%A1%9C%EB%A0%8C%EC%8A%A4%20%EB%82%98%EC%9D%B4%ED%8C%85%EA%B2%8C%EC%9D%BC#rfn-3,

장미 도표(Rose Diagram)으로도 불린다고 한다.

이 책에 나온 도구를 가지고 다양한 도표 자료를 만드는 것이 재미있을 것 같은데...

'무엇을 가지고' 만들 것인가 하는게 고민이 되더라.

양질의 데이터 확보하고 그를 어떻게 해석을 잘 할 것인가가 관건인 것 같다.

책 도입부부터 마무리까지 작가님이 비슷한 이야기를 하며 데이터를 왜곡하지 말라고 신신당부를 하더라.

빠른 시일 내에 데이터 해석할 수 있는 기회가 오면 놓치지 않고 자원해 봐야겠다.

 

-------------------------------------------------------------------------------------------------------------------

 

상세 후기는 제 블로그에 기재했습니다.

다음을 참고하시기 바랍니다.

 

https://blog.naver.com/pcmola/222826197394


 

목차

[PART I 기본 기술]

 

CHAPTER 1 스토리를 위한 도구 선택하기

CHAPTER 2 스프레드시트 스킬 강화하기

CHAPTER 3 데이터를 찾고 질문하기

CHAPTER 4 지저분한 데이터 정리하기

CHAPTER 5 의미 있는 비교하기

 

[PART II 시각화 구축]

 

CHAPTER 6 차트 만들기

CHAPTER 7 데이터를 지도로 시각화하기

CHAPTER 8 테이블을 활용한 시각화

CHAPTER 9 웹에 임베딩하기

 

[PART III 코드 템플릿과 고급 도구]

 

CHAPTER 10 깃허브로 코드 수정하고 호스트하기

CHAPTER 11 Chart.js와 하이차트 템플릿

CHAPTER 12 리플릿 맵 템플릿

CHAPTER 13 지도 데이터 변환하기

 

[PART IV 진실하고 의미 있는 스토리 전달하기]

 

CHAPTER 14 거짓을 발견하고 편향 줄이기

CHAPTER 15 데이터 스토리 말하고 보여주기

 

본문


- 데이터 스토리텔링에 필요한 기술들을 처음부터 끝까지 담았습니다.


- 데이터 시각화에 관한 로드맵을 제시하여, 주어진 순서에 따라 쉽게 시각화를 수행 할 수 있게 구성되었습니다.

- 코드와 그림 풀컬러 구성


- 다양한 시각화 방법을 여러 예제로 실습 할 수 있습니다.

 

책의 특징

· 유용한 데이터를 찾고 정리하는 법을 배울 수 있습니다.

· 신뢰도 높고 설득력 있는 차트를 만드는 디자인 원칙을 배울 수 있습니다.

· 사용자와 상호작용하는 차트 및 지도 만드는 법을 배울 수 있습니다.

추천 독자

· 데이터 시각화에 관심 있는 누구나

· 데이터를 통한 스토리텔링 방법을 배우고 싶은 누구나

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

KakaoTalk_20220723_171207425.jpg

 

 

※ 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

이 책은 무료로 사용할 수 있는 웹에서 제공하는 도구를 사용하여 데이터를 시각화하는 방법을 배울 수 있는 책이다.

시간이 갈수록 데이터는 점점 방대해진다.

이러한 데이터를 시각화할 수 있는 방법과 결과물은 여러 자료로 사용된다.

데이터를 다루는 방법을 잘 알고 활용한다면 데이터를 이해하고 분석하는데 많은 도움이 될 수 있다.

 

이 책은 데이터를 다루고 시각화하는 방법에 대해 초보자도 단계별로 익힐 수 있도록 도와준다.

다양한 툴들 중 각 툴에 대한 특징을 설명하여 어떤 툴을 선택하는 것이 적합한지 툴을 선택하는 데에 있어서 여러 정보들을 제공해준다.

데이터를 시각화하기 전 고려해야 하는 여러 요소와 어떻게 필요한 데이터를 수집하고 찾을 수 있는지, 데이터를 사용하여 활용도가 높은 차트를 만드는 방법 등 완성도 있고, 의미있는 데이터를 보여주기 위한 방법에 대해 익힐 수 있다.

또한 많이 사용해본 스프레드 시트를 시작으로 각 예시를 통해서 이러한 툴로 어떻게 데이터를 시각화하는지 따라해볼 수 있다.

 

 

전반적으로 책의 내용은 어렵지 않아 엑셀을 활용하고 스프레드 시트를 사용해본 분들이라면 이 책의 내용이 어렵지 않을 것이다.

책의 내용과 예제를 단계별로 따라해본다면 데이터를 시각화하는 방법에 능숙해지지 않을까 싶다.

 

​이 책은 개발자에게 국한된 책이 아닌 여러 독자들에게 데이터를 시각화할 수 있는 방법을 알려준다.

따라서 데이터를 활용하는 독자들이라면 많은 도움이 될 책이다.​


"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

제목 : 핸즈온 데이터 시각화


리뷰 요약

시각화가 이렇게 재미있는것이었다니?

전공이 아니어도 재미나게 볼 수 있다!

추천, 추천!

 

 

이 서적의 핵심

 

1. 특이하게(?) 0장부터 시작하는데,

0장만 읽어도 만족스러운 내용으로 가득차 있다.

(저자가 개발자인가...? 인덱스를 지키는...!)

- 마케팅을 하는 직업이 아니고,

뭔가를 분석해서 남들에게 보여주는 입장이 아니다 보니

데이터 '시각화'라는 서적을 받았을 땐

기대감보단 귀찮음이 컸다('아, 재미없겠네...')


하지만, 서문인 0장은 너무나 흥미로운 내용으로 가득 차 있었고,

1장부터는 특정 도구를 사용하는 방법에 대해 이야기 하기 때문에

흥미가 그리 크지 않았지만 0장에서 이야기한 흥미거리를 접목하며

음미하며 읽을 수 있었다.

0장의 내용 중

글 > 표 > 차트 > 차트 표현 비교

위와 같은 방식으로 왜 시각화가 중요한지 알려주고,

또 기준을 어떻게 잡느냐에 따라 동일한 데이터 출력은 완전 달라진다는것을 보여준다.

(이것만 봐도 재미있지 않은가?)



 

2. 도구 선택부터 선택한 도구의 사용법까지,

초보자의 초보자를 위한, 초보자에 의한!? 서적.

- 대상 독자는 '초보자'이며

'컴퓨터에 대한 익숙함과 고등학교 수학에 대한 흐릿한 기억 정도만 있으면 된다.' 고 한다.

특정 소프트웨어에 초점을 두고 설명하는 다른 IT 서적과 다르게, 이 책은 무료로 배울 수 있는

20여가지(스프레드 시트, 구글 시트, 하이 차트, Chart.js 등)의 다양한 시각화 도구를 소개하고,

상황에 따라 어떤것을 선택할 것인지 방법을 제시하고 사용 방법을 소개한다.


 

3. 도구를 선택하고 만들고 짜집기 해서 사용하는 것 뿐만 아니라

Git hub를 이용해서 직접 간단한 호스팅도 해볼 수 있음.

github 활용 설명 중

- 전문적인 분야까진 가보지 않았지만 보통 데이터 '시각화' 그러면

표를 직접 그리거나 스프레드시트 차트를 활용하거나, 파워x인트를 활용하는게 대부분이라고 생각해왔다.

요즘에야 파이썬을 이용한 데이터 시각화가 많이 보이는 것 같지만,

이렇게 직접 깃헙에 간단한 호스팅까지 이끌어주는 책이 있었나 싶을 정도로 감명깊었다.

 

 

4. 도구 활용법에서 끝! 이 아니라 데이터 시각화 전략에 대해서도 이야기 한다.

- 앞 부분의 도구에 별로 흥미를 못느꼈지만, '전략'에 대한 내용이 있다보니 재미나게 읽게 되었다.

어떤식으로 만들어야 제대로 된 내용이 전달되는지,

어떻게 만들어야 사람들이 오해 없이 데이터를 받아들일 수 있는지

등의 내용들은 딱히 데이터 시각화가 아니더라도

많은 부분에서 사용할 수 있지 않을까 하는 생각이 들었다.


마무리

 

데이터를 전문적으로 다루는 사람이 아니더라도 한번쯤 읽어보길 추천한다.

특히 0장과 4부는 딱히 다른장을 보지 않아도 재미나게 읽을 수 있는것 같다.


그간 접하지 않았던 분야였기 때문에 많은 생각을 해보게 되었고

딱히 데이터를 전문적으로 다루지 않는 사람이라도 한번쯤 읽어보면

간단한 회의에서 발표할 때,

혹은 누군가를 설득할 때

'어떤 내용을 어떻게 정리해서 어떻게 상대방에게 전달해야 할 것인가'를

어느정도 알 수 있게 되지 않을까 싶다.


0장에서 인상 깊었던 것 중 한가지를 소개하면,

같은 지도 데이터이지만 표현할 때 어떤 색상을 선택하느냐, 어떻게 데이터를 표시하느냐에 따라

읽는 사람이 받아들이는 결과는 천차 만별이 되어버리는 [그림 0-3]과 [그림0-4]

두 그림을 보면서 '사기치기 딱 좋겠는데...?'

하는 우려섞인 생각이 들었다(네?).


'색깔'만 달라져도 받아들여지는 데이터는 다르다.

뭔가 철학적이면서도 '1+1은 왜 2인가'를

풀어야 하는 것 같은 복잡한 기분도 들었다.


이런 재미난 생각을 계속 하게 만드는 멋진 책,

(나 혼자만 보고 싶어서 추천하고 싶진 않지만)

많은 사람들이 보고 함께 재미난 생각을 하고

데이터 전문가가 되어 보도록 하자.


데이터가 넘쳐나고 있다. 아주 많이. 많아진 만큼 사용되는 곳도 부지기수다. 그리고 어려웠던 내용들이 사용되는 곳이 많아지면서 조금씩 대중화(?)가 되는 듯하게 느껴지는데 어려운 툴이 아닌 주변에서 쉽게 접할 수 있는 툴을 사용해서 데이터를 시각화해서 사용하는 일이 쉬워지고 있다는 생각도 든다. 핸즈온 데이터 시각화는 데이터의 시각화를 위한 길라잡이와 같은 책이라 생각된다.

# 데이터 시각화

데이터를 효과적으로 다룰 수 있는 방법에는 어떤 것이 있을까. 아니 어떤 방법과 과정을 거쳐야만 원하는 정보를 정확하게 이해할 수 있도록 전달할 수 있을까. 여러 방면에서 사용되는 데이터는 잘 갈무리되어 정보를 필요로 하는 사람들에게 전달되기 위해 시각화의 과정을 거치게 된다. 대체로 차트나 인포그래픽을 만드는 데 사용되는데 여기저기서 빅데이터라고 떠들고 다녀서 어쩌면 이제는 조금은 익숙해진 분야일 수 있어 보인다. 하지만, 여전히 데이터를 다루는 일은 어렵다. 잘못된 혹은 나쁜 방향으로 의도된 데이터는 그걸 접하는 이들에게 잘못된 정보를 전할 수 있기 때문이다.

정보를 다루는 사람도, 접하는 사람도 바른 지식을 사용해서 정확한 척도를 가지고 접하고 전달해야 하는데 이런 것들은 아무래도 전문적인 지식과 전문적인 툴을 사용해야 신빙성이 높아질 것 같은 생각이 든다. 일반인은 이런 전문적인 영역에서 데이터를 접하거나 다룰 일은 거의 전무하리라 본다. 그렇다고 무턱대고 달려들 수도 없고. 이 책은 이렇게 접근하기 어렵다고 생각하는 사람들, 데이터를 어떻게 다루어야 하는지 알고 싶은 사람들이 보면 좋을 것 같다. 바로 나 같은 사람들.

# 핸즈온 데이터 시각화

핸즈온 데이터 시각화에서는 데이터를 다루는 방법에 대해 차근차근 알려주고 있다. 그리고 어려운 툴이 아닌 흔하게 접할 수 있는 무료 툴들을 기준으로 설명해주고 있기에 좀 더 어렵지 않게 다가갈 수 있을 것 같다. 책에서는 데이터에 대해 정말 다양한 것들을 다루고 있다. 데이터 수집을 위해 다루어야 하는 도구부터 시작해서 트렌드까지 차트를 그리는 방법과 주의점까지 데이터에 따라 적절한 차트에 대한 안내도 해주고 있다. 

데이터에 대한 기초적인 부분을 배우며 데이터를 처리하는데 필요한 기본적인 마인드와 습관 등에 대해서도 알려주고 있어 무분별하게 만들어낼 수 있는 데이터에 대한 주의도 주고 있기 때문에 이제 데이터에 관심을 가지기 시작한 사람들에게 좋은 가이드 북이 되지 않을까 생각된다.

https://www.hanbit.co.kr/media/books/book_view.html?p_code=B1996635146

상기 표는 책에서 다루고 있는 도구들과 해당 도구를 다루는 장에 대한 내용이다. 도구 항목에는 데이터와 관련된 일을 하지 않더라도 IT와 관련된 일을 하고 있는 사람들은 한 번씩 들어봤을 도구들이 나열되어 있는 것을 알 수 있는데 그만큼 대중적인 도구를 사용해서 도입 장벽을 낮추고 있는 부분이 가장 마음에 들었다. 구글 스프레드시트, 구글 지도, 깃허브 등은 아주 친근한 도구들이 아닐까 생각된다. 만약 웹 개발과 관련된 일을 한다면 Chart.js, 하이차트에 대해서도 알고 일부는 실제로 사용해본 사람들도 있을 것 같다.

핸즈온 데이터 시각화는 이처럼 쉽게 접근 가능한 도구들을 사용하여 기초적인 부분부터 시작하고 있기 때문에 전혀 생소하게 느껴지는 부분도 있었고 데이터를 수집하기 위해 사용하는 툴도 주변에서 인터넷만 된다면 쉽게 사용 가능한 툴을 위주로 하고 있기 때문에 툴 자체를 사용하는 건 크게 어려울 것이 없었다. 데이터를 다루기 위해 사용되는 방법을 배울 수 있어 많은 도움이 되었다.

# 후기

핸즈온 데이터 시각화는 20가지라는 도구를 사용하여 데이터를 시각화해서 효과적으로 전달하는 방법을 다루고 있다. 처음 접하는 사람들은 생소한 느낌과 어려움을 느낄수도 있겠지만 천천히 책을 따라 하면 많은 부분을 가져갈 수 있을 것이라 여겨진다. 그리고 무엇보다도 입문자에게는 어려울 수 있을 것 같다고 생각되지만, 데이터를 다루는 것에 많은 관심이 있는 사람이 어떤식으로 접근해야 좋을지 모를 때 접하면 좋은 책이라 생각된다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

핸즈온 데이터 시각화 (저자: 잭 도허티, 일리야 일라얀코우)

핸즈온 데이터 시각화 (저자: 잭 도허티, 일리야 일라얀코우)

추천하는 대상:

  • 시각화를 업무에 자주 사용하는 분

한줄평: 데이터시각화를 위한 교과서적인 책이며, 중요한 개념인만큼 차근차근 짚어나간다.

친근하면서도 어려운 데이터 시각화

데이터 시각화는 단순히 데이터를 가지고 그래프를 그리는 행위가 아니다. 데이터 시각화는 데이터에 기반한 분석과 주장을 더욱 효과적으로 전달하기 위한 한 방법이다. 텍스트만으로는 전달하기 힘든 통찰은 차트, 지도 등과 결합하여 더욱 강한 설득력을 가진다.

핸즈온 데이터 시각화

이렇게 단순히 차트를 그리는 것을 넘어 데이터 시각화에 대한 이론부터 차근차근 다루고 있는 핸즈온 데이터 시각화 는 2020년 경부터 이미 저자들이 인터넷 상에 책 내용을 무료로 공개하여 화제가 된 적이 있는 데이터 시각화 강의 교재이다. (독자의 편의성을 위해 실물로도 판매가 되고 있는데, 2022년 판매 금액은 전액 우크라이나 구호 재단에 기부된다고 하여 더욱 의미가 깊은 책이다.)

전 독자층을 배려한 구성

이 책은 데이터 시각화에 대한 올바른 접근을 위한 이론과, 주로 구글 스프레드시트, 태블로 등의 도구를 활용한 실습 예제로 이루어져 있다. 또한 자바스크립트 기반의 Chart.js, 나 Highcharts 같은 기술의 경우, 코딩이 익숙하지 않은 독자층을 위해 코드를 작성하지 않고도 실습을 진행해볼 수 있도록 한 점이 눈길을 끈다.

의미있는 스토리를 전달하기 위한 시각화

이 책에서 가장 도움이 많이 되었던 부분을 뽑자면, 책의 후반부에 기술된 시각화를 통해 정보를 왜곡된 시각화의 사례와 편향 등을 다룬 부분이다.

우리는 시각화를 통해 효과적으로 정보에 기반한 주장을 할 수도 있지만, 의도적으로 왜곡된 정보를 전달할 수도 있다. 시각화를 통해 거짓말을 할 수 있는 방법에는 여러가지가 있다.

  • 변화를 과장하거나, 변화를 축소하여 보여준다.
  • 비율을 의도적으로 조작하여 보여준다.
  • 세로축을 여러개 사용하여 혼돈을 준다.

이러한 부분을 인지한다면, 시각화를 통해 생길 수 있는 오해를 방지하고 보다 객관적인 관점을 유지할 수 있을 것이다.

마무리하며

업무를 직접 진행하며 한 경험에 빗대어 본다면, 데이터 시각화는 사람마다 보는 관점이 달라 생각할 수록 어려운 영역이었다. 저자의 생각도 마찬가지이다. 하지만 시각화의 여러가지 사례와 안티 패턴을 소개하면서 읽는 이로 하여금 효과적인 데이터 시각화란 무엇인지 생각해볼 수 있는 능력을 키워주려고 하는 것이 이 책의 목적이라고 할 수 있다. 데이터 시각화는 절대적인 정답이 없다. 다만 저자는 이렇게 말한다.

"학습자로서 여러분이 해야할 일은 문제에 대한 단 하나의 정답만을 고수하지 않고, 계속해서 더 좋은 답을 찾는 것입니다."


한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

 

[서론]

 

단순히 데이터 시각화 기법 또는 툴 사용법에 만족하지 않고, 정확하게 스토리를 잡아서 시각화하는 법을 알려주는 책이다. 데이터 입수부터 정리, 차트, 사용자 전달기법까지 데이터 시각화의 전과정을 제시한다.

 

 

[편집/번역]

 

풀컬러 구성으로 흠 잡을 데가 없는 편집이다. 번역 역시 잘 되어서 한글 문장이 부드럽게 읽히고 내용 이해가 원활하다. 

 

 

[내용]

 

- CHAPTER 0 서문

 

PART I 기본 기술

 

- CHAPTER 1 스토리를 위한 도구 선택하기

- CHAPTER 2 스프레드시트 스킬 강화하기

- CHAPTER 3 데이터를 찾고 질문하기

- CHAPTER 4 지저분한 데이터 정리하기

- CHAPTER 5 의미 있는 비교하기

 

1부에서는 기초적인 데이터 시각화 도구를 선택하여 데이터를 찾고 정리하는 과정을 배운다. 데이터를 찾는 부분의 웹사이트 예제가 미국 기준이어서 조금 아쉬웠지만, 구글 시트 사용법을 알아보고 지저분한 데이터를 정리하는 방법은 도움이 되었다.

 

 

PART II 시각화 구축

 

- CHAPTER 6 차트 만들기

- CHAPTER 7 데이터를 지도로 시각화하기

- CHAPTER 8 테이블을 활용한 시각화

- CHAPTER 9 웹에 임베딩하기

 

2부에서는 데이터를 차트와 지도, 테이블로 시각화하고 이를 웹으로 보여주는 과정을 배운다. 개발자로 입문해서 제대로 배우려면 꽤 양이 많고 오래 걸리는 과정인데, 꼭 필요한 내용만 가볍게 흝고 가니까 부드럽고 난이도가 높지 않았다.

 

 

PART III 코드 템플릿과 고급 도구

 

- CHAPTER 10 깃허브로 코드 수정하고 호스트하기

- CHAPTER 11 Chart.js와 하이차트 템플릿

- CHAPTER 12 리플릿 맵 템플릿

- CHAPTER 13 지도 데이터 변환하기

 

3부는 웹에서 가장 많이 사용되는 차트인 Chart.js와 Highchart를 통한 시각화를 실습해보고, 지도를 통한 시각화를 체험한다. 특히 Highchart는 예전부터 우리나라 웹 프로젝트에서도 많이 사용되었던 차트 툴이기 때문에 친숙해서 특히 반가웠다.

 

PART IV 진실하고 의미 있는 스토리 전달하기

 

- CHAPTER 14 거짓을 발견하고 편향 줄이기

- CHAPTER 15 데이터 스토리 말하고 보여주기

 

4부는 입수한 데이터의 편향(bias)를 줄이는 방법을 알아보고, 단순히 파편화된 시각화가 아니라 하나의 스토리로 데이터 분석자가 말하고 싶은 포인트를 제시하는 방법을 총괄적으로 배운다.

 

- APPENDIX 자주 발생하는 문제 해결법

 

마지막 부록에는 O/S별로 자주 발생하는 문제 해결법이 제시되는데, 데이터 작업을 하면서 생각보다 실무에서 자주 부딪히게 되는 내용이라 앞으로도 유용하게 사용할 수 있을 것 같다.

 

 

[후기]

 

단순히 예쁘기만 한 것이 아니라, 정확한 의도대로 전달하는 데이터 스토리텔링 기법을 전체적으로 살펴볼 수 있는 책이다.

 

외서 특유의 빠른 속도로 진행되기 때문에, 처음에는 데이터를 기초적으로 정리하는 법을 배우고 있었는데 어느새 다양한 데이터 시각화 툴과 geojson을 사용해서 인터랙티브한 플롯을 만들게 된다. 그 과정에서 데이터 시각화의 전과정을 매끄럽게 체험할 수 있다.

 

무엇보다도 이론과 실습이 균형적인 책이다. 이름만 들어봤던 다양한 시각화 도구를 체험해볼 수 있는 것은 물론이고, 데이터 시각화를 진행할 때 반드시 고려해야하는 원칙을 함께 배울 수 있다.

 

풀컬러로 눈에 잘 들어오고 읽기도 쉬운 훌륭한 번역의 책으로, 데이터 시각화를 처음 시작하는 사람에게, 혹은 개발 관련 직군에서 데이터 시각화를 처음 담당하게 된 사람에게 매우 추천할만한 책이다.

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

  • 데이터 시각화라면 차트나 그래프를 통해 데이터를 더 보기 좋고 이해하기 쉽게 만드는 일이라고 단편적으로 생각했던 나에게 이 책은 예상보다 훨씬 더 넓은 시각화의 세계를 알려줬다. 많은 교육 기관에서 데이터 시각화 입문 교재로 이 책을 활용한다고 하는데, 책의 구성뿐만 아니라 내용이 교과서로 사용할 정도로 자세할 뿐만 아니라 정말 교과서에서나 볼법한 주제를 반복적으로 알려주고 있다는 점에서도 의외였고 좋았다.
  • 책의 구성은 총 4부로, 1부 기본 기술에서는 도구 및 데이터를 이용해 스토리를 구상하는 기초, 2부 시각화 구축에서는 난이도가 낮은 도구로 실습, 3부 코드 템플릿과 고급 도구에서는 코드를 직접 다뤄야 하는 정도의 난이도가 높은 도구로 더 다양한 시각화를 소개, 4부 진실하고 의미 있는 스토리 전달하기에서는 이 책에서 반복적으로 이야기하는 데이터를 이용해 진실하고 의미 있는 스토리 전달에 대해 설명한다.
  • 가디언이나 뉴욕 타임스의 사례가 아니더라도, 이제 한 번 만들면 변하지 않는 시각화가 아니라 사용자와의 인터랙션이 기본이 되면서 기술적인 요소는 전보다 훨씬 더 중요해졌고 앞으로도 3D뿐만 아니라 AR, VR 같은 분야를 생각하면 시각화에서도 기술의 중요성은 점점 더 높아져만 갈 것이 확실하다. 하지만 저자는 일관되게 진실한 이야기를 전달하는 스토리를 구성해야 한다고 말한다.
  • 초반에 처음 소개하는 지도도 부의 불평등에 대한 지도를 어떻게 전달하느냐에 따라 둘 다 진실을 전하지만 느낌이 달라지고 중요하게 생각하는 부분이 변한다는 걸로 시작한다. 테니스 스타 세레나 윌리엄스가 겪었던 흑인 여성에 대한 차별이나 유명한 메르카토르 도법의 문제점 등 데이터 자체의 문제, 알고리즘의 편향성, 시각화가 유도하는 의도한(혹은 의도치 않은) 인식의 문제 등을 알려주고, 데이터 시각화가 왜 중요하고, 또 어떤 면을 전달해야 하는지 설명한다. 또 다른 기술들도 마찬가지이지만, 시각화 기술 역시 계속 발전하므로, 단 하나의 정답만 고수하지 않고 진실을 보여주기 위한 방법을 지속적으로 찾아야 한다고 주장한다.
  • 좋은 기술을 알려주면 악용하는 일이 항상 발생한다. 책에서 차트를 사용해 속임수를 쓰는 방법도 설명하기 때문에 어쩌면 그렇게 저자의 의도와는 반대되는 결과를 가져올 수도 있다. 하지만, 시각화의 기술과 그 파급력, 또 그래서 어떤 마음을 가지고 기술을 대해야 할지까지 같이 작성한 걸 보면, 저자는 좋은 사람이기도 할 거란 생각이 든다. 다양하고 좋은 시각화 기술만 볼 거라고 생각한 나에게 저자는 시각화도 데이터를 다루는 일이므로 역시 항상 편향, 편견을 조심해야 한다는 점을 알려줬다. 생각보다 더 좋은 책을 읽게 되어 기분이 좋다.

한빛미디어 ‘나는 리뷰어다’ 활동을 위해서 책을 제공받아 작성된 서평입니다

책에 도입부에서는 구글 스프레드 시트를 사용하여 지저분한 데이터를 제거하는 방법을 알려준다. 파트 2부터는 차트, 지도, 테이블 등 본격적인 시각화를 하는 방법을 배울 수 있다. 

 데이터의 시각화의 목표는 진실하고 의미 있는 스토리를 전달하는 것이다. 또 한 필자가 생각하기에는 데이터의 스토리 텔링이 가장 중요하다는 생각이 들었다. 해당 책에서는 스토리 텔링에 대해서 깊이 있게 설명되어 있지 않고 대략적인 스토리 텔링의 중요성을 강조한다.

 결론적으로 데이터 시각화를 입문을 위한 필요한 도구의 설명과 사용법에 대해서 정리되어 있다고 생각한다. 구글 시트를 이용하여 책에 있는 내용을 실습하는 것을 권장한다. 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

저자: 잭 도허티, 일리야 일라얀코우

 

 

#책소개

 

한눈에 들어오는 차트와 지도는 글보다 강력하다. 문서가 글로만 빼곡히 채워져 있으면 사용자의 집중력을 저하시킬 뿐 아니라 설득력도 약해지기 마련이다. 하지만 적절한 타이밍에 등장하는 시각화된 데이터는 사용자의 주의를 환기시키고 주장을 더욱 강력하게 만든다.

이 책에서는 웹에서 제공하는 무료 시각화 도구를 이용해 데이터의 스토리를 생생하게 전달하는 방법을 설명한다. 데이터를 대화형(인터랙티브) 차트와 지도로 시각화하는 과정을 통해 데이터에 맥락과 스토리를 덧입혀 주장에 설득력을 더하는 효과적인 방법도 안내한다. 신뢰할 수 있는 데이터를 활용해 가치 있는 차트를 만들다 보면 자연스럽게 다양한 데이터로 만들어진 차트를 파악하는 안목도 생겨날 것이다.

라고 교보문고가 말하더라.

 

 


 

# 이 책의 특징

 

1. 데이터 자체에 대한 집중

우선 데이터에 관해서는 파이썬에 집중된 서적이 많은데 이 책은 GUI를 갖춘 도구를 이용해 그냥 사용한다.정말 간단하게 데이터 시각화를 한다.난이도가 낮아보이는게 특징이다.

 

2. 구성

우선 책이 두껍다. 그만큼 내용이 많다는 말이다.실제로 다루는 데이터 유형에 대해서 모두다 언급하고 실습하는 느낌이다. 그만큼 충실하다. 내용도 많다.

 

3. 용어설명

데이터에 익숙한 나라서 그런지는 몰라도 그렇게 어려운 책은 아니다.

대상 독자조차도 그렇게 전문지식을 필요로 하는 사람이 아니다.

 

4. 내용이 그렇게 어렵지 않음

하지만 실제로 이것을 실무에 적용을 바로 한다기보다는 어떤 느낌으로 접근해야 하는지 방향성과 같은 것들을 알려준다고 보면 된다.

 


 

#후기

 

솔직히 데이터 시각화 하라면 맨날 파이썬 pyplot 뭐 해가지고 뭐 sead...하고 맨날 무슨 라이브러리 해가지고 했었는데 그것보다 쉽게 접근할 수 있는 방법을 알려준다. 초보에게 좋고 데이터 분야를.. 이제 접은 나에게도 좋다. 사실 데이터 시각화라는 것이 중요한 이유가 설득력 때문인데.. 말로 하는 것보다 보여주는 것이 낫다고.. 내 100마디 말보다 1개의 차트 하나가 더 셀 수가 있다. 그럼에도 쉽게 만들 수 있다? 그렇다면 이제 내 말에는 설득력이 조금 더 좋아진다는 말과 같다.한 번 이 책으로 내 말에 근거를 만들어보자.


"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

<핸즈온 데이터 시각화>는 제목 그대로 "직접 해보는" 데이터 시각화에 대한 책입니다. 하지만 단순 몇 가지의 예제만을 가지고 지루하게 반복하지 않고, 데이터 시각화에 대한 철학부터 시작해 다양한 툴을 소개하고, 다양한 시각화 예시를 여러 가지 툴을 활용해 장-단점을 비교해가며 최종적으론 효과적인 데이터 스토리의 전달 방법까지 깔끔하게 소개해 주고 있습니다.

지금 당장 데이터의 시각화를 처음 시도해보는 초보부터, 몇몇개의 플랫폼이나 툴을 활용한 시각화 전문가들까지도 다양한 방법으로 읽어가며 좋은 예시들을 배울 수 있는 책이라 생각됩니다. 이제 막 시각화에 입문한 사람은 첫 장부터 차근차근 읽어가며 데이터 스토리에 대한 철학부터 시작해 다양한 툴과 다양한 시각화 방법, 배포하는 방법까지 익혀가는 것을 추천드리고 싶습니다. 또한 이미 충분히 시각화에 대한 이해가 있으신 분들이라면 새롭게 익혀보고자 하는 툴이나 시각화 방법 등에 대한 단물만 맛보듯이 즐길 수 있도록 구성되어 있습니다.

개인적으로 약간의 아쉬운 점은 Python을 활용한 시각화 예시가 없다는 점 이었습니다. 물론 본격적인 이야기를 하게 된다면 Python의 시각화 이야기는 책의 분량을 2~3배 이상 늘려도 부족할 수 있습니다. 또한 직접적인 코드가 등장하게 되면, 그것이 아무리 간단하다고 알려진 Python이더라도 해당 도메인에 익숙하지 않은 사용자가 가벼운 마음으로 시작했다가 무거운 마음으로 책을 덮었을 것 같습니다.

비록 가장 원했던 시각화 기법에 대한 책은 아니었지만, 데이터 스토리의 본질에 대해 조금이나마 엿볼 수 있었고 내가 알고 있던 방법 외에도 더 많은 시각화 기법이나 툴, 그리고 전혀 경험해보지 않았던 데이터 스토리의 배포 과정까지 가볍게 익힐 수 있는 책이었습니다.

 

 


 

노트북에서 전자책(ebook)으로 학습하는 경우

모니터를 하나 더 연결하기를 추천합니다.

- 이책에 대하여 中

책 소개

이 책의 저자는 두분인데, 데이터시각화 과정 교수님과 지리정보과학석사과정 디자인 기술 연구소 연구원이고 역자는 한분인데 "단단한 머신러닝"의 역자이신 분이 번역한 책이다. 저자의 소개글 부분에 보면 모두를 위한 데이터 시각화 라는 2016년에 나온 책을 발전시킨 버전이라고 한다. 그래서 그런지 정말 쉽게 자세히 잘 구성되어 있다. 거의 80%에 가까운 내용이 컬러로 실습을 하는 방법에 대해 설명하고 있다. 이론을 설명하는 부분에서는 찰스 윌런의 "벌거벗은 통계학"이나 대럴 허프의 "새빨간 거짓말, 통계" 와 비슷한 기조를 가진다.

믿을 만한 데이터는 어디서 찾을 것인가?

데이터가 진정으로 나타내는 것이 무엇인가?

- 3장 8절 마치며 中

책 장점

이 책의 장점은 데이터를 어디서 얻어야 하는지, 데이터의 의미를 어떻게 해석해야 하는지 잘 알려준다. 그러면서도 이 책은 코드를 전혀 활용하지 않는다. 그동안 python, R, JavaScript등 어려운 코드들과 전공용어로 데이터를 어찌하지 못했던 비개발자들도 하나하나 따라해보면 된다. 그러면서 다양하게 주의할 점에 대해서 자세히 알려주고 데이터를 처리하는 자세와 좋은 습관들이 어떤 것인지 아주 자세히 알려주고 좋은 책도 많이 소개해준다.

책 단점

장점일 수도 있으나 이 책은 사실 내용이 너무 많다. 너무 많은 툴들을 소개해주고 있다. 코드가 전혀 없다고는 해도 20가지 이상의 다양한 시각화 도구를 소개하고 있다. 그리고 사실 책 뒷부분에 가면 html이나 iframe 등에 대해서 살짝 소개해주는 데 처음 접하는 사람은 어려울 수 있다. 그리고 한국에만 국한된 데이터를 하면 이해가 더 쉬울텐데 월드 레벨의 데이터를 다루다보니 공감대 형성이 약간 어렵다. 그리고 간간이 아주 사소한 오타(ex. 단계 --> 단게)도 보인다.

데이터 스토리가 어떻게 우리의 사고방식을 변화시키고,

우리의 습관을 바꾸고 우리의 다음단계에 영향을 미치는지

- 15장 1절 데이터 스토리 中

책 구성

1장 1절과 15장 1절이 수미상관으로 이어진다. 스토리보드에 내러티브 작성하기 이다. "단단한 머신러닝"처럼 구성이 아주 타이트하고 꽉 차있다.

책 읽은 뒤 나의 견해

사실 우리 모두는 데이터를 시각화해서 보여주지 않아도 상식 수준에서 대략적으로 비슷한 정답을 알고 있다. 그 정답이 실제 정답인가? 앞 사람을 따라한 정답은 아닌가? 그러나 비슷한 정답과 구체화된 정답과 앞사람에 의해 의도된 정답 중에 어느 상황인지 명확히 구분하는 것은 대부분 귀찮아한다. 정말 오래된 용어로 "정보화시대" 이다. 이 정보의 생산자는 그 동안 누구였는가? 실제 정답을 가지고 만들어진 정보 가 없다면 내가 만들어보는 것도 물론 힘들테지만 멋진 일이고 가치있는 일이라고 생각한다. 그런 의미에서 정보를 시각화하고 싶은 비개발자들에게 이 책을 추천한다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

데이터 분석의 중요성에 대해서는 이제 굳이 설명하지 않아도 될 정도가 되면서 분석을 위한 도구도 다양해졌고, 오픈 소스를 통해 무료로 사용할 수 있는 도구 또한 많아져서 너무 전문적인 경우만 아니라면 일정 기간 학습을 통해 적어도 기본적인 분석은 이제 누구든 할 수 있게 되었다. 그렇다 보니 이제는 각종 툴을 활용해 분석된 자료들을 어떻게 표현할 것인가로 그 중요성이 옮겨가는 듯 하다.(사실 이 부분은 꼭 데이터 분석이 아니어도 중요하기는 하지만..)

 

 

이 책은 총 4부로 구성하고 있다. 1부에서는 데이터 시각화에 앞서 사전준비에 해당되는 내용으로 구성하고 있다. 수집하고 분석한 자료를 시각적으로 표현하기 위해 어떤 도구들을 이용할 수 있고, 어떻게 선택할 수 있는지, 그리고 그 과정에서 흩어지거나 불필요한 자료들(책에서는 '지저분한 데이터'로 표현되고 있다.)을 어떻게 정리하면 좋은지 등을 스프레드시트 툴(이 부분에서는 본격 시각화 전 단계인 데이터 정리 단계라 스프레드시트를 활용한 설명이 많다.)의 실제 적용 화면 그림을 통해 친절하게 설명해 주고 있다. 아래는 이 책 속에서 언급되고(다루고) 있는 도구들을 책의 해당 위치를 도표화 한 것으로 각 페이지마다 해당 URL 다운 후 설치법, 기본 사용법 등을 친절하게 안내하고 있다.

 

 

4.JPG

 

[사진] 본 책의 각 장에서 다루는 추천 도구 정리표 (p.48)

 

(* 위 사진은 본책 p.48 표1-1로 리뷰에서는 동일 내용을 한빛출판네트워크 책 소개란에서 캡쳐 후 사용하였음)

 

 

 

 

2부에서는 본격적으로 시각화를 실습하는 단계로 들어간다. 서두에서 저자가 별도의 사전 지식 없이 컴퓨터에 대한 기본적인 이해로 충분히 이해가 가능하다는 말처럼 툴의 기본 사용법은 드래그 앤 드롭 방식이 많았다. 그런 도구를 활용해 차트와 테이블을 작성하는 방법과 지도에서 분석된 데이터를 시각화 하는 방법을 설명하고 있다. 뿐만 아니라 2부의 하이라이트는 이렇게 작업화한 것을 웹으로 코드를 복사 하여 임베딩하여 공유하는 방법을 알려주는 부분이다. 단순히 업데이트 뿐만 아니라 수정하는 방법도 알려주고 있다.

 

 

1, 2부에서 무료이고 단순한 방식의 도구를 활용한 설명이 주를 이뤘다. 이러한 도구들은 초보자들에게는 적합하지만 무료 도구이다 보니 옵션 등에서 아무래도 제약이 많다. 3부에서는 유료 도구를 포함한 고급 도구의 사용법과 코드 수정법 등에 대해 설명하고 있다. 3부 끝에서는 보다 고급 스킬의 지도 데이터 변환과 관련한 상세한 설명도 포함되어 있다.

 

 

 

 

0715063247682512.jpg

 

 

[사진] 데이터를 시각화 할 때 편향을 줄이는 방법을 소개하는 부분 (본책 p.453(위), 459(아래))

 

 

 

 

마지막 4부에서는 데이터 편향과 관련된 내용을 시각화 과정에서 어떻게 줄일 수 있는지 다루고 있다. 시각화와 관련된 도서는 많지만, 실습에 직접 적용하며 설명한 책은 드문 것 같아 이 부분이 이 책의 하이라이트가 아닐까 생각된다. 먼저 어떤 것이 잘못된 것이고, 어떤 것이 진실한 시각화인지에 대한 간략한 설명 후 과장하거나 축소 혹은 왜곡하는 방식으로 차트로 거짓말하는 방법을 위 사진(아래)과 같이 다양한 예시 그림과 함께 그 이유를 설명하하고 있다. 그리고 이 책에서 '지도 데이터 시각화'부분이 책 전체 내용 중 거의 1/3 가량을 차지하고 있는데, 4부에서 역시 지도 부분은 따로 다루고 있다. 이런 예시 후에 어떻게 하면 데이터 편향을 인지하고 줄일 수 있는지도 설명해 주고 있다.

 

 

 

그리고 많은 분량은 아니지만 권말에 약 10페이지 정도를 할애해 OS별 도구별로 작업 중 자주 발생하는 문제를 해결하는 방법도 따로 모아서 설명하고 있어 특히 데이터 시각화를 주 업무로 하고 있는 분들에게는 아주 유용한 책인 것 같다. 다만, 이 책이 분류가 '초급'으로 되어 있는데, 개인적으로 생각하기에 중급에 더 가깝지 않나 싶다. 초보가 보기에는 시간 투자가 많이 필요해 보인다. 그렇지만, 데이터 편향 부분 등 기존 시각화에서 다루지 않는 내용 등을 포함해 많이 차별화 하려는 노력이 보인다. 특히 지도 데이터 시각화에 관심있는 분이라면 더 도움이 될 것 같다.

 

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

디지털 트랜스포메이션이라는 단어가 클리셰처럼 느껴질 정도로 많은 기업들이 데이터 기반의 의사결정을 위한 비즈니스 구조 전환을 시작했음에도 불구하고 현장에는 여전히 기본적인 데이터를 다루는 일에도 어려움을 느끼는 사람들이 많습니다. - '옮긴이의 말'에서

서평을 쓰는 본인이 일하고 있는 팀 명에도 '디지털 트랜스포메이션(Digital Transformation, 이하 DT 또는 DX)' 약어가 들어가는데 옮긴이의 말에 백번 공감을 했다. 정말 이 단어는 클리셰처럼 쓰이지만 정작 단어를 남발하기만 하고 제대로 DT를 알고 쓸 수 있는 사람은 많지 않다.

이 책은 개발자가 아닌, Python이나 R언어 등의 코딩 지식이 없어도 쉽게 따라할 수 있는 데이터 시각화 입문서이다. 실제로 많은 교육 기관에서 데이터 시각화 입문 교재로 이 책을 활용하고 있고, 또다른 견해로는 데이터 기반 보고서를 작성하고자 하는 리더들에게도 이 책을 추천하고 싶다. 데이터에 관한 기본 개념부터, 데이터에 대한 거짓과 편향 그리고 개인 데이터 관련 논쟁 (데이터에 관한 윤리/법률적 트렌드) 까지 정리되어 있는 꼼꼼한 기본서라고 할 수 있다.

 

본 서평은 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

출처: https://sysout.tistory.com/94 [Emily's Tistory:티스토리]

이 책은 '22년 7월 발간한 책으로 22년 7월 현재 초판 1쇄 발행본이다.

저자는 2인 공저(잭도허티, 일리야 일라얀코우)로, 

 

잭도허티(Jack Dougherty)는 교육학을 전공한 교수로 통계학을 전공하지는 않았으나 역사학 교육등에 시각화를 활용하고 있고

 

일리야 일랴얀코우(Ilya Ilyankou)는 컴퓨터공학, 스튜디오 아트를 복수 전공하였으며 현재 영국 리즈 대학에서 지리 정보 과학 석사 과정을 밟고 있다고 한다.

 

저자의 약력에서 살펴볼 수 있듯 책의 내용은 기술쪽에 치우친 내용이 아닌 실제 업무에서 많이 사용하는 예제를 적용하여 현업자에게 많은 도움이 되어 보인다.

 

책 내용은 전체적으로 총 515페이지 가량의 조금 두꺼운 분량으로 보이며 책상앞에 두어도 큰 부담이 되지는 않아 가까이 두고 활용할 수 있어 보인다.

 

본문은 총 15장으로 구성되어 있으며 15장 중,  

 

1장은 데이터 시각화와 관련한 일반적으로 알아야 할 내용과 본 책에 대한 전반적인 안내, 도입에 관한 내용을 다룬다.

 

2장은 구글시트, 리브레 오피스, MS엑셀 등의 스프레드 시트등을 통해 편리한 시각화 방법을 소개하며 구글 시트에 지오코딩하기, 구글 설문지로 데이터 수집하기, 관계형 데이터 베이스 활용하기 등의 비교적 새로운 내용을 소개함과 동시에 스프레드 시트의 전통적인 방법에 대해서도 간략히 소개하고 있다.

 

3장은 데이터 이슈를 설명한 장으로 방대한 데이터를 어디서 쉽게 얻으며 이에 대해 어떤 법적 문제를 고려하여 활용할 지에 대해 설명하고 있다.

 

4장은 원시 데이터에 대한 전처리 방법을 설명하고 있으며 구글 시트 스마트 클린업 기능을 통해 부정확한 데이터의 수정을 용이하게 하는 방법을 소개하고 있는데 통계학을 전공하거나 현업에 오래 종사하지 않아도 쉽게 데이터 셋팅에 대해 쉽게 접근하는 방법을 보여주고 있다. 

 

5장은 통계학 기초와 관련한 내용을 가볍게 다루고 있으며 통계학을 전공한 사람들에겐 이미 알고 있는 내용을 정리하게 하며 전공하지 않은 사람에겐 시각화에 대한 기본적인 사항을 전해주고 있다.

 

6장은 앞부분에서 전통적인 시각화 패턴인 꺾은선, 막대그래프, 파이차트, 히스토그램, 선차트, 산포도등과 더불어 누적 막대차트, 필터링된 선 차트, 누적 영역 차트, 범위 차트, 버블 차트, 스파크 라인등의 새로운 패턴도 설명하고 있다. 그리고 세부적으로 이러한 전통적인 패턴의 잘못된 사용례에 대한 미세한 지적을 통해 평소 습관적으로 사용하지만 누구도 지적하지 않았던 내용에 대해 친절히 알려주고 있다.

 

한편, 6장에서 그래프를 그리는 도구로 구글 스프레드 시트를 소개하고 있는데 제목 'Hand-On' 그대로 하나 하나 개인 교습을 받는 것처럼 친절하게 그래프를 그리는 방법을 상세히 설명하고 있는 부분은 이 책의 큰 장점으로 보인다.

 

7장은 데이터 시각화 교과서에서 일반적으로 다루지만 현업에서 잘 사용하지 않는 데이터를 지도로 시각화 하는법에 대해 설명하고 있는데 여러가지 툴을 통해 제시하고 있다.

 

8장은 전통적인 도구지만 평소 시각화 이슈와 관련 간과하는 테이블(표) 작성 방법에 관해 설명하고 있다.

 

9장은 iframe을 코드 태그를 통해 시각화 작업물을 웹 상에 구현 하는 방법을 설명하고 있는데 데이터 과학을 다루다 갑자기 다른 내용으로 비약 되는점은 조금 아쉽지만 더 많은 걸 알려주기 위한 욕심에서 비롯됨을 감안할 때 큰 문제는 아닐듯 보이며 이에 대한 내용이 조금 어렵게 여겨지는 독자들은 개론서 수준의 html 웹프로그래밍 도서를 참고하면 좋겠다. 

 

10장~ 13장 까지 내용은 코드 템플릿과 고급 도구에 대한 내용으로 약간의 난이도가 있는 내용이어 초급자에겐 조금 어려울 수 있는 내용으로 보이며 어렵다고 생각되는 독자는 천천히 다른 컴퓨터 스킬을 보완해 가며 학습해도 좋을듯 싶다.

 

10장에선 깃허브를 통해 내용을 수정하고 호스팅 하는 내용을 다루고 있으며,

11장은 자바스크립트 라이브러리 중 하나인 Chart.js와 하이차트를 통해 대화형 차트를 작성하며, 

12장은 구글 스프레드 시트를 통해 리플릿 맵 탬플릿을 활용하여 다양하고도 아름다운 시각화 방법을 소개하고 있으며, 

13장에서는 지도 데이터 변환과 관련한 다양한 방법을 설명하고 있다.

14~15장은 데이터, 컴퓨터 테크닉 보다는 데이터 시각화와 관련한 이슈에 대해 진실하고 의미있는 스토리 텔링 방법, 강력한 의미 전달 방법에 대해 고찰하는 내용을 다루며 책을 마무리 하고 있다.

 

전체적인 총평은 난이도 초중급으로 보이며 이미 엑셀을 활용하고 있거나 스프레드 시트에 대한 개념이 어느정도 있는 사람에게 적합해 보이며 기본적으로 예제가 일반적인 내용을 위주로 설명되어 있어 일반인이나 초중고등 학생에게도 선행 학습없이 책을 한장 한장 천천히 따라서 실습한다면 어느덧 데이터 시각화에 대한 본 도서는 자기도 모르는 사이 정복되어 있으리라 본다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 도서명 :
핸즈온 데이터 시각화
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
핸즈온 데이터 시각화
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
핸즈온 데이터 시각화
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실