엑셀만 알아도 할 수 있는 데이터 과학

tee***l2019-04-19

사실 '데이터 과학'이라는 용어를 들으면 딱딱하고 어려운 느낌이 든다. 하지만 실제 하는 일로 들어가면 개념은 간단하다. 필요한 데이터를 모은 다음, 정리하고 분석해서 원하는 결론을 얻어내는(혹은 발견하는) 것이다.

보통 이런 일들은 R이나 Python같은 프로그래밍 언어를 사용해서 할 거라고 생각하는데, 의외로 현업 데이터 분석가나 데이터 과학자들도 엑셀을 많이 사용한다. Microsoft 현직 데이터 과학자에게 직접 들었던 내용이다. 엑셀은 그 어떤 언어보다도 더 쉽게 데이터를 정리해서 빠르게 시각화시킬 수 있기 때문이다.

이 책은 엑셀을 사용해서 데이터 분석을 처음 입문하는 사람들을 위한 책이다. 엑셀 기초 사용법이나 함수 사용법을 다룬 책과는 구성이 다르다. 엑셀이 아니라 데이터가 주인공이다. 책 이름도 [엑셀만 알아도 할 수 있는 데이터 과학]이 아닌가. 이 책을 통해 데이터 획득, 정리, 분석, 시각화에 이르는 데이터 분석 전체적인 프로세스를 경험해볼 수 있다.

그리고 보통 간과하기 쉬운 게, 사실 데이터과학이든 인공지능(머신러닝/딥러닝)이든 가장 시간이 많이 들어가는 부분은 데이터의 획득이나 분석이 아닌 데이터의 정리단계이다. 이 책은 그 부분을 놓치지 않고 데이터 획득과정과 데이터 자체의 문제점, 정리과정에서의 문제점들을 알려주고 각각에 대한 대처 방법을 알려준다.

주로 의료와 복지 데이터가 예제로 많이 나오고 공공데이터도 많이 활용한다. 번역자분이 일본 자료를 한국 실정에 적합하게 바꾸시는데 손이 많이 갔을 것 같다. 내용 중 설문조사 및 인터뷰 자료를 만드는 방법이 쉽고 간결해서 인상적이었다.

역시 일본은 입문서를 정말 잘 만든다. 이 책도 그렇다. 다행히 번역도 부드럽고 편집도 편안하다. 책 수준은 초급이다. 엑셀을 잘 몰라도, 통계를 전혀 몰라도, 책의 구성을 그대로 따라서 하면 쉽게 결과가 나온다. 통계학도 기초만 소개하기 때문에 누구나 쉽게 접할 수 있다. 이 책을 통해 데이터 분석의 전과정을 경험해본다면, 이후 더 어려운 내용을 공부하기 위한 충분한 준비운동과 동기부여가 될 수 있을 것으로 보인다.

kartj***l2019-04-17

데이터과학으로 가는 1차관문

데이터과학표지.jpg

일상생활속에서 일어나는 많은 것들이 데이터로 기록되고, 데이터 과학자가 유망한 직업이된 시대에 살고 있는 우리에게 데이터 과학이란 무엇일까? 사람의 결정과 행동에 대한 추적, 분석을 데이터를 통해서 할 수 있는 세상이다. 시대를 반영하듯 데이터 관련 수많은 서적들이 계속 출간되는 것 같다. 현대의 데이터과학은 수학, 통계학 뿐만 아리나 머신러닝, 프로그래밍 , 분야전문성 등등을 바탕으로 데이터를 분석하고 다루는 정말 거창한 개념으로 이해된다. 하지만 그와는 달리 이 책에서는 표준적인 통계학을 바탕으로 데이터의 특징과 속성을 잘 이해하고 활용하여 문제해결이나 조사결과를 분석하는 과정을 말한다. 제목에서도 알 수 있듯이 전문적인 통계와 데이터를 분석하는

프로그래밍 언어가 아닌 엑셀만을 활용하는 것을 목표로 삼고 있다. 사실 엑셀이 데이터를 분석하고 결과를 비주얼 하게 표현해 주는 편리한 기능을 담고 있지않는가? 거기다가 상대적으로 접하기 쉬우니 입문자에게는 최고의 도구임에 틀림없다. 데이터과학 입문을 엑셀로 하고 다음단계에서 R이나 파이썬으로 가는 것도 좋다고 생각한다. 입문과정에서는 도구 자체보다 개념과 분석과정에 대한 이해가 더 중요하기 때문이다. 그리고 이 책에서 제시하는 실습과정은 이해하기 쉽고 자세한 설명으로 채워져 있어 마음에 든다.

전반적인 흐름은 설문조사 전후의 과정과 분석방법을 다루고 있고 통계학 실습과 공공데이터 활용하는 방법 등으로 이어진다. 데이터 과학 입문서를 지향하는 만큼 용어설명과 함께 데이터를 만들고 그래프를 그리기까지 워밍업 하듯 쉽게 설명한다. 수학과 통계 개념에서는 비전공자의 어려움이 느껴지긴하나 참고사항으로 알고 일단 넘어가면 될 듯하다.

목차을 보면 아래 처럼 크게 4부분 정도로 나누어진다.

제1장 데이터과학을 시작하기전에 - 워밍업, 용어설명

제2장 ~ 제6장 데이터 모으기, 정리하기, 집계하기, 교차표만들기, 통계그래프 만드는 방법

제7장 ~ 제11장 통계학의 기초, 추측과 판단, 평균값 비교하기, 질적 자료분석, 양적 자료분석

제12장 공공 데이터 사용하기, 데이터 과학에서 실제로 발생하는 문제

이 책에서 다루고자하는 목표는 아래와 같다.

1. 데이터에서 발생할 수 있는 구체적인 문제점과 대처 방안을 이해한다.

2. 수집된 데이터를 유효하게 활용하기 위해서는 데이터 작성과정을 알고 있어야한다.

(그래서 실습으로 사용하는 공공데이터에 관해서도 연관된 설명을 자세히 하고 있다.)

3. 실제 조사를 통한 데이터나 공개된 데이터를 활용하여 데이터 분석의 의미와 문제점을 더욱 생생하게 체험한다.

엑셀은 사용하면 할 수록 새로이 알게되는 기능들에 경이로움을 느끼기도 한다. 데이터 분석을 하는 과정에서 제시하는 설명과 팁중에는 이미 아는 것도 있지만 역시 통계관련 함수, 복잡한 그래프 표현등에서 다시금 엑셀의 진가를 느끼게 해준다. 이책의 내용들이 데이터의 단순 수학적 분석에서 벗어나 데이터 과학으로 발전시키고자 하는데 분명 도움이 될 것이다.

robin***l2019-04-15

엑셀을 얕보는 이들에게...

놀랍게도 세계에서 제일 좋은 Visualization tool을 꼽을 때에

빠지지 않고 등장하는 것이 바로 '엑셀'이다

현재는 구글닥스 같은 웹기반의 편집 툴들에게 다소 위협을 받고 있긴 하지만

빠른 계산과 직관적이고 자유도 높으면서도 놀랍게 정확하게 일을 수행해내는

엑셀의 강력한 기능은, 다른 툴을 써보면 더더욱 크게 와닿을 수 있다

(오히려 구글닥스도 이 점에선 비빌 감(!)이 못 된다)

그런 점에서, 데이터를 조금 만질 줄 아는 이(aka. 선무당)들이

엑셀은 '구식'이라 칭하고, 스크립트 언어가 '대세'라고 말하는 지금의 시대에서

여전히 엑셀은 굳건하다며 이 책은 확실하게 그들에게 카운터 펀치를 날리는 책이라고 할 수 있다

자료의 분포가, 범위가, 세트가 비단 스크립트에서만 얻어지고 계산되어지는 것이 아니라

우리가 알고 있는 '구식'의 툴에서도 오히려 더 쉬운 클릭 몇번으로 구현 가능하다는 것을,

이 책은 묵묵하게 설명하고 있다

가장 직관적이고 또 쉬운 방법인 '마우스'를 통해서

적당한 드래그와 클릭 몇번으로 원하는 데이터 프로세싱이 가능하다는 점,

심지어 그 프로세싱이 매우 빠르고 정확하다는 점은

그 어느것과 바꿀 수 없는 장점이라고 당당히 말할 수 있다

또한 그런 면에서

아직 코딩이 익숙치 않거나, 배우지 않은 이들에게는

데이터 분석과 과학의 관점을 매우 직관적으로 쉽게 배울 수 있는 책이라고 생각한다

개념이(혹은 개념만) 필요하거나,

또는 코딩까지는 안 가도 되는 이들에게

매우매우 강추하는 책이다

largo***l2019-04-15

엑셀의 전성기는 끝이 있을까?

이 책의 주제는 제목에서 드러나듯 엑셀을 도구로 사용한 데이터 과학의 활용 또는 적용입니다. 빅 데이터 열풍을 넘어 이제는 데이터 과학이라는 용어가 일상적이라고 할 수 있는 시기입니다. 그리고 이러한 현상에 편승하여 기존의 내용에 책 제목만 변경한, 소위 제목 장사를 하는 책들도 꽤 등장한 것으로 알고 있습니다. 단언컨데 이 책은 트렌드에 민감한 소비자들의 눈에 띄기 위한 처방으로 책 제목에 [데이터 과학]이라는 양념을 입힌 것이 아닙니다. 목차와 저자의 서문을 읽어보는 것만으로도 이 책이 [엑셀]과 [데이터]를 조합한 제목을 가진 기존의 책들과 차별성이 있음을 쉽게 파악할 수 있습니다.

이 책의 원서가 일본 태생이라는 것은 주목할만한 점입니다. 개인적으로 지금까지 접한 많은 번역서들을 책의 고향을 기준으로 분류한다면 미국과 일본으로 양분할 수 있습니다. 그리고 두 시장 간의 문화적인 차이(예를 들면, 글 쓰기의 의도와 학습 태도의 차이)로 인해 책의 특성도 뚜렷하게 구분됩니다. 먼저 미국책은 기능을 나열한 설명서가 가장 많이 눈에 띕니다. 예를 들어 데이터 분석을 위한 엑셀의 피벗 테이블 기능만을 다룬 책이나 VLOOKUP 함수 정복하기 등의 주제를 다룬 책처럼 메뉴얼과 같은 책이 주류입니다. 반면에 일본책은 구체적인 상황에 맞는 엑셀 기능의 활용을 다룬 책이 많습니다. 따라서 설명서 보다는 스토리 텔링이 존재하는 창작물의 느낌을 주는 책이 주류라는 인상을 받았습니다.

일본에서 건너온 이 책도 비슷한 분위기를 가지며 공동 저자 중 리서치 회사에서 근무하는 분들이 있어서 그런지 설문 조사 결과를 통계적으로 다루는 과정이 자주 눈에 띕니다. 따라서 리서치 통계를 위한 엑셀 사용법을 찾는 분들에게는 급한 불을 끌 수 있는 책이 될 수 있지 않을까라는 생각이 듭니다. 공공 데이터를 다루는 내용도 많기 때문에 대학교에서 엑셀 데이터 분석 과정을 수강하는 학생들에게도 어울리는 보조 교재라고 봅니다.

저는 최근에 포스텍에서 운영하는 빅 데이터 아카데미 과정을 수료했습니다. 주로 파이썬이나 R을 활용한 데이터 수집 및 분석의 학습을 기대하였고 그 이전부터 그것이 빅 데이터의 근간을 이루는 기술이라고 생각했습니다. 상대적으로 하나의 소프트웨어에 불과한 엑셀의 가치를 제대로 알지 못했으나 엑셀을 활용한 고급 데이터 분석 과정을 함께 수강하고 빅 데이터를 분석하여 문제 해결을 도출하는데 엑셀이 얼마나 유용한지 새삼 깨닫게 되었습니다.

엑셀은 강력한 데이터 분석 도구이고 앞으로도 그 기능을 끊임없이 확장해 나갈 것입니다. 엑셀은 수집한 데이터 집단에서 유의미한 결과를 도출하는데 가장 실용적인 도구이며 [데이터 과학]이라는 말을 붙여도 전혀 이상할 것이 없다는 것을 이 책을 통해 다시 확인할 수 있었습니다.

cona***l2019-04-14

코딩을 몰라도 데이터 분석 할 수 있다!

최근 컴퓨터 분야에서 대세는 단연 데이터이다. 빅데이터는 흔히 들을 수 있는 말이며 AI 역시 충분한 학습을 위한 데이터가 필수이다.

먼나라 이야기 같은 데이터 과학. 프로그래밍을 모르면 더더욱 멀게만 느껴질 것이다. 그런데 여기 엑셀만 알아도 할 수 있는 데이터 과학을 이야기하는 책이 있다.

데이터 과학이란 다양한 분야에 사용될 수 있는데 꼭 코딩이 필요한 것이 아니다. 말 그대로 데이터를 다루고 분석하는 과정이기 때문에 어떤 툴에 종속적이지 않다. 따라서 우리가 흔히 사용하는 엑셀만으로도 충분히 데이터를 다룰 수 있다. 이 책은 그런 방법들을 알려준다.

그런데... 난 엑셀도 잘 할 줄 모르는데요??

걱정마시라... 개발자인 나도 엑셀은 사실 거의 쓰지 않기 때문에 잘 모른다. 하지만 이 책에서는 데이터를 다루는데 필요한 엑셀 기능을 친절하게 설명해주고 있다. 엑셀을 몰라서 할 수 없다는 말을 할 수 없게끔.

보시라. 평균을 구하는 단순한 과정이지만 엑셀을 모르면 어려운 일이다. 차라리 코딩하는게 편할 수도 있다. 그렇지만 이 책에서는 화면까지 캡쳐해서 보여주기 때문에 문제 없이 실습을 할 수 있도록 구성되어 있다.

그리고 그냥 설명만 하면 읽을 때 이해하기도 더 어렵고 그 순간에만 이해하고 실제 사용할 때 어려움이 있을 수 있다. 하지만 이 책은 '직접 해보기'를 지속적으로 권하고 있다. '풀어봐!' 라는 식의 문제를 내는 것이 아니라 친절히 알려주면서 '이렇게 따라해봐.'라는 개념이다.

그러니... 난 프로그래밍을 전혀 몰라서 코딩을 못해. 난 심지어 엑셀도 할 줄 몰라서 데이터는 나와 먼 이야기야.. 라고 생각하지 말고 이 책을 통해서 '아! 데이터란 이런 거구나!'라는 새로운 영역 개척의 짜릿함을 맛보기를 바란다.

ser***l2019-04-14

데이터 과학을 배우는데 있어서 뭐부터 해야 할 지 모르겠는 분들을 위한 입문서

<제목에 충실한 데이터과학 입문서>

엑셀만알아도할수있는데이터과학.jpg

- '한빛미디어 나는 리뷰어다' 4월 리뷰어 선정을 통해 증정받아 읽고 쓰는 후기입니다.

기획/운영 업무를 시작하면서 마케팅도 살짝 발을 담그게 되었습니다. 그러다보니 데이터 관리, 데이터 분석에 관심이 높아지고 있는 중에 리뷰어 이벤트로 인해 도서를 받아 읽어볼 수 있는 기회가 생겼습니다.

결론부터 말씀드리면 이 책은 데이터 과학에 관심이 있으나 데이터 과학이 무엇인지, 어떻게 하는 것인지 전혀 모르는 분들에게 뼈대를 잡아주는 책입니다. 아주 간단하게 데이터에 관한 용어를 소상히 설명하고, 이 용어를 어떻게 받아들일 수 있는지에 대한 팁까지 곁들입니다. 물론 원서가 일본 책이라 잘 모르는 고유명사가 등장하는 데이터가 종종 있긴 하지만 불편한 정도는 아닙니다. 책의 장단점은 다음과 같이 정리할 수 있습니다.

(장점)
1. 디자인: 개인적으로 좋아하는 디자인입니다. 번잡하지 않은 깔끔함을 가지고 있는 책입니다. 구성 또한 저자가 얘기해주는 듯한 팁은 사람 캐릭터와 함께 말풍선으로 처리하고, 눈여겨봐야 할 용어에 하이라이팅이 잘 되어 있습니다.

2. 친절한 설명: 정말 초보자를 대상으로 한다는 걸 쉽게 알 수 있을 정도로 친절한 책입니다. 엑셀을 몰라도 데이터과학을 시작하는데 있어서 필요한 부분만 친절하게 설명해주며, 공부할 내용에 대한 프리뷰, 해당 장을 공부하면서 생각해보아야 할 주제, 직접 해보는 실습에서의 설명으로 구성 또한 읽기 편합니다. 제가 가장 좋아하는 파트는 '이 장의 핵심정리'인데, 만약 데이터과학을 공부하는데 있어서 시간이 부족하다면 이 파트를 읽어보며 더 자세히 알고 싶은 건 본문을 읽는 방식을 채택해도 좋을 듯 합니다.

(단점)

1. 디자인: 캡쳐로 삽입된 엑셀표가 조금 산만합니다. 이미지가 깨지는 듯한 느낌이 들 정도입니다.

2. 부록: 해답과 부록 부분이 따로 분리되었으면 좋겠습니다. 보기 불편합니다.

데이터 과학에 대한 개념이 잡힌 분들이라면 굳이 읽을 이유는 없습니다. 그러나 입문자와 초보자에게는 데이터 과학의 뼈대를 잡기에 좋은 책이라 생각합니다. 물론 데이터 과학을 위해 R, 파이썬으로 시작하고 싶은 분들이라면 크게 읽을 이유 없다고 생각하실 수 있지만, 엑셀 내용을 제외하고라도 개념 자체가 충만한 책이기에 나쁘지 않을 것 같습니다.

rona***l2019-04-14

엑셀의 바다 속에서 진주를 캐 보자

『엑셀만 알아도 할 수 있는 데이터 과학』, 우와후지 이치로우 외지음, 진솔 옮김, 한빛미디어, 2019

undefined

별자리는 아는 만큼 보인다고 한다. 쏟아질 것 같은 무수한 별들 사이에서 별과 별이 선으로이어져 우리가 알고 있는 별자리 형태로 보이길 기대해보지만, 까만하늘에 촘촘히 박힌 무수한 점들로 밖에 보이지 않는 경우가 대부분이다. 그러나 별자리를 알고 찾는 연습을 하다보면 어느 순간에는 자연스럽게 선과 선이 이어져 별자리를 쉽게 찾을 수있게 된다.

데이터 분석도 이와 마찬가지라는 생각이 든다. 데이터라는 무수한 별들 중에서 유의미한 데이터를 찾기 위해서는 우선 이를 이해하고 분석할 수 있는 능력이 필요할듯 하다. 분석할 수 없다면 한낱 무의미한 숫자에 불과할 것이다.

올해로 직장생활 16년차. 업무 시간의 대부분을 엑셀과 씨름하며 지낸다. 엑셀 데이터의 바다속에서 허우적 대고, 그 숫자들 사이에서 뭔가 새로운 의미가 있지 않을까 싶어 눈이 빠져라 들여다 보기도하지만, 결국 내게 주어진 제한된 시간과 데이터 분석에 대한 이해의 한계로 인해 마음을 접거나 다른업무에 밀려 후일로 미루는 경우가 대부분이었다.

그래도 이 많은 데이터 중에서 유의미한 정보가 없을까 싶어분석 스킬을 높이기 위해 엑셀 함수 책도 사서 읽어봤지만, 함수에 대한 이해도가 높아진다고 해서 결과값에대한 해석, 분석의 이해도가 높아지는 건 아니었다.

그래서 다시 통계학에 대한 이해도를 높이고자 통계학, 정보분석 관련 책을 사서 읽었으나, 이번에는 이를 엑셀에 어떻게적용하면 될지 쉽게 연결되지 않아 애를 먹었다.

또 최근에는 파이썬을 이용한 인공지능 알고리즘으로 데이터를쉽게 분석할 수 있다고 하여 파이썬에도 도전하였으나, 여전히 데이터 분석에 대한 낮은 이해도라는 장벽으로손을 놓아야 했었다.

그래서 좀 더 쉽게 엑셀 함수를 이용해서 통계학 기반의 데이터분석기법을 설명해주고, 이를 실습할 수 있는 책이 있었으면 좋겠다는 생각을 하고 엑셀 함수 책과 통계학책을 접었는데, 드디어 이 둘을 함께 할 수 있는 책, 『엑셀만알아도 할 수 있는 데이터 과학』을 만났다.

데이터 분석 3단계(데이터 수집&검토à데이터 집계&분석à데이터 시각화&응용) 전반에 대해 정리가 되어있어, 데이터 분석에 대해 전반적으로 이해하는데 도움이 되었다. 데이터 분석에 대한 이론적 설명과 함께 엑셀 실습 과제를 따라하며 데이터 분석에대한 이해도를 높일 수 있어 좋았다.

한 번 읽고 따라했다고 해서 완벽히 이해하는 수준은 되지않았다. 한 번의 실습으로 바로 체화가 되어 업무에 바로 적용하기에는 무리가 따랐지만, 반복적인 실습과 응용을 통해 이해의 수준을 높인다면, 엑셀의 바다속에서 유의미한 진주 같은 정보를 캐낼 수 있을 것 같다는 자신감이 생겼다.

입문용 수준은 아니어서 엑셀 함수에 대한 이해나 통계학에대한 이해가 낮다면 다른 책들을 먼저 읽거나, 함께 보는 방법을 권한다.

sanke***l2019-04-14

엑셀만 알아도 할 수 있는 데이터 과학 리뷰

이 책은 엑셀만 알아도 할수 있는 과학은 아니다 하지만 이책을 정독을 하면 큰도움이 될거라고 의심치 않는다.

그 이유는 데이터 수집뿐만 분석까지 하나하나 설명을 하고있다. 어떻게 하면 에러없이 데이터를 가공을 손수 손으로 할때 실수를 방지했는지 어떻게 분석을 할지 특이 이 분석부분이 하이라이트라고 볼수 있는게 제가 분석책을 본게 거의 없어서 그럴수도 있어도 큰그림을 잘 설명한 책은 본적이 없었다

daso***l2019-04-13

[리뷰]엑셀만 알아도 할 수 있는 데이터 과학

몇 년 전부터인가 DT, Cloud, Big Data, AI 등의 단어가 유행하기 시작했다.

그중에서 Big Data 분야는 오래전부터 누군가는 해왔던 작업인 거로 인식을 하고 있었다.

대략 정확하게는 잘 몰라도 DB에서 쿼리를 실행해서 통계를 내는 정도라는 인식이 있었다.

그러다가 R이라는 분석 툴이 있다는 것을 알게 되었지만, 큰 관심은 없어서 그냥 있는 정도로 알고 있었다.

큰 관심이 없다기보다는 통계라고 하면 다들 수학부터 해야 하지 않을까 하는 근심과 걱정이 앞서는 것이다.

그러던 차에 이 책을 접하게 되었다. 이 책은 데이터를 어떻게 수집/검토, 집계/분석, 시각화/응용까지

누구나 쉽게 접하는 엑셀을 활용해서 보여주고 있다.

(물론 수집/검토 단계에서 엑셀을 활용하는 것은 아니다)

통계를 다루는 책이라서 수학 얘기가 나오지 않을 수는 없지만, 다행히도 많이는 나오지 않는다.

개발자인 나의 관점에서 보면 쉽게 통계를 엑셀로 실행할 수 있을 거 같다는 의미이고,

문서 작성(보고서)을 작성하는 사람이면 좀 더 훌륭한 보고서 화면(시각화)을 만들 수 있지 않을까 하는 기대를 하게 된다.

myl***l2019-04-13

[리뷰] 쉽게 시작하는 데이터 과학 - '엑셀만 알아도 할 수 있는 데이터 과학'을 읽고

사회에는 대량의 데이터가 돌고 있고,

누구라도 간단하게 그 데이터를 손에 넣을 있습니다.

그리고 데이터가 많으면 많을수록

데이터의 특징이나 속성을 적절히 가려내어

활용하는 능력이 필요합니다.

저자의 서문

빅데이터의 시대가 되면서 자연스럽게 개발자들에 의한 데이터 분석이 당연히 여겨지는 시대가 되었다.

Hadoop같은 플랫폼이나 R이나 Python 프로그래밍 언어로 데이터 분석을, 데이터 과학을 시작해야 한다는 생각이 있었다.

데이터 과학을 위해 여러 언어를 스터디 해보곤 했지만, 이번에 리뷰한 책을 읽고 나서 예전에는 너무 개발자가 관점에서 데이터 과학을 읽었다는 생각이 들었다.

"엑셀만 알아도 할 수 있는 데이터 과학"

업무적으로 또는 논문을 쓰면서 만났던 데이터를 분석할 때 엑셀을 유용하게 사용했던 기억이 있다.

간혹 엑셀의 한계를 벗어나는 데이터를 만나는 경우도 있었지만,

대부분의 데이터가 엑셀만으로도 충분히 처리가 가능한 수준이라는 면에서 굳이 프로그래밍 언어 없이 데이터 분석이 가능한 것 같다.

이 책에서 가장 마음에 들었던 부분은 단순히 데이터 분석만을 위해 프로그래밍 언어나 툴을 설명하는 것이 아니라, 데이터 과학의 기본적인 이야기부터, 데이터 수집 , 정리, 분석, 공공데이터의 활용, Trouble Shooting 까지 다양한 이야기를 한 권의 책에 담고 있다.

책에서 이야기하고 싶은 주요 이야기들

linuxw***l2019-04-12

데이터 수집/집계/분석/시각화의 완벽 설명서

회사 업무 혹은 프로그램을 개발할 때 우리는 무수히 많은 정보를 데이터 형태로 변경하여 결과를 도출해 냅니다.

이렇게 데이터를 만들고, 모아서 변환하는 방법에 대한 명확한 개념이 잡혀 있지 않다면, 데이터 수집 대상을 잘못 선정하거나 수집 방법에 문제가 생겨, 잘못된 결과를 업무에 적용하게 되는 오류를 범하게 됩니다.

간단한 예로, 쇼핑몰에 가입한 회원의 연령이 20, 21, 29, 80세라면 쇼핑몰 이용자의 평균 연령대를 단순한 평균식으로 계산하면 37.5세가 됩니다. 이 결과 만으로 30대 후반을 타깃으로 마케팅을 하게 된다면 대단히 잘못된 결과를 초래하게 됩니다.

본 서적은 위와 같이 데이터를 다루면서 실제로 발생하는 문제를 심층 있게 다루면서, 다양한 각도에서 해결책을 제시하고 있습니다.

무엇보다, 데이터를 수집하고 정리해서 집계와 교차표를 만들고 그래프로 시각적인 결과를 만들기까지의 긴 과정을 접근성이 좋은 ‘엑셀’이라는 프로그램으로 설명하고 있어, 초보자들도 쉽게 예제를 통해 데이터 과학의 기초 개념을 학습할 수 있습니다.

이 책의 두드러진 장점을 다음과 같이 요약할 수 있습니다.

1. 의료, 건강, 복지에 대한 데이터를 실습용 데이터로 사용하고 있습니다. 가공의 억지 데이터가 아닌 실제 조사를 통해서 공개된 데이터를 예제로 사용합니다. 따라서 데이터 분석이나 문제점 분석을 생생하게 체험할 수 있습니다.

2. 데이터 조사, 수집, 분석의 전과정을 설명하면서 구체적인 문제점과 그 대처방법에 대해서 상세히 설명합니다. 설문지 작성 방법과 데이터 정리 방법은 실무에 바로 적용이 가능한 유용한 내용입니다.

3. 엑셀의 다양한 함수를 실습(직접 해보기)을 통해서 학습하게 됩니다. 엑셀 함수의 사용법을 스크린샷과 함께 설명하기 때문에 초보자도 쉽게 이해하고 따라할 수 있습니다.

4. 적절한 통계 그래프 만드는 방법에 대해서 설명합니다. 특정 데이터에 대한 결과 화면에서 어떤 그래프 타입을 사용해야 하는지 예제와 함께 명쾌하게 설명합니다.

5. 통계학의 기초를 다룹니다. 실무에서 혹은 통계 프로그램 개발 시 유용하게 써먹을 수 있는 정보들로 구성되어 있습니다. 평균값, 중앙값, 최빈값, 최소/최대값에 대한 설명은 정말 간단하지만 업무 여기 저기에 유용하게 써먹을 수 있는 이론입니다.

6. 공공데이터포털(https://www.data.go.kr/)을 방문하시면 개방된 공공 데이터가 많습니다. 이를 이용해서 상업용 프로그램을 개발하여 서비스할 수도 있습니다. 본 서적은 국가통계포털 홈페이지에서 제공하는 데이터를 수집/가공하여 원하는 결과를 만들어 냅니다.

7. 설문조사 및 인터뷰 자료를 만드는 방법에 대해서 상세히 다루고 있습니다. 관련 업무나 프로그램 개발에 유영하게 참고할 수 있습니다.

8. 번역서이지만 번역투나 오역이 없어 편안하게 읽을 수 있습니다. 예제로 사용된 데이터가 일본의 데이터이지만 실습하거나 이해하는데 전혀 문제될 것은 없습니다.

기초 통계나 엑셀이 아닌 좀 더 전문적인 프로그램에 관심이 있는 분들께 제가 공부했던 책을 추천해 드립니다.

(1) 실생활 예제로 배우는 정말 쉬운 통계 이야기: Head First Statistics

(2) 제대로 알고 쓰는 논문 통계분석: SPSS & AMOS 21

그리고 엑셀을 좀 더 완벽하게 이해하고 싶은 분들은 “회사에서 바로 통하는 엑셀 2016”을 참고해 보세요. 실습 위주로 정말 쉽고 명쾌하게 엑셀을 분해해서 설명한 책입니다.

zzo***l2019-04-12

데이터과학을 쉽게 입문할 수 있도록 도와주는 책

책 제목에서부터 쉽게 풀어썼을 것 같은 느낌에 이 책에 관심이 갔다. 막상 실무에서 데이터 과학을 한다 하더라도 엑셀을 많이 사용하는 편이고 꼭 복잡한 기술을 써야하는게 아니기 때문에 책 제목이 마음에 들었다.

이 책 앞 부분에 있는 옮긴이의 말 처럼 데이터 과학은 꼭 대용량 컴퓨터가 필요하고 복잡한 기술이 없어도 가능한게 데이터과학이라 생각한다. 이 책의 초반에 나오는 이 얘기를 통해 이 책이 쉽게 쓰여졌음을 그리고 기본적인 통계기능과 엑셀의 몇 가지 수식만으로도 데이터과학을 할 수 있음을 얘기해 준다.

또, 이 책은 일본어로 된 책을 번역한 책이라 공공데이터를 사용했다 하더라도 일본의 데이터를 그대로 사용했겠다 생각했는데 일본 공공 데이터와 함께 국내 공공데이터를 활용하는 사례도 함께 나와있다.

데이터의 척도와 종류에 따라 분석하는 방법이 달라지는데 질적자료, 양적자료에 대해 자세하게 설명이 되어 있다. 데이터를 바라볼 때 질적자료인지 양적자료인지 수치형인지 범주형인지 연속적인지 비연속적인지에 따라 분석과 시각화가 달라지는데 이런 부분도 예제와 실습을 적절하게 구성되어 있다.

데이터 클리닝, 새로운 변수의 작성 등 데이터를 전처리 하거나 분석을 해서 새로운 변수를 추가해주는 이유에 대해 설명하고 그 방법을 구체적으로 설명하고 있다. 이 책에서는 인구데이터를 주로 예제로 사용하는데 연령을 20대, 30대, 40대 처럼 숫자의 특성의 데이터를 범주화 하는 기법에 대해서도 설명과 함께 시각화가 되어 있어 이해하기 쉽게 되어 있다.

연령의 binning 혹은 bucketing 예제

막대그래프의 종류

막대그래프를 그릴 때 다양한 종류로 그릴 수 있는 예제와 쌓아올린 막대그래프와 쌓아올리지 않은 막대그래프의 차이를 시각화 하여 잘 설명하고 있다.

표준오차, 첨도, 왜도 데이터 과학을 다루며 기본적으로 배우게 되는 이론적인 내용에 대해서 수학공식과 함께 이해할 수 있도록 되어있다.

국내통계 일본 서적이라 일본의 공공데이터만 다루지 않을까 했는데 역자가 국내데이터로 이 부분을 따로 만든것 같다. 국내에서 사용할 수 있는 인구데이터를 가져와 우리나라에 맞게 실습할 수 있도록 가이드를 주고 있다.

전체적으로 쉽게 설명하려고 노력한 흔적이 많이 보이는 책이다. 통계학에 대한 기초적인 지식을 이해할 수 있고, 데이터 요약과 시각화를 인구데이터를 통해 실질적인 예제로 이해할 수 있도록 구성되어 있다. 통계는 수식이 많고 복잡해서 실제 데이터로 이해해보고 공식을 적용해 보지 않으면 개념을 이해하기가 쉽지 않은데 이런부분을 최대한 쉽게 설명하려고 노력한 책인 것 같다.

ydk***l2019-04-11

데이터를 집계, 분석, 시각화 응용 누구나 쉽게 할 수 있도록 안내 한 책으로 강추!!!

엑셀데이터과학_DT_표1.jpg

‘엑셀만 알아도 할 수 있는 데이터과학’은데이터 수집부터 분석, 문제해결까지!라는 캐치프레이즈 와같이, 엑셀의 활용지식 초보자도 누구나 쉽게 데이터를 수집&검토, 데이터 집계&분석, 데이터시각화&응용을 접근할 수 있도록 통계학의 이론적 배경 설명과 함께, 엑셀을 이용한 공공 데이터를 활용한 의료, 보건, 복지, 분야의 사회적 현상을 분석할 수 있도록 접근한 점이 이 책의특징이라 할 수 있다.

의료, 보건, 복지, 이공계분야 등 공공 데이터 활용을 통한 다양한 사회 현상을 공부하고자 하는 대학생, 대학원생, 공무원, 연구자, 일반독자들의 전문 통계학 S/W(SAS, SPSS 등)을 다루기쉽지 않은 현실을 감안할 때, 엑셀을 활용하여 누구나 조금 노력한다면 가능할 수 있도록 공공 데이터를사례로 들어 [직접 해보기]를 통해 문제를분석하고 확인할 수 있도록 하여 독자의 이해도를 높인 점은 높이 칭찬한다.

특히, 설문 및 통계를 필요로 하는 분야의 데이터 수집과 집계, 분석, 응용을 공부하는 의료, 보건, 복지, 이공계 등 전공 학과의 ‘기초통계학’, ‘엑셀 응용’의 교재로 활용하여도 좋을 것 같다는 생각으로 강추!!!!.

독자로서 대부분의 엑셀응용 도서가 가공의 데이터를 사례로 활용 하였다면, 이 책은 공공 데이터를 활용하여 현실성 있게 데이터를집계 분석하는 능력을 키우는데 큰 도움이 되었다.

heoh***l2019-04-10

엑셀만 알아도 데이터 과학

IT관련 서적으로 유명한 한빛 미디어에서 데이터 관련 책을 출시하였습니다.

데이터과학에서 가장 중요한 것은 역시 데이터입니다. 데이터가 있어야만 분석이든 시각화든 할수 있으니깐요. 데이터가 있다고 하여도 이를 잘 활용하여 가치 창출을 할수 있는 정보가 되기 위해서는 무엇보다 데이터를 수집하고 분석할수 있는 툴의 활용능력이 중요하다고 할 수 있습니다.

저는 약 6년동안 일본IT기업에서 일해 본 경험이 있는데 실제로 같이 일했던 일본인이 엑셀을 활용하는 모습을 보면서 놀랐던 적이 한두번이 아니였습니다. 모든 문서의 90%이상이 엑셀이며 엑셀로 모든것을 만들어 내고 자동화하고 시각화하여 데이터를 가공하여 원하는 결과물을 내는 모습들을 옆에서 보면서 정말 대단하다고 느꼇습니다. 일본에서는 엑셀만 잘해도 먹고 사는데는 걱정이 없겠구나 라고 생각할 정도 였으니깐요

데이터분석하면 파이썬과R을 많이 활용하는데 누구나 쉽고 편하게 접근할수 있는 엑셀를 활용하여 접근성을 높이고 통계 분석의 필요성과 분석 기법에 대한 내용을 연결하여 쉽게 이해 할 수 있도록 하였습니다.

데이터 분석을 위해 3단계로 나뉘었습니다.

첫번째 1단계 -> 데이터 수집&검토

데이터 과학에서 가장 중시해야 할 것은 분석 재료인 데이터인데 해당 문제를 해결하기 위해서는 어떠한 데이터가 필요한지를 가려내는 것이 중요하다고 할수 있습니다. 데이터의 유형과 데이터를 모으고 만드는 방법을 실제 사례와 함께 엑셀에서 어떻게 활용하는지에 대해서 그림과 같이 설명되어 이해하기 쉽도록 하였습니다.

두번째 2단계 -> 데이터 집계&분석

데이터를 집계하는 방법들에 대해서 설명해 줍니다. 집계시 유의사항, 어떻게 하면 양질의 자료를 집계 할수 있는지에 대해서 그림과 더불어 자세히 설명해 줍니다. 그리고 엑셀의 다양한 분석도구들을 통해 실제 분석하는 방법들을 설명해 줍니다.

세번째 3단계 -> 데이터 시각화&응용

분석된 데이터를 다양한 시각화와 분석된 결과의 해석 및 문제의 해결등을 통해 실제 문제를 해결을 할 수 있도록 다양한 문제해결 방법들을 제시합니다.

총평

1. 기업에서의 데이터 활용이 점점 늘어남에 따라 데이터는 기업의 소중한 자산이 되었습니다. 그만큼 데이터를 활용하여 가치창출을 일으키는 산업이 계속해서 늘어날 것이며 이에 대한 사람의 수요도 점점 늘어날 거라 생각합니다. 데이터분석가나, 데이터과학자를 희망하는 사람에게는 분석 툴의 활용 능력을 한층 업그레이드 할 수 있을꺼라 생각됩니다.

2. 실제 현업에서 데이터를 많이 다루는 사람에게는 이 책이 많은 도움이 될 것이라고 생각됩니다.

3. 후반부에 들어서는 약간 어려운 부분이 있지만 그래도 이해하는데 큰 무리는 없었습니다

web***l2019-04-09

엑셀로 데이터분석 가능해~~

다양한 디바이스가 증가하고 거기서 생겨나는 데이터들이 어머어마하죠.일명 빅데이터라고도 하죠. 이제는 흔히 쓰이는... 어디에서나 갖다 붙여 쓰는 빅데이터란 용어가 흔할텐데요.이제 이토록 많은 데이터를 어떻게 활용할 것인가를 고민하고 있는데요. 빅데이터를 활용하기 위해서는 여러가지 도구들로 데이터를 수집, 정제, 분석등의 작업을 하고 있는데요. 그 중 파이썬과 R과 같은 도구들도 있구요. 더 전문적으로 사용하는 툴들이 많이 있는 걸로 알고 있어요.이 책은 그런 전문적이거나 접하기 힘든 툴이 아닌 우리가 접하기 쉬운 엑셀이란 도구로 데이터를 접근해서 어떻게 작업을 하는지에 대한 방법적인 부분을 다룬 책이에요.엑셀만해도 업무에 있어서 생산성이 높아진다는 건 다들 아실테지만, 엑셀에 모든 기능을 알아야 가능한 것은 아니고 데이터작업에 필요한 부분만 다루고 있어서 그렇게 부담을 가질 필요는 없을 것 같애요.

다양한 디바이스가 증가하고 거기서 생겨나는 데이터들이 어머어마하죠.

일명 빅데이터라고도 하죠. 이제는 흔히 쓰이는... 어디에서나 갖다 붙여 쓰는 빅데이터란 용어가 흔할텐데요.

이제 이토록 많은 데이터를 어떻게 활용할 것인가를 고민하고 있는데요.

빅데이터를 활용하기 위해서는 여러가지 도구들로 데이터를 수집, 정제, 분석등의 작업을 하고 있는데요.

그 중 파이썬과 R과 같은 도구들도 있구요. 더 전문적으로 사용하는 툴들이 많이 있는 걸로 알고 있어요.

이 책은 그런 전문적이거나 접하기 힘든 툴이 아닌 우리가 접하기 쉬운 엑셀이란 도구로 데이터를 접근해서 어떻게 작업을 하는지에 대한 방법적인 부분을 다룬 책이에요.

엑셀만해도 업무에 있어서 생산성이 높아진다는 건 다들 아실테지만, 엑셀에 모든 기능을 알아야 가능한 것은 아니고 데이터작업에 필요한 부분만 다루고 있어서 그렇게 부담을 가질 필요는 없을 것 같애요.

[크기변환]IMG_1220.jpg

데이터 작업의 순서를 보면

1단계 : 데이터의 수집 & 검토

여기서는 향후 데이터 작업을 할 때 원 데이터를 어떻게 수집과 검토를 하는지 이론을 바탕으로 설명을 하고 있어요.

사례와 함께 설명하고 있어서 이론을 설명하면서도 어렵지 않아요.

2단계 : 데이터 집계 & 분석

데이터를 집계하는 방법, 분석시에 사용되는 엑셀의 기능들과 함께 설명하고 있어요.

3단계 : 시각화 & 응용

이제 데이터를 어떻게 하면 좀 더 보기 좋게 시각화 시키고 또 다시 응용을 위한 방법적인 부분도 다루고 있어요.

[회전]IMG_1221.jpg

이렇게 데이터를 다룰 때 순차적인 작업을 통해 어떠한 방법으로 어떻게 결과물을 도출하고 분석하느냐에 따라서 완전 다른 결과가 나오듯이

잘못된 방법과 함께 설명을 해주고 있어요.

undefined

엑셀에서 사용할 수 있는 함수가 여러가지가 있는데 필요한 함수를 위주로 설명을 하고 있고 또 따라 할 수 있게 예제로 설명을 잘 해주고 있네요.

한 장을 마무리 하면서는 엑셀에서 필요했던 함수도 정리가 되어져 있고, 또 혼자 연습을 할 수 있게 문제와 해답도 제시해 주고 있어요.

데이터과학이란 단어는 많이 들어봤지만 어떤 것이고, 우리가 쉽게 사용할 수 있는 엑셀이란 툴로 어떻게 사용해서 데이터를 분석하고 결과를 도출하고 문제를 해결하는지에 대한 얘기를 하고 있어요.

그래서 전체적인 내용은 쉬운 편에 속하지만 어쩔수 없이 수학에서 통계부분을 다루고 있기 때문에 통계와 관련된 수학용어를 알고 있어야 해요.

책 내용중에 설명을 해주고 있지만 상세히 설명을 해주고 있진 않아서 처음 접하시는 분들은 용어에 대한 이해가 선 학습이 되어야 할 것도 같애요.

그리고 책 내용 중간에 어려운 수학식도 많이 들어가져 있고, 그 식에 대한 설명도 포함되어져 있지만 큰 부담감은 안 가지셔도 될 듯해요.

모르면 패스하면 끝

총평

1. 데이터 분석을 위해 어려운 툴을 사용하지 않고 엑셀도 가능하다.(충분?)

2. 데이터 분석에서 데이터를 다루는 방법을 익힐 수 있다.

3. 데이터 작업에 대한 전반적인 이해와 흐름을 알기엔 좋다.

4. 수학적인 지식, 특히 통계와 관련된 용어정도는 선 학습이 필요하다.

(책 내용 중 통계학 기초부분에서도 다루고 있음)

5. 엑셀 중 함수, 그래프, 피벗테이블의 기능을 주로 다루고 있으니 알고 있으면 접근이 쉬울 것 같다.

newst***l2019-04-09

진짜!! 엑셀만 알아도 할 수 있는 데이터 과학

한빛미디어의 독자 리뷰를 다시 하기로 했다.

<나는 리뷰어다> 여러 책을 선택하고 그중에서 한권이 집에 오는 형태인데,

데이터 과학 관련 책이 있어서 선택하게 되었다.

아무래도 프로그래머나 통계를 전공한 사람이 아니면, R이나 SPSS, SAS를 다루기가 쉽지 않다.

하물며 파이썬은 허들이 너무 높다.

액세스도 DB라고 생각하는 나로서는, 엑셀도 충분히 훌륭한 도구라고 생각한다.

2019-04-09 08.50.16.jpg

이번에 리뷰하는 책은 [엑셀만 알아도 할 수 있는 데이터 과학] 이라는 번역서 이다.

이 책은 통계 내용도 포함되어 있는데, 일본 책 특성상 통계 이전에 기초 수학도 함께 다루고 있어서 쉽게 볼 수 있다.

photo_2019-04-09 08.44.06.jpeg

표본에 대한 개념, 회귀분석 등에 대한 통계에 대한 부분과,

데이터 검증 방법, 공공데이터 활용 등 실제 업무에 바로 적용할 수 있는 요소들도 많기에 많은 도움이 될 것이라고 생각된다.

그리고 엑셀 화면을 직접 캡쳐해서 구성했기에 입문자도 쉽게 따라 할 수 있도록 되어있다.

2019-04-09 08.46.11.jpg

다만, 엑셀로 다루는 통계 중에 아마 가장 일반적인 것이 피벗테이블인데, 할당된 분량이 적어서 좀 아쉽다.

그리고 예제 파일도 함께 포함을 했더라면 더 좋지 않았을까 생각이 든다.

엑셀만 알아도 할 수 있는 데이터 과학

데이터 수집부터 분석, 문제 해결까지!

자료 다운로드시 유의사항

▶ 부록/자료 관련 FAQ