메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

이것이 데이터 분석이다 with 파이썬

파이썬으로 배우는 데이터 분석 입문 (동영상 강의 무료 제공 / 판다스, 넘파이, Matplotlib 활용)

한빛미디어

집필서

판매중

  • 저자 : 윤기태
  • 출간 : 2020-02-10
  • 페이지 : 360 쪽
  • ISBN : 9791162242513
  • 물류코드 :10251
  • 초급 초중급 중급 중고급 고급
4.8점 (40명)
좋아요 : 10



실생활 예제로 쉽게, 단계별 분석에 따라 구조적으로 배우는 데이터 분석 입문서

데이터를 다루는 데 언어나 라이브러리는 도구일 뿐입니다. 진짜 중요한 것은 문제해결 능력입니다. 이 책은 주어진 문제를 어떻게 단계적으로 접근하면 좋을지에 대해 독자 친화적으로 가이드를 주는 책입니다. 프로그래밍 기초 지식만 있다면 통계에 대한 지식이 전혀 없는 비전공자도 데이터 분석에 입문할 수 있도록 쉽게 풀어썼습니다.

 

종합 예제를 통해 학습 내용을 입체적으로 실전에 적용해본다. 

중고 휴대폰 거래 가격 예측, 구매 데이터를 분석하여 상품 추천하기 등 종합적인 예제를 통해 앞에서 배운 내용을 입체적으로 실전에 적용해 볼 수 있습니다. 또 기본적인 데이터 전처리 및 시각화, 그리고 결과 회고에 이르기까지의 분석 사이클을 일정 수준까지 경험할 수 있습니다.

 

 

어떤 독자를 위한 책인가?

  • 라이브러리를 사용하는 프로그래밍을 경험해본 사람
  • 데이터 분석에 대해 어렴풋이 들어봤지만 제대로 공부해본 경험이 없는 사람
  • 입문자에게 중요한 분석 포인트를 알고 싶은 사람

 

 

이 책의 특징

 

① 데이터 분석의 이론보다는 ‘흐름’을 담았습니다. 

이 책은 데이터 분석 이론, 혹은 라이브러리 사용법을 아주 자세히 설명하지는 않습니다. 그 이유는 데이터 분석으로 문제를 해결하는 과정 자체에 집중하기 위함입니다. 따라서 필수적으로 다뤄야 할 이론에서는 최대한 수식을 배제하고 직관적인 설명만 담았습니다.    

   

② 단계별/반복적으로 학습하며 데이터 분석을 체계적으로 배울 수 있습니다. 

데이터 분석을 각 step별로 단계적으로 배울 수 있도록 구성했습니다. 각 Chapter에서는 대표적인 데이터 분석 방법 하나씩을 다룹니다. ‘비트코인 시세 예측’, ‘우리나라는 술을 얼마나 독하게 마실까’ 등 흥미로운 예제를 기반으로 데이터 분석을 체계적으로 학습할 수 있습니다. 

.

③ 저자 직강 동영상 강의 무료 제공

https://www.youtube.com/user/HanbitMedia93

한빛미디어 유튜브 채널에서 『이것이 데이터 분석이다 with 파이썬』의 저자 직강 동영상도 만나보세요! 공부하다가 막힐 땐 각 강좌의 댓글에 질문을 남기면 저자가 직접 답변을 달아드립니다.

 

상세이미지_이것이데이터분석이다_700.jpg

 

윤기태 저자

윤기태

아주대학교 미디어학과를 졸업하였으며, 패스트 캠퍼스에서 파이썬과 데이터 분석을 주제로 강의하였다. 현재는 이커머스 분야에서 추천시스템을 만드는 머신러닝 엔지니어로 일하고 있다. 주로 랭킹 모델링과 분산처리를 고민하는 데 시간을 보내는 편이다. 데이터 분석과 개발이 취미이지만 취미보다는 노는 것이 더 좋다. 특히 영화를 아주 좋아해서 돈만 준다면 밥도 안먹고 영화만 볼 수도 있다. 그래서 최근에는 영화를 보며 돈을 벌 수 있는 방법을 고민하고 있다. 글쓰는 것도 좋아해서 블로그((https://yamalab.tistory.com)에 이것 저것 쓰고 있으며, 주로 데이터 분석에 대한 글을 쓴다.

Chapter 00. 들어가기 전에

0.1 개발환경 구축하기

0.2 데이터 분석을 위한 라이브러리

 

Chapter 01. 데이터에서 인사이트 발견하기 

1.1 탐색적 데이터 분석의 과정

1.2멕시코풍 프랜차이즈 chipotle의 주문 데이터 분석하기

1.3국가별 음주 데이터 분석하기

연습문제

 

Chapter 02. 텍스트 마이닝 첫걸음

  2.1 웹크롤링으로 기초 데이터 수집하기 

2.2 나무위키 최근 변경 페이지 키워드 분석하기

2.3 특정 키워드가 있는 게시물 크롤링을 위해 API 사용하기

2.4 트위터 API로 ‘손흥민’과 연관된 키워드 분석하기

연습문제

 

Chapter 03. 미래를 예측하는 데이터 분석

3.1 프로야구 선수의 다음 해 연봉 예측하기

3.2 비트코인 시세 예측하기

3.3 미래에 볼 영화의 평점 예측하기

연습문제

 

Chapter 04. 데이터 분류 모델

4.1 타이타닉의 생존자 가려내기

4.2 강남역 맛집 리뷰로 알아보는 감성 분류 

연습문제

 

Chapter 05. 데이터 분석 종합 예제 

5.1 중고나라 휴대폰 거래가격 예측하기

5.2 구매 데이터를 분석하여 상품 추천하기

 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

이 책은 분류, 예측, 텍스트 마이닝 등 다양한 데이터 분석 방법을 다루고 있습니다. 

비트코인 시세 예측, 손흥민 연관 키워드 분석처럼 재미있는 실습 예제가 많아서 지루하지 않게 학습할 수 있는 책입니다. 

저는 분류나 예측에 대해서는 이미 지식이 있는 편이기 때문에,

그 부분 보다는 제가 잘 알지 못하는 텍스트 마이닝 부분에 집중하며 책을 읽었습니다. 

텍스트 마이닝도 다룬다는 점이 이 책에 장점이라고 생각합니다.

제가 접했던 다른 데이터 분석 책들 중에서는 텍스트 마이닝을 담지 않는 책들이 많았기 때문입니다.

특히 데이터 분석 입문 책에서 텍스트 마이닝은 잘 다루지 않는 경우가 많은 것 같습니다.

사실 그래서 텍스트 분석은 제게도 생소한 분야였기도 하구요. 

간단한 워드 클라우드를 그린 것 말고는 꼼꼼히 분석을 한 적은 없었던 것 같아요. 

이 책은 트위터 크롤링, 연관분석, 빈도분석, 불용어 처리 등 텍스트 데이터와 관련해서 필요한 분석과 전처리를 담고 있습니다. 

라인 바이 라인으로 친절하게 설명되어 있어서, 어렵지 않게 이해할 수 있었습니다. 

개인적으로 실제 업무를 할 때도 많은 도움을 받았습니다. 

텍스트 데이터 분석과 시각화를 맡았는데, 이 책에 수록된 코드를 많이 참고했습니다. 

그리고 무엇보다도 깃헙에서 코드가 제공되고 있어서 코드를 직접 손으로 치지 않아도 되었다는 점이 좋았습니다.

깃헙에 있는 설명으로도 충분히 이해할 수 있어서 굳이 직장에 책을 들고가지 않아도 되서 편했습니다 :) 

 

어느정도 데이터 분석을 배운 분들에게도 충분히 도움이 될 만한 책이라고 생각합니다.

흔히 말하는 예측, 분류 이외에도 시계열 분석, 텍스트 데이터 분석을 담고 있어서 이 부분을 보완하고 싶은 사람들에게도 좋은 자료가 될 것입니다. 

한 권 구비해두고 필요할 때마다 꺼내보아도 좋은 책일 것 같습니다 :)  

 

데이터 분석을 시작하려는 분에게 정말 좋은 입문서입니다.

 

데이터 분석을 하려면 우선 사용할 데이터셋이 필요하고 목적에 맞게 전처리 과정이 필요합니다.

이 과정에 시간이 많이 소요되고 귀찮기 때문에 데이터 분석을 해보고 싶은 분들이 많이 포기하게 됩니다.

 

하지만 이 책에서는 가격 예측이나 구매 데이터 분석을 통한 상품 추천등 많은 분들이 흥미를 느낄 수 있는 주제로 데이터 분석을 쉽게 시작할 수 있도록 많은 내용들을 제공하고 있습니다.

데이터 셋 전처리, 분석, 시각화까지 데이터 분석을 위한 일련의 과정을 모두 체험할 수 있습니다.

또한 데이터 셋을 보고 분석 방향을 생각을 해야 하는데, 이러한 과정들도 경험해 볼 수 있습니다.

 

재밌고 쉽게 데이터 분석을 시작해 볼 수 있다는게 이 책의 가장 큰 장점입니다.

데이터 분석에 관심을 갖고 계신 모든 분들에게 이 책을 추천드립니다.

 

 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

많은 IT 서적들은 언어나 프레임웍에 대해 깊이있게 알려주거나 라이브러리의 사용법을 잘 정리하여 설명하는데 비해 , 이 책은 기존의 책들과는 조금 다른 접근 방법을 사용한다.

첫번째 장에서는 데이터를 어떻게 접근해서 어떤 그래프를 그릴 수 있고 어떤 결과를 얻을 수 있는지를 살펴본 후,

이후 매 장마다 인터넷을 돌아다니면서 흔히 접할 수 있는 텍스트들을 분석해 보고, 현재의 데이터로 미래에 어떻게 될지 예측해 보고, 비슷한 것끼리 나눠보고, 위의 내용들을 모두 합쳐 종합적인 분석을 해 본다.

실제로 분석을 할 때 기초 데이터를 어떤 식으로 접근하여 원하는 결과를 얻어야 하는지를 단계별로 풀어가는 것이다.

흐름에 중점을 두고 설명하다보니 주로 사용하는 라이브러리에 대한 설명이 부족할 수 있지만, 이 후에는 직접 레퍼런스를 찾아보며 진행할 수 있도록 만들어 준다는 점에서 좋은 실용서라 할 수 있다.

파이썬으로 코딩은 하지만 실제 데이터 분석을 어떻게 시작해야 할지 알고 싶은 분들에게 좋은 시작점이 될 것이다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

책 소개

  • 책 제목 : 이것이 데이터 분석이다 with 파이썬
  • 글쓴이 : 윤기태
  • 출판사 : 한빛미디어
  • 초판 2쇄 : 2020년 7월 10일

 

책의 특징

해당 책은 단계별로 최대한 많은 예제들을 담아내고 있다.

많은 설명을 늘어놓는 방식보다, 직접 실습을 이용해서 실행해 보거나, 퀴즈를 통해 유추해 보는 방식으로 정확히 이해할 수 있도록 돕는다.

설치부터 API 호출 이용, 데이터 분류 그리고 배웠던 모든 것을 종합한 챕터 전반적인 과정에서 책은 트렌드와 익숙할 수 있는 주제들을 선별해 예제로 풀어내어서 다소 딱딱하게 느껴질 수 있는 데이터 분석 과정을 쉽게 다가갈 수 있도록 한다.

특히, 예를들어 비트코인 시세 예측과 중고나라 휴대폰 거래 가격 예측 등 관심이 갈만한 예제들을 실습할 수 있어서 책 전반을 거치며 전혀 지루하지 않았다.

설명은 간략한 축에 속하지만 필요한 내용들을 핵심적으로 기술하고 있으며, 실습을 통해서 이해하기 무리가 없었다.

해당 책은 유튜브 강좌 또한 제공하고 있어, 이해가 안가는 개념들을 추가적으로 자세히 이해할 수 있다.



추천 대상

본 책은 파이썬을 이용한 데이터 분석으로, 파이썬을 처음 접하는 사람에게는 적합하지 않을 수 있다.
그러나, 파이썬을 접한적이 있고 데이터 분석을 입문하고자 하는 개발자에게 추천하는 바이다.

또한, 텍스트를 읽으면서 이해하는 과정보다 직접 수행해 보면서 하는 공부가 잘 맞는다면 더 적합한 학습서가 될 것이다.

 

책의 한줄평

데이터 분석 한권으로 끝내는 학습지

 

이번달 리뷰 할 책은 `이것이 데이터 분석이다 With Python`입니다!
 
저자가 소개하는 것처럼 이론이 아니라 데이터 분석의 흐름을 다루고 있는 책입니다. 프로그래밍을 어느 정도 해봤고, 새로운 경험을 원하시는 분들이 한 번쯤은 조우해도 괜찮은 책입니다.
 
많은 데이터 분석, `ML/DL` 책에서 다루는 `numpy`, `pandas`, `matplotlib`를 이 책에서도 다루고 있습니다. 자세한 사용법이 아니라 어떠한 흐름으로 사용을 해야하고 어떤 느낌으로 사용해야 하는지 실생활에서 만나는 데이터를 가지고 생동감있게 다가 옵니다.
 
이 책에서 가장 중요한 점은 `이론`이 아니라 `흐름`을 다루고 있다는 것 입니다. 제대로 데이터를 분석하기 위해선 `이론`을 무시 할 수 없습니다. 데이터 도메인에 맞는 분석 법이 있고 전처리 기법이 존재합니다. 이런 `이론`을 가지고 입문한다고 하면 제일 좋겠지만 쉽지 않은게 현실입니다.
 
모든 준비를 마치고 시작하고 싶을 수 있습니다. 이것도 부족하고 저것도 부족한데 내가 저걸 어떻게라는 걱정은 내려놓고 시작하면 좋겠습니다. 일단 시작을 해봐야 할지 말지 결정도 할 수 있지 않을까요?
 
이 책은 저자가 직접 이야기 하는 것처럼 `이론`을 각잡고 공부하면서 데이터 분석이 하고 싶은 사람에겐 부적합한 책입니다. 데이터 분석 책이라 요즘 트렌드인 `딥러닝` 기법 중에서도 최신 기술을 생각하는 분들에게도 별로입니다.
 
책 흐름대로 공부를 시작했더라면 데이터 핸들링이 지금보다는 친숙하지 않았을까 하는 아쉬움을 줄 만큼 잘 짜여있다고 생각합니다.
 
- 챕터 1: 데이터를 시각화 해서 인사이트 찾기
- 챕터 2: 데이터를 추출하고, 필요한 형태로 가공하고 시각화 하기
- 챕터 3: 데이터로 예측하고 평가하기
- 챕터 4: 피쳐 엔지어링을 가미한 모델 분류
- 챕터 5: 종합 분석
 
위와 같이 구성 되어 있습니다. 데이터에 친숙하지 않은 분들은 이 글을 읽으시면서 저게 왜 좋은 구성인데? 라는 의문을 품으실 수도 있습니다.
 
여러분이 데이터 분석을 해보겠다고 데이터 셋을 받았고, 데이터의 내용을 까봤는데 나오는 것은 의미를 알 수 없는 영문과 숫자가 전부입니다. 클래스도 강아지, 고양이가 아니라 1,2로 되어있고, `1.393715-5e`같은 값들 투성인데 과연 여기서 무슨 정보를 끄집어 낼 수 있을까요? 데이터가 어떤 분포를 가지고 있고, 속성에 따라서 어떤 스케일을 가지고 있는지 알아야 어떤 식으로 전처리 해야할지 감을 잡을 수 있습니다. 물론 데이터를 많이 다루다 보면 굳이 시각화 하지 않고도 가능하지만 이 책을 살까말까 고민하는 여러분은 시각화 된 정보가 필요합니다.
 
시각화를 통해 필요한 정보를 끄집어 냈으면 필요한 형태로 가공하고, 가공 된 데이터로 데이터가 필요한 곳에 사용합니다. 우리가 데이터를 분석하는 이유는 데이터에서 유의미한 정보를 끄집어 내 문제를 해결하거나 다가올 일을 예측하기 위함입니다. 아무런 의미가 없는 데이터 쪼가리를 우리의 삶에 적용할 수 있는 형태도 바꾸는 과정이 데이터 분석입니다.
 
이 책은 한번에 많은 걸 요구하지 않습니다. 데이터 마다 다른 목적지를 향해 갈 때 방향 지시등 같은 역할을 해줍니다. 큰 갈림길들에서 이정표 같은 책이기에 세밀한 지도가 필요한 분들에게는 추천 드리지 않습니다. 데이터 분석이라는 망망대해에서 항해를 맛보기 하기 좋은 키잡이 같은 책입니다.
 
난이도 : 중하  
추천 대상: 데이터 분석을 찍먹해보고 싶은 분들, 프로그래밍이 어느 정도 익숙한 사람

파이썬으로 배우는 데이터 분석 입문 이라는 책을 읽어보게 되었다. 파이썬을 활용해서 주어진 데이터를 분석하는 내용을 담고 있으며 책 표지에서도 보이듯이 판다스, 넘파이, Maltplotlib 을 활용한다. 

기본적으로 책이 추구하는 방향은 데이터 분석이기 때문에 다른 책들과 비슷하다. 그래서 내가 말하고 싶은 것은 이책이 다른 책과 다른 큰 장점을 말하고 싶다. 

흥미로운 주제를 통해서 데이터 분석도 배우고 재미도 챙겼다. 

챕터 별로 큰 주제가 있다. 텍스트 마이닝, 미래예측, 데이터 분석등을 다룬다. 그리고 챕터별로 각각의 주제에 맞게 흥미로운 데이터 셋을 가지고 공부를 할 수 있다. 아래는 국가별 음주 데이터를 가지고 분석을 하고 있다.

그리고 내가 가장 관심있게 봤던 부분은 바로 아래 챕터부분이다. 요즘 가장 핫한 "비트코인" 에 대한 시세 예측이다. 챕터를 보자마자 공부할의욕이 확실히 생기게 되었다. 

파이썬을 배우면서 데이터 영역을 공부하는것은 내가 몇번 해봤는데 쉬운 일은 아니었다. 파이썬도 알아야 하고 데이터에 대한 지식도 있어야 한다. 무엇을 분석할 것이며, 어떻게 데이터를 마련해야 할지 조차도 모를 수 있다. 그런데 이 책에서는 다양한 데이터 셋을 가지고 공부를 할 수 있어서 무엇보다 접근이 손쉬워진다. 또 저자분이 동영상 강의 까지 제공해주고 있기 때문에 스스로 공부하는데 큰 도움이 된다. 

천천히 강의를 듣고 책으로 복습을 한다면 책을 다 볼때 즈음에는 충분히 혼자서도 데이터를 분석 해볼 수 있지 않을가라는 생각이 된다. 단, 파이썬 기본에 대한 내용은 포함되어있지 않으니 그 부분은 스스로 학습 해야 한다.

 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


 

             Author: 윤기태 지음

             출판사: 한빛미디어

             Score /5: ⭐️⭐️⭐️⭐️⭐️

 

인공지능, 머신러닝... 개발자로서 마음 한켠에 일종의 부채감(?)으로 남겨두고 있던 영역이었다.

'요즘 인공지능이 대세라는데 나도 얼른 배워야 하는거 아닐까?'

그래서 강의를 신청해서 들었으나 생각 보다 높은 수학적 영역으로 인해 좌절한게 한두번이 아니다.

다시 방통대 입학을 고민했을 정도니 말을 다한 셈이다.

 

그래서 가볍게 접근하고 싶은데 일종의 스토리보드를 가지고 나를 친절히 데이터 분석 및 인공지능의 세계로 인도해 줄 것이 필요했는데 마침 해당 책을 볼 기회가 생겼다.

처음에는 별로 기대하지는 않았다. 

'보나마나 수식의 향연(?)이 펼쳐져 있겠지'라고 생각했는데 그렇지 않았다!

저자도 비전공자로 스스로 맨땅에 헤딩하면서 데이터 엔지니어로 성장한 것에 영향을 받았는지 최대한 친절하게 설명하려고 애쓴것이 눈에 보이는 책이다.

 

개인적으로 좋았던 점은...

먼저 자기가 설명하고자 하는 이유를 설명하고 한 단계씩 차근차근 진행해 나간다.

다만, 어느정도 파이썬에 대한 지식이 필요한데 나같은 경우는 Pandas 라이브러리에 대한 부분을 잘 모르고 있어서 진도를 나가는데 생각보다 어려운 부분이 있었다.

하지만 시간이 오래 걸릴뿐 API Doc을 보다보면 진행할 수 있다.

 

그리고 책의 재질이 컬러이므로 눈이 한결 편하다.

 

편하게 결과를 확인할 수 있다.

 

 

편하게 결과를 확인할 수 있고, 필자는 소스코드 및 유투브 강좌를 제공한다.

나는 아직 유투브 강좌는 듣지 않았는데 한번 더 책을 훑어보고 강좌와 같이 볼 예정이다.

 

그럼 누가 이 책을 봐야하는걸까?

데이터 분석 & 인공지능에 관심있는 개발자: 충분히 기초를 이끌어 주고 흥미를 가져갈 수 있는 책이다.

실무자: 중간에 어떤 문제가 발생하고 어떤 흐름으로 분석을 할 지 적당한 인사이트를 던져준다.

 

이전 리뷰에서도 쓰지만 개인적으로 좋아하는 말이 있다.

'독서백편 의자현'

책 내용이 이해되지 않더라도 여러번 보다보면 어느순간 이해가 된다 라는 의미이다.

이책은 친절하기도 하거니와 여러번 읽다보면 필자가 설명하고자 하는 의미를 충분히 이해할 수 있다.

매우 강추 한다. 여러분들도 이 책을 통해서 나와 같이 데이터 분석의 재미에 빠지시길 바란다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

<이것이 데이터 분석이다 with 파이썬>을 통해서 상황에 맞는 데이터 분석을 파이썬을 통해 실습하는 시간을 가졌다.

아무래도 파이썬도 프로그래밍 언어이다 보니 데이터 분석 외에도 다양한 분야에서 쓰이고 많은 기능이 있을 텐데,

데이터 분석이라는 분야에 특화된 이 책을 통해서 이러한 방식으로 파이썬을 데이터 분석에 적용시켜 볼 수 있구나라는 것을 다시 한번 깨달았다.

특히 학부 강의에서 실습했었던 Twitter API를 사용하는 예제와 미래 데이터 예측을 위한 시계열 분석 예제를 실습할 때 너무 반가웠다.

최근에는 파이썬을 데이터 크롤링이나 전처리 위주로 사용했어서 초반에는 통계 분석이 어색하게 느껴지기도 했었는데

금세 손에 붙어서 오버 조금 보태서 날아다녔다.

오래간만에 정말 정말 즐거운 실습시간을 보냈다.

그리고 최근에 한국 야구 개막 이후로 눈에 불을 켜고 보느라 사서 스트레스 받고 있는 중인데ㅋㅋ

야구 선수 연봉 예측과 같은 야구 관련 예제가 나오니까 전에 봤던 드라마 <스토브리그>가 생각나기도 하고

스트레스 받는다 해도 관심 분야이다 보니 또 초롱초롱하게 실습했다.

확실히 데이터 분석이라는 분야에 적당한 파이썬 기능들을 담아 둔 책이라서 그런지

마치 고향에 돌아온 듯한 편안함과(ㅋㅋㅋ) 정~말 오래간만에 신나서 실습했다.

크롤링이나 데이터 전처리도 물론 재미있긴 하지만 어느 정도하다 보면

사람에 따라서 방법이 고착화되기도 하고 개인적으로는 반복적인 작업이 많다고 느껴서 지루하기도 했다.

근데 확실히 주어진 상황에 따라 데이터 분석을 하다 보니

이 상황에는 이런 방법을, 저 상황에는 저런 방법을 적용하는구나 깨닫고 고민하고 직접 실행해보는 재미는..

역시 데이터 분석이 짱이다.

갑자기 잠들어 있던 데이터 분석을 향한 세포들이 깨어난 느낌과 동시에

책을 따라서 실습을 완료하고 나니 더 해보고 싶다는 마음이 들기도 했다.

약간 놀이공원 자유이용권으로 탑티어 놀이기구 최소 다섯 번씩 타고 온 기분이랄까?!

나처럼 데이터 분석에 대한 흥미를 일상에 치여 잊고 있던 사람들에게 강력 추천한다!

이것이 데이터 분석이다.

IMG_0004.jpg

 

 

딥러닝이나 머신러닝에 있어서 데이터는 상당히 중요합니다.

 

데이터가 적어서 결과가 제대로 도출되지 못하기도 하며, 훈련시 사용한 데이터의 편향으로 인해

실제 결과가 제대로 나오지 않기도 합니다.

그런 측면에서 사전 데이터 분석은 상당히 중요합니다.

 

이 책은 데이터 분석을 처음 시작하는 분들에게는 상당히 좋은 입문서라 생각합니다.

저자가 처음에 밝혔듯이 데이터 분석의 어떤 이론적인 측면보다 실제 흐름을 배울 수 있도록 해줍니다.

 

이 책의 구성은 처음에는 환경을 구축하는 방법에 대해 설명을 합니다. 

챕터 1에서는 "데이터에서 인사이트 발견하기"라는 제목처럼 데이터 속성을 탐색하고 시각화를 하면서

분석하는 방법을 주문데이터를 통해 학습할 수 있도록 설명을 하고 있습니다.

 

챕터 2에서는 데이터 마이닝에 대해 설명을 하면서 크롤링 하는 방법에 대해 간략히 소개를 하며

연관 키워드 분석 방법과 그것을 시각화하는 방법에 대해 설명을 합니다.

 

IMG_0002.jpg

 

챕터 3에서는 미래를 예측한다는 주제로 딥러닝을 처음 공부할 때 다루는 시계열 분석 방법에 대해

설명을 하고 있습니다. 

 

그리고 챕터 4에서는 분류 모델에 대해 설명을 하며 챕터 5에서는 '중고나라 휴대폰 가격 예측'과

'구매 데이터를 통한 상품 추천'이란 예제를 통해 데이터 분석을 마무리 하고 있습니다.

 

각 챕터 맨 앞 장에는 학습 목표를 제시함으로써 그 챕터에서 다르고자 하는 주제에 대해 집중할 수 있도록

도와주고 있습니다.

 

IMG_0003.jpg

 

저는 이 책을 읽으면서 좋았던 부분은 우선 편집이 잘되어 있어서 너무 읽기 편했습니다.

그리고 저자의 문체가 술술 읽혀질 수 있도록 자연스러웠다는 점도 좋았습니다.

 

그리고 매 장마다 흥미로는 에제로 학습에 재미를 한층 더 해줬다는 점도 좋았습니다. 

 

개정판에서는 이미지나 오디오와 같은 멀티미디어 데이터의 분석도 기대해 봅니다.

 

  "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

‘파이썬, 데이터 분석에 활용하다’

_

오랫동안 제 북스타그램을 보는 분들이라면 정말 자주 쓰는 말 중에 하나가 ‘무지는 두려움에서 비롯된다’라는 것을 잘 아실겁니다 이것은 모든 분야에서 통하는 말이라고 생각하며, 일, 투자, 학습을 넘어 인생 전반을 관통하는 명제라고 생각합니다. 그리고 제가 가장 싫어하는 말 중에 하나는 ‘문돌이라서 문송해서’라는 말인데요. 예를 들어 통계분석이나, 수학이 필요한 시점이 올 때 무슨 만능키처럼 쓰더군요. 근데 본인의 능력이 부족하거나 전문지식이 없는거랑, 자신이 배우고 싶거나 실제 업무를 하는데 써야하는데 이런 말을 하는 것은 결국 도피, 혹은 핑계밖에 되지 않지요. 덕분에 데이터 분석에 대해 공부하고 있는 저 역시 ‘문송합니다’라는 말을 극혐하기 때문에 늘 새로운 것을 도전중이고 그중에 하나가 데이터 분석입니다. 

 

최근 구글 애널리틱스로 조금씩 공부하다가 만난 <이것이 데이터 분석이다>는 파이썬을 활용해서 정말 실용적인 데이터 분석을 할 수 있는 교재입니다. 누누히 얘기해왔듯이 실용서의 경우 기존 단행본처럼 모든 내용을 실습하고 따라하지는 않습니다. 그럴 시간도 부족하고 그게 도서리뷰를 하는데 있어 올바른 방식은 아니라고 생각하기 때문이죠. 그래서 본서 역시 초반 설명과 텍스트 마이닐 첫걸음만 보고 바로 필요한 데이터 분석을 하기 위한 실전 예제로 돌입했습니다. 

그 중에서도 굉장히 흥미로웠던 부분이 2개의 섹터입니다. 하나는 데이터 분석 종합예제에서 보는 ‘중고나라 휴대폰 거래가겨’ 측정하기인데요. 중고나라에 가면 중고 폰 구입/판매시에 이제는 너무 많은 광고가 있어 검색 자체가 어려운데 여기서 예기하는 피처 엔지니어링 모델로 예측 모델을 만들어보면 대략적인 가격 추세를 알 수 있어서 저도 번개장터 등에 활용할 수 있겠더라구요. 그리고 두번째는 네이버 플레이스 리뷰 크롤링입니다. 맛집 식별을 위한 리뷰 키워드 분석으로 리뷰의 긍정/부정 리뷰를 분류하여 데이터 분석을 하면 단순히 별점을 넘어 해당 맛집의 선호도를 보다 정밀하게 검색할 수 있다는 생각이 들었습니다. 

 

파이썬은 이제 개발자나 공학도를 넘어 점차적으로 일반인(?)들에게도 확대되고 있는데요. 앞으로는 누구나 네이버나 카카오 플랫폼에 접속하는 것처럼 파이썬이나 구글 애널리틱스를 통해 데이터 분석을 하는게 기본적인 능력으로 공고화 될 시대가 올 가능성이 높다고 생각합니다. 만일 그 시작이 어렵다면 자신이 평소에 가지고 있는 궁금증을 데이터 분석을 어떻게 풀수 있을지를 고민하고 그것을 본서를 활용한다면 진정한 데이터 분석의 시작이 될 것입니다.

 

‘제대로 배우는 실용서라는 홍보글 인정합니다’

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

최근에 핸드폰을 바꿨는데 새로운 UI와 기능들은 따로 배우지 않았다. 쓰다 보면 저절로 알게 될 거라 믿었기 때문이다. 하지만 몇 주가 지나고 나서도 전혀 지식의 진전은 없고 그대로였다. 그래서 사용법에 관한 동영상 몇 가지를 봤더니 신세계다!~ 역시 사람은 제대로 배워야 할 때 제대로 배워야 한다는 걸 배웠다.

최근 데이터 분석에 관한 공부도 그렇다. 다른 기반 지식은 있으니 데이터 분석은 그때 그때 필요한 거 찾아서 배우다 보면 저절로 실력이 쌓이겠지라는 안이한 생각을 했다. 그러한 부분들이 핸드폰의 예와 같이 입문 과정에서 겪는 어려움들을 고스란히 반복하는걸 왜 몰랐던 걸까?

데이터 분석이라는 분야에 대한 첫 발걸음이 제대로 나아가는데 도움이 되는 책이라 생각된다. 내가 데이터 분석이라는 분야에 대한 해박한 지식이 없기 때문에 이 책의 깊이는 모르겠으나 일단 내가 이것이~ 시리즈의 책을 읽을 때의 그 느낌은 그대로 가져왔다. 입문자를 위한 난이도의 알기 쉬운 스텝별 설명이 장점.

처음부터 너무 어려운 용어들이나 빡빡한 구성이 아니라서 나 같은 입문자에게 시작할 수 있는 용기를 주는 점이 좋군.... ~ 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

20210416_224918.jpg

 

이것이데이타분석이다.jpg

 

< 이것이 데이터 분석이다 > | 윤기태 지음 | 한빛미디어

 

모름지기 현재는 데이타의 시대라고 표현해도 과언은 아닌 것 같다. 수많은 데이타가 나도 모르게 어딘가에 쌓여 나가고 있고 누군가가 데이타를 분석해서 각자에 많는 자료를 만들거나 통계 자료로 활용하고 있다. 그렇다면 우리도 간단하게나마 데이타를 분석해 볼 수 있지 않을까?

데이타 분석을 위해 사용하는 도구 중 개발자에게는 python만한 것은 없는 것 같다. 다양한 패키지가 제공되는 장점이 있고, 복잡한 코드 개발없이 손쉽게 데이타 를 분석하고 결과를 빠르게 확인 가능한 측면도 있다.

이 책은 이런 측면에서 상당히 유용한 정보를 제공해 준다. 입문자 입장에서 이론이나 스킬이 아닌 문제에 올바르게 접근하는 사고를 제시하기 위해 단계적으로 데이타 분석에 접근하는 방법을 다루고 있다. python을 이용한 예제를 가지고 설명하기 때문에 프로그래밍에 대한 개념이 없는 경우 또는 이미 데이타 분석에 사용되는 수학적, 통계적 개념을 잘 이해하는 사람에게는 적합하지 않을 수 있다. 하지만 대다수 데이타 분석에 관심정도만 있는 개발자라면 책의 내용을 따라 테스트해보고 직접 변형해서 원하는 데이타를 분석하기에 충분하다고 생각한다.

github을 통해 책에서 설명하는 예제를 모두 다운받을 수 있다. 그리고 python 개발 환경을 구성하는 단계부터 시작하기 때문에 python에 익숙하지 않은 개발자로 쉽게 따라 할 수 있는 것 같다.

책에서 설명하는 데이타 분석은 다양한 데이타 분석 흐름과 개념에 대해 단계적으로 설명하고 있다. 데이타 인사이트 발견에서는 탐색적 데이타 분석부분으로 판다스, 넘파이, Matplotlib을 활용한 분석 사례를 설명하고 다양한 시각화 방법으로 인사이트를 발견할 수 있도록 한다. 텍스트 마이닝 첫걸음에서는 웹크롤링으로 데이타를 수집하는 것과 키워드 추출 및 키워드 간 연관관계 분석 방법에 대해 설명하고 있다.

미래를 예측하는 데이타 분석에서는 지도학습과 비지도 학습의 개념을 이해하고 회귀 분석으로 예측을 수행하고 시계열 데이타의 트랜드를 예측하는 방법에 대해 보여주고 있다. 이 이외에도 몇몇 추가적인 분석 방법을 설명하고 있는데 초보자도 쉽게 이해할 수 있도록 상세히 설명하고 있다.

책에서 설명하는 소스와 데이타 셋까지 다운받아 테스트할 수 있기 때문에 개념적인 이해와 실제 분석되는 결과를 볼 수 있어서 이해가 훨씬 잘 되는 것 같다. 또한 조금 경험이 쌓인다면 다양한 관점으로 데이타를 분석해서 원하는 결과를 도출해 볼 수 있을 것 같다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

이 책은 파이썬 문법은 알지만 데이터 분석은 처음인 사람은 단방에 중급까지 올려준다. (차근차근 하나씩 따라하기만 한다면...) 그렇다고 파이썬 문법부터 공부할 필요는 없다고 생각한다 문법을 몰라도 그냥 따라 해 보자.

이 책에서 가장 강조하는 부분은 "데이터 분석의 이론보다는 ‘흐름’을 담았다."이다. 데이터분석을 하다 보면 의외로 비슷한 패턴으로 데이터를 분석하는 경우가 많다. 일단 ‘비트코인 시세 예측’, ‘우리나라는 술을 얼마나 독하게 마실까’ 등 흥미로운 예제를 기반으로 데이터 분석을 해 보고 나의 문제에도 적용해 보면 좋을 듯하다. 

이외에도 데이터에서 인사이트 발견하기, 텍스트 마이닝, 웹크롤링, 예측, 분류, 추천 등의 예제가 있어 다양한 분석을 맛보기 좋았다.

1.인트로 - 

최근에 AI 분야가 주목을 받으면서 한가지 분야가 같이 뜨기 시작했다. 바로 "데이터 분석" 왜냐하면 AI를 학습시키려고 하면 데이터가 필요한데, 어떻게 유의미한 데이터를 뽑아내고, 분류할 수 있는지가 중요하다. 그렇기에 데이터 분석이 중요하고 간단하게 Python으로 할 수 있어서 필자도 책을 받을 기회가 있어서 읽게 되었다.


2.메인 내용 - 

전체적인 내용은, 간단한 파이썬 및 프로그램 소개, 데이터 분석이란, 데이터 분석의 종류 및 활용으로 나뉘면서 실습 위주로 진행된다. 실습위주인 만큼, 이론은 별로 없고 직접 해보면서 이해하는 내용이 많다.

목차


3.나의 생각 - 

솔직히 요즘은 인터넷 강의가 너무 좋아서 코딩도 책으로 직접사서 보기보다는 인터넷 강의를 듣는 것을 선호한다. 하지만 한빛미디어의 대부분의 책은 책을 사면 인터넷 강의가 무조건 함께 있다는것이 장점인듯하다. 그래서 책은 부가적으로 활용하고, 인터넷 강의 위주로 듣는다. 그리고 인터넷강의로 들으면, 다음에 써보고 싶은 부분들, 기억해두면 좋을 것같은 부분들이 있는데 그럴 때 책을 활용해서 책을 접어두거나 하는 방식으로 활용하는데 정말 유용하게 쓰는 것 같다.


4.마무리 - 

이번 내용도 정말 마음에 들었다. 데이터 분석은 생각보다 쉽게 따라할 수 있고, 활용하려면 일상에서도 많이 활용할 수 있다. 나도 기본지식만 알고 조각조각 지식만 알고 있었는데 듣기 편한 인터넷 강의도 활용하고 쉽게 들었던 것 같다. 언제나 입문용 공부는 한빛미디어 "이것이 ~ 시리즈가 좋은 것 같다"


  


"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.
먼저 이렇게 생긴 책이다.
이전까지는 리뷰 도서 신청할때 원하는 책의 정보를 조금 찾아보고 신청 했었는데
이번엔 일이 바빠서 그러지 못하고 제목만 보고 신청을 했다.
그게 실수라면 실수일까....
 
먼저 프로그래밍 초보자를 위한 책은 아니다.
파이썬에 대한 설명은 없다고 봐야 한다.
 
그렇다고 고급 사용자를 위한 책이라 보기도 조금 힘들거 같다.
사실 떡하니 초급자 책이라고 사이트에 표시가....
난 제목만 보고 중급자 이상일줄....ㅠㅠ
 
간단히 요약 하면 판다스나 넘파이, matplotlib 등을 활용하여
데이터를 시각화 하고 분석하는데 도움을 줄 수 있도록 하는 수준 까지라고 보면 된다.
 
웹 크롤링등 데이터 수집을 위해서 사용하는 몇가지 기술들도 공부하는 입장에서는 도움이 될거 같다.
 
조금 아쉬운점은 데이터베이스와 연동하여 대량의 데이터를 가지고 와서 분석 하거나
대량의 데이터에 대한 분석이나 시각화에 대한것도 좀더 다루었으면 어떨까 하는 점이다.
 
그래서 초급(초보자가 아니다!)이나 초중급 정도에서 보면 꽤 유용하고 도움이 될 책이란 결론을 내려본다.
 
파이썬을 어느정도 알고 있다면 쉽게 따라 하면서 활용할수 있는 내용들을 잘 정리해두었다.
특히 데이터 시각화나 분석에서 많이 사용하는 대표적인 라이브러리 세가지에 대해서 다루고 있어서 데이터 분석 관련 입문자 들에게는 좋은 참고 도서가 될거라 생각 한다.
 
다음번에 리뷰 도서 선택할땐 좀더 사전 정보를 찾아보고 선택해야 할거 같다.
리뷰 할때 하더라도 나에게 도움이 될 수 있는 책을 하면 좋으니...
그런 의미에서 지난번 진지한 파이썬은 꽤 좋은것 같다.
 
 

데이터 분석이 가장 요즘 뜨거운 Topic이 아닌가. 

 

데이터 사이언티스, 데이터 분석, 데이터 인사이트, 데이터 경제 등등 다양한 포장을 쓰고 있다. 

 

이 분야에 공부를 시작할 때 가장 두번째  만나기에 좋은 책을 소개한다. 

 

두번째라고 표현한 이유는 '기초', 베이직 서적으로는 제격이 아니였다. 

 

흔히들 프로그래밍 언어 도서를 시작할때는, 'Hello World'를 Output 하기위한 설치과정, 실행과정을 

 

친절하게 설명하지만, 이 책은 그렇지 않다. 

 

개념설명보다는 충실히 데이터 분석 절차와 인사이트를 얻는데 충실하다보니...

 

최소한 다른 언어를 개발을 해본 사람이나, 개념설명보다는 바로 결과를 확인해보고싶은 분에게 좋을 거같다.

 

실제로 도서에는 깃허브를 통해서 소스를 제공하고, 저자의 강의를 무료로 동영상으로 볼수있기때문에

 

이 한권으로 데이터 분석의 개념과 단계를 이해할 수 있는 두번째 기본서로 활용하면 좋을거같다. 

 

다만, 프로그램을 처음 해보는 사람에게는 실행과정의 내용을 좀더 풍성하게 담았다면, 더할 나위 없이 좋은 기본서였을거같다는 아쉬움이 있다.  

 

- 추천대상 : 데이터분석 초보자

- 기초지식필요 : 프로그램 실행 경험

- 난이도 : 초급자(다만, 프로그래밍 기본이 필요함 - 프로그램 실행할 수 있는 수준) 

- 이동성 : 두께와 사이즈가 있어 이동성은 어려움(360p) 

 

예전부터 빅데이터, 데이터 마이닝, 머신 러닝 등에 대해 공부하고 싶었지만 쉽지가 않았다. 관련 책들을 보기도 했지만 난해한 수식과 용어들로 인해 내용이 잘 이해가 되지 않았다. 그러던중 우연한 기회에 한빛미디어 서평 이벤트를 통해 이 책을 접하게 되었다.

 

이 책은 기본적으로 파이썬에 대한 사전 지식을 가지고 있는 데이터 분석 입문자를 대상으로 하고 있다. 개인적으로 회사에서 파이썬을 사용하고 있는 관계로 책의 내용을 따라 하는데 큰 무리는 없었다. 특히 이 책은 구체적인 이론이나 난해한 개념 설명보다는 "데이터 분석이란 이런 과정으로 진행된다"는 큰 흐름을 보여주고 있기에 전반적인 내용을 이해하는데 많은 도움이 되었다. 특히 일상 생활에서 흔히 접할 수 있는 데이터(영화 평점, 야구 선수 연봉, 비트코인 가격 등)들을 입력해서 분석하고 그 결과를 토대로 미래의 결과를 예상하는 과정을 보여주기 때문에 비슷한 성격의 데이터만 수집할 수 있다면 바로 실무에 적용 가능하겠다는 생각이 들었다.

 

책의 구조에 대해 알아보자면 각 장의 시작마다 핵심 개념을 간략히 잘 정리하고 있어서 독자가 이번 장에서는 무엇을 배우는데 집중해야 하는지를 미리 알 수 있다. 각 분석 예제의 마지막에는 "표로 정리하는 데이터 분석" 항목을 통해 데이터 분석의 핵심 내용과 결과를 한눈에 파악할 수 있다.

 

데이터 분석은 다음의 단계로 이루어진다.

1. 데이터 수집하기

2. 데이터를 분석하기 좋은 형식으로 가공하기 (데이터 전처리)

3. 수집된 데이터를 데이터 분석 라이브러리로 읽어 들이기

4. 데이터 분석하기

5. 분석된 결과 사용하기: 유의미한 결과 추출하기, 미래 예측

 

이 책의 특징은 다음으로 요약할 수 있겠다.

* 데이터 분석을 처음 시작하는 사람들을 위한 입문서 (단 파이썬에 대한 사전 지식 필요)

* 친숙한 예제를 통해 데이터 분석 과정을 쉽게 따라해볼 수 있다.

* 배경 지식이 없어도 데이터만 가지고 있다면 데이터 분석을 쉽게 적용해볼 수 있다.

* 데이터 분석에 대한 용어나 알고리듬에 대한 상세한 설명은 없으므로 깊이 있는 내용을 원하는 독자들은 책에 언급된 용어를 바탕으로 추가적인 학습이 필요하다.

 

 

저자는 원래 데이터 분석을 지망하는 사람이 아니라, 디자이너를 지망하던 사람이었다.

우연히 인턴쉽 과정에서 웹 개발 업무를 통해 파이썬을 익혔고 요즘 유행하는 데이터 분석 라이브러리를 접하면서 데이터 분석에 입문하게 되었다.

 

그 만큼 데이터 분석에 입문하며 우여곡절을 많이 겪으며 이런 내용이 들어있다면 참 알기 쉬었을 텐데 라는 의문을 종종 갖곤 했다고 한다. 이 책은 그런 저자의 의문점들이 심사숙고되어 쉽게 풀이되어 나온 책이라고 볼 수 있다. 이 책을 통해 우리는 더이상 맨땅에 헤딩하듯 입문하지 않아도 된다는 얘기이다.

 

특히 이런 사람들에게 이 책을 추천한다.

- 프로그래밍 유 경험자

- 데이터 분석에 초보자

- 단순히 따라하는 것이 아닌 분석의 흐름을 공부하고 싶은 자

- 실생활 예제를 다루고 싶은 자

 

이 책에 등장하는 예제는 모두 깃허브(Github)를 통해 공유 저장소에 올려져있어서 언제든

직접 실행 가능하다.

 

 

데이터 분석 용어의 하나하나, 파이썬 함수 또는 라이브러리 함수의 하나하나를 모두 설명하며

진행하고 있기 때문에 책을 읽으며 별다른 의문거리를 갖을 거리가 없다고 해도 과언이 아니다.

 

직접 인터넷에서 웹크롤링을 함께 진행하고 그 데이터들을 통해 학습을 진행하기 떄문에,

앞으로도 필요한 데이터 분석 주제가 있다면 직접 웹크롤링을 하여 얼마든지 분석을 하기에

용이하다.

 

수식없이 실생활과 밀접한 데이터를와 직관적인 설명으로 데이터 분석을 배우고 싶은 분들이

읽으면 꼭 도움이 되리라 생각한다.

 

데이터분석과 파이썬 이것을 일거양득이라고 한다.

 

한빛미디어 사이트의 장점은 바로 미리보기, 미리 맛보기라는 것이다.

책을 구매하기 전에 어느정도 책과 동일한 느낌의 서비스로 이 책을 사게되는 구매력을 확보하게 됨이다.

미리보기를 나름 엮어본다.

1.gif

http://m.hanbit.co.kr/store/books/book_view.html?p_code=B2717499992

 

 

22.jpg

모바일 페이지

23.jpg

실제 한빛미디어 미리보기의 구성

한빛미디어 미리보기가 여느 출판사 정보보다 정교하고, 깔끔하다. 진정한 전자책, 웹북 느낌이라는 것이다.

일단 도서마다 웹에서 확인이 가능하다는 것이다.

책 넘김의 느낌이 있다.

http://preview2.hanbit.co.kr/books/jnkh/

책넘기

 

24.jpg

지은이의 글

25.jpg

 

26.jpg

일러두기

27.jpg

이런 사람이 보면 좋습니다.

 

28.jpg

나름 책의 구성이 탄탄하다. 구성하나가 책의 진도를 빼는데는 가장 큰 도움이라는 것이다.

어릴적 전과라는 것이 있었다. 자율학습모드를 지원하는 구성이다.

29.jpg

 

30.jpg

요새는 대세가 유튜브 강의라는 것이다.

31.jpg

목차

32.jpg

 

33.jpg

 

34.jpg

 

35.jpg

 

36.jpg

인사이트

37.jpg

실제 책의 내용

38.jpg

 

39.jpg

 

40.jpg

 

41.jpg

 

42.jpg

 

43.jpg

 

44.jpg

 

45.jpg

46.jpg

 

실제 책으로 만나보는 데이터 분석

51.jpg

이론보다 흐름 자가학습, 자율학습이 포인트이다.

52.jpg

 

53.jpg

 

54.jpg

 

55.jpg

재미나는 주제

중고나라 휴대폰 거래가격 예측하기

56.jpg

STEP-1 탐색적 분석 : 중고나라 데이터 분석하기

57.jpg

 

58.jpg

STEP2 피처 엔지니어링 : 예측 모델 개선하기

59.jpg

STEP3 예측 : 중고 휴대폰 거래가 예측하기

60.jpg

STEP4 프로토타입

61.jpg

 

또다른 재미나는 아이템

62.jpg

63.jpg

 

데이터분석 기반의 책이기에 여러모로 도움이 된다. 게다가 언어는 파이썬이다.

요새 가장 많이 사용하는 파이썬에 데이터 분석까지 언급되어 있고, 책 구성도 도움이 되는 책이다.

600IMG_6092.png

 

빅데이터는 이제 누구나 아는 단어가 되었다. 그만큼 눈부신 빅데이터의 다양한 활용과 기술적 발전으로 인해, 더욱 포괄적인 개념인 데이터 과학이 주목을 받게 되었다. 데이터 과학은 데이터를 분석하기 위해, 프로그래밍 기술, 수학, 통계학, 패턴인식, 기계학습, 데이터베이스 등의 여러 분야를 융합하여 이용하는 과학이다.

 

사실 데이터 과학이라 부르다 보니, 좀 생소할 뿐이지, 영역을 좁고 쉽게 생각해 보면, 그냥 과거부터 해왔던 인구 통계 조사나 제품 마케팅 분석, 소비자 패턴 분석과 같은 데이터 분석을 떠올리면 된다. 다만 이제는 좀 더 세련된 각종 기술을 사용한다는 차이가 있다.

 

그런데 데이터 과학이 왜 최근 들어 인기를 끌고 있는가 하면, 데이터 과학이 적용되는 분야가 의학, 공학, 일반 과학뿐만 아니라, 사회학, 도시공학, 경제학 등 각종 인문과학에도 쓰이고 있으며, 많은 기업들이 데이터 과학의 기술을 적용하고 있기 때문이다. 그만큼 수요가 계속 늘고 있는 분야인 것이다.

 

하지만 데이터 과학은 앞에서 말했듯이 복합적 기술을 필요로 하기에 익히기가 어렵다. 게다가 이론을 어느 정도 습득했다고 해서, 다 되는 게 아니다. 분석하고 적용하는 실무 능력도 필요하다. 그러나 이런 실무 능력은 쉽게 길러지지 않는다. 특히 그것을 기를 참고할 책들이 그리 많지 않다.

 

 

600IMG_6096.png

 

다행스럽게 이번에 본 '이것이 데이터 분석이다 with 파이썬'는 바로 그런 데이터 분석 실무를 익히는데 도움이 되는 책이었다. 처음엔 그냥 빅데이터 분석이나, 그래프 그리고, 평균이나 구하고, 키워드 시각화 방법 정도 배우는 주로 응용 스킬을 다루는 책으로 생각했는데, 보다 보니, 그보다는 데이터 분석 응용이라는 근육을 트레이닝으로 키워주는 책이었다.

 

 

600IMG_6098.png

 

각 주제들은 대략 3, 4단계로 나눠 생각한다. 우선 주어진 데이터를 들여다보면서, 데이터 가공을 어떻게 할 거며, 그것을 어떻게 프로그래밍할지, 생각해보고, 다음 단계로 분석 방법, 시각화 방법을 정한다. 그리고 이어진 단계에서 라이브러리 활용이나 수학 기법 개선을 해보기도 하고, 더욱 다양한 결과 도출과 시각화를 해본다. 최종적으로는 만들어진 모델을 검증 또는 평가도 해본다. 여기에 중간에 나오는 퀴즈와 챕터 끝에 나오는 연습문제를 통해 배운 것을 점검하고 다시 응용도 해보게 된다.

 

점진적 단계별로 배워 나가는 구성과 함께 마음에 드는 점은 분석 주제들이다. 멕시코풍 프랜차이즈 요리 분석은 실제 음식점 메뉴나 가격 책정 같은 데 도움이 될 수 있는 주제다. 국가별 음주 데이터 분석은 주제만 바꾸면 얼마든지 다양한 국가 비교 주제가 될 수 있다. 프로야구 선수의 다음 해 연봉 예측이나 비트코인 시세 예측은 증권 분석 또는 제품 판매 예측 등에도 쓸 수 있을 것이다. 이와 같이 이 책에는 현실적이고 재미난 분석들이 많다. 실전 내공을 높이는데 도움 되는 주제들이라, 배운 거 얻다 써먹지 고민할 필요 없는 책이다. 

 

 

600IMG_6094.png

 

'이것이 데이터 분석이다 with 파이썬'에서는 파이썬이란 프로그래밍 언어를 이용하고, 판다스, 넘파이, Matplotlib를 활용한다. 기본 설치 방법은 챕터 0에서 알려주고 있긴 하지만, 파이썬 언어 자체를 책에서 가르쳐 주고 있지 않으므로 이 책을 이해하기 위해서는 최소 파이썬을 다룰 줄 알아야 한다. 부제로 '파이썬으로 배우는 데이터 분석 입문'이라고 되어 있지만, 어디까지나 데이터 분석 입문이지, 파이썬 입문 책은 아니라는 것이다. 아울러 책에서 중간중간 설명도 되어 있고, 분량 면에서 많이 다루지는 않지만, 그래프와 통계학에 대한 이해가 있으면 더욱 좋다. 물론 본문에 수식이 나오거나 계산하고 그런 것은 없으므로 부담 가질 필요는 없다. 어디까지나 도움이 된다는 정도다.

 

어쨌든 입문 책이라지만, 난이도가 어느 정도 있는 책이다. 여러 번 읽어가며, 직접 코딩하며 테스트하는 것이 가장 빠른 지름길이라 생각한다. 그리고 한빛미디어 유튜브를 통해 저자의 직강도 볼 수 있으므로, 그것을 함께 참고하며 공부하면 도움이 될 것이다.

 

분석의 기술적 방법은 일종의 기교로 얼마든지 익힐 수 있지만, 정답을 도출해 내는 데이터 분석은 절대 쉽게 할 수 있는 일이 아니다. 잘못된 데이터 분석은 기업에는 치명적인 손해를 끼칠 수 있고, 연구를 신뢰하지 못하게 만들 수 있다. 그런 오류를 줄여 나가는 방법은 역시 경험 밖에 없다고 생각한다. 

'이것이 데이터 분석이다 with 파이썬'은 그러한 경험을 쌓는데 바른 첫걸음을 내딛게 해주는 책인 것이다.

 

요즘들어서 데이터를 가지고 하는 일들이 많아졌다. 소위 "빅데이터"의 시대인만큼 어마어마하게 수집된 데이터들 사이에서 남들이 발견하지 못한 insight를 찾고자 하는 사람들도 많아지고, 수요도 늘었다. 물론 이 insight를 부여하는 것을 사람에 따라서 다르게 수행하고 있다. 어떤 사람은 데이터들 사이에서 특징을 잘 추출할 수 있도록 정리해주는 일을 할 수도 있다. 이해당사자들에게 데이터가 가진 의미를 잘 설득할 수 있도록 시각화를 하는 일도 있고, 아마 요새 가장 핫한 일이겠지만, 이런 데이터에 머신러닝이나 딥러닝 같은 인공지능을 적용해서 미래의 일을 예측하거나, 최적화된 동작을 수행하도록 개발하는 일이 있을 수 있다. 이렇게 언급한 업무들 모두 본질적으로는 탐색적 데이터 분석, 조금더 나아가면 Exploratory Data Analysis (EDA)가 필요한 업무들이다. 데이터 분석없이 특징을 찾고 정리할 수 있을까? 데이터의 본질을 이해하지 못한 상태에서 인공지능을 통해서 뭔가를 예측할 수 있을까? 개인적으로도 EDA는 데이터를 가지고 하는 일 중 가장 기초이면서도 핵심이라고 생각한다.

 그런데 기초라고 말하면서도 항상 새로운 데이터를 살펴보면, 어떤식으로 데이터를 분석해야할지 항상 고민하고 있다.그래서 요새 통계쪽이나 확률 강의를 많이 듣기도 하고, kaggle에 공개된 다양한 type의 dataset도 살펴보면서 경험을 쌓고 있다.

 

그림 1. 이것이 데이터 분석이다 with 파이썬

 

 이번에 소개할 책은 Python으로 데이터 분석하는 방법에 대해서 소개한 책이다. 아마 데이터 분석에 관심있는 사람은 서점이나 도서관에 가보면 알겠지만, 데이터 분석에 대해서 소개하고, 가르치는 책들이 정말 많다. (대충 Data Analysis로만 검색해도 500여종 정도 나오는 것 같다.) 그래서 그 책들 중에서 딱 한권을 고르자니 기준이 참 막막하다. 어떤 책은 Pandas나 Numpy, Matplotlib의 사용법에 대해서 소개하는 반면, 또다른 어떤 책은 통계나 확률 이론적으로 접근한 데이터 분석 이론을 소개한다. 어떤 책은 R로 가르치는 책도 있고, 다른책은 Visualization에 치중해서 가르치는 책도 있다.

 이 책은 철저하게 실습 위주의 책이라고 볼 수 있다. 물론 초반부에 예제 등으로 통해서 library의 사용법이나 이론을 소개하고 있지만, 책의 대부분을 실제 데이터를 활용해서 분석하고, 시각화하는데 할애하고 있다. 중간중간에 부족한 부분은 간단한 노트등을 통해서 소개하고 있다. 크게 이 책을 통해서 다루고 있는 실제 예제는 다음과 같다.

  • 국가별 음주 데이터 분석
  • 프로야구 선수의 다음해 연봉 예측
  • 비트코인 시세 예측
  • 영화 평점 예측
  • 타이타닉 생존자 특성 분석
  • 강남역 맛집 리뷰의 중요 키워드 분석
  • 중고나라 휴대폰 가격 예측

 대부분의 예제들이 실제의 공공 데이터 등을 바탕으로 실습하는 방향으로 구성되어 있어, 이런 방향으로 데이터를 다뤄보고 싶은 사람한테는 좋은 실습 교재가 될 수 있다. 특히 키워드 분석과 같이 언어처리도 같이 다뤄진 예제나, 비트코인 시세 예측과 같이 Time-series data analysis 방면으로도 공부할 수 있는 예제는 서두에서 언급했던 EDA의 전반적인 내용을 다 다룰 수 있는 것이 이 책의 장점이 아닐까 생각한다. 나같은 경우에도 현업에서 필요했던 시계열 데이터 분석 부분이나 시각화 관련 기법은 이 책에서 조금 참고해서 도움을 받았던 것 같다.

 

그림 2. 유튜브 강의 제공

 

 소소하게 장점이라고 할 수 있는 부분은 저자 직강(링크)이 제공된다는 점이다. 물론 요새는 좋은 MOOC도 많이 공개되어 있긴 하지만, 책과 관련된 내용에 대해서 직접적으로 가르치는 리소스가 있는 부분은 책을 통해서 학습하는 독자에게는 좋은 교육자료가 제공된다.

 물론 잠깐 언급했다시피, 시중에 정말로 많은 데이터 분석 관련 책들이 출판되어 있다. 물론 어떠한 학습 방향이 옳고, 어떤 책이 정말 좋다라고 단언하기는 어려운 부분이 있지만, 그래도 적어도 실습 위주로 학습하는 독자의 경우에는 이 책이 하나의 길잡이 역할을 할수 있다고 생각한다. 그리고 조금더 첨언하자면, 진짜 데이터 분석 경험을 계속 쌓는게 필요하다고 본다. 그래서 남들이 kaggle같은 곳에 만들어 놓은 EDA notebook 같은 것을 보면서 많이 배우고, 현재 데이터 분석 관련 일을 한다면 하나하나씩 적용해보는 것도 조금더 숙련된 EDA를 할 수 있지 않을까 하는 의견을 한번 가져본다.

 (참고로 조금더 고급 지식을 살펴보고 싶은 사람이라면 저자 블로그 에서도 얻는 부분이 많을것 같다.)



출처: https://talkingaboutme.tistory.com/entry/Book-DS-Data-Analysis-with-Python [자신에 대한 고찰]

 

81DA116A-D16F-438B-9A26-0CE3A69D82D5.jpeg

 

 

 

드문드문 데이터분석 공부를 하고 있었지만 확실히 머리속에 개념이 잡히지 않음을 느끼고 있었습니다. 

 

나는 리뷰어다 활동 중 요 책이 낙점되어서 데이터 분석의 플로우를 한번 경험해보자는 마음으로 가볍게 읽기 시작했는데 

사실 이 책은 눈으로 읽기보다는 코드를 따라서 돌려보면서 필자의 문제해결능력을 구경하면서 공부되는 책입니다. 

 

이 책만의 장점은 

 

데이터 분석을 하는 사람들은 다들 알고 있고 머리속에 인스톨되어 있지만 책에는 적혀있지 않은 그런 프랙티스와 생각의 흐름이 어떻게 가야하는지가 글로 풀어져 있다고 느꼈습니다. 

 

 챕터 전체가 동영상 강의로 포함되어서 이해가 안가는 부분을 직강으로 들을 수 있으며 굉장한 장점입니다. 

 

핵심은 시각화!인데 적재적소에 알맞은+다양한 시각화를 사용하고 있어서 책을 열심히 공부하면 정말 도움이 많이 될것입니다. 

 

 

간단히 흐름에 대해 소개하면 

 

 - 데이터의 특성에 대해 먼저 살펴봅니다. 

     경험적으로 이 단계를 건너뛰고 뭔가를 하려고 했을 때 다시 데이터로 돌아가야했던 적이 있었는데 너무나 당연하게 챕터의 모든 시작은 데이터를 살펴보는 일입니다. 

- 적절하게 모델링 개념을 섞어서 설명해줍니다. 

- 평가와 검증하는 방법을 소개해줍니다. 

 

 

문제를 보고 유형을 떠올리고 푸는 방법을 떠올리는 것이 어떻게 보면 정석이고 문제해결능력을 기르게 해주지만 실생활에서는 무엇이 문제인지조차 알 수 없는 경우가 다반사입니다.그런 중에 가끔은 거꾸로 유형과 푸는 방법을 공부하고 문제를 만나는 것이 도움이 될 때가 많은 것 같습니다. 

시간을 들여 단계적으로 책을 끝까지 따라가면 그런 도움을 많이 얻을 수 있을것입니다.

 

이것이 데이터 분석이다 with 파이썬 한빛미디어 웹크롤링 (1).jpg

 

이것이 데이터 분석이다 with 파이썬 ( 파이썬으로 배우는 데이터분석 입문 )

 

자바를 이용한 웹개발을 공부하다가 파이썬을 통한 웹크롤링에 관심을 가지게 되었다. 

혼공 파이썬 도서를 통해 기본을 공부하고 보게된 두번째 도서 데이터분석. 

 

한빛미디어 도서들 왠만한건 유튜브 동영상강의로 책과 함께 공부 가능하다. 

데이터분석with 파이썬 본 도서도 유튜브를 통해 공부 가능하다. 멘토가 있는것과 없는것은 큰 차이가 있다 ㅎㅎ 

 

이것이 데이터 분석이다 with 파이썬 한빛미디어 웹크롤링 (4).jpg

 

[대상독자]

파이썬 프로그래밍을 조금이라도 접해본 사람. 

데이터 분석이 처음이거나 조금이라도 경험해 본 사람. 

 

- 프로그래밍에 개념이 전혀 없거나 데이터분석에 사용되는 수학적. 통계적 개념을 깊게 이해하고 싶은 독자에게는 권장하지 않는다. 

 

 

 

이것이 데이터 분석이다 with 파이썬 한빛미디어 웹크롤링 (6).jpg

 

[목차]

개발환경/분석환경 구축 →  데이터에서 인사이트 발견하기 →  텍스트 마이닝 첫걸음 →  데이터분석 →  데이터분류모델 →  데이터 분석 종합 예제를통한마무리.

 

 

 

이것이 데이터 분석이다 with 파이썬 한빛미디어 웹크롤링 (8).jpg

 

[분석환경 구축하기]

도서의 0.1에 해당하는 개발환경 구축하기를 통해 설치가 어렵다면 영상강의에서 자세히 설명해 주기 때문에 훨씬 수월하게 따라할 수 있다. + 주피터 기본 사용법도 알려주신다. (동영상 채팅창과의 대화는 약간 당황스러웠다 ㅎㅎ)

 

3가지 라이브러리와 함께하는 데이터분석

1) Pandas -> 라이브러리를 이용하면 실행결과가 엑셀처럼 예쁘게 보인다. 

2) NumPy -> 백터.행렬연산은 쉽게 도와줌 입문자는 쓸일이 잘 없다고.. 

3) matplotlib -> 판다스. 넘파이로 데이터를 받아와 보기좋게 시각화. 

 

코드 하나를 실행하고  →  이에 대한 설명을 확인하면서 도서를 공부하는것을 추천한다. 

똑같이 실행했음에도 불구하고 오류가 나면 깃허브 예제코드를 참고하자. 

 

 

 

이것이 데이터 분석이다 with 파이썬 한빛미디어 웹크롤링 (10).jpg

 

 

본격적으로..

각 단원의 앞부분에 '학습목표'를 통해 뭘 공부할지 미리 요약해 보여준다. 

목차와 더불어 앞부분에 해당 단원에서 배우게 될 것을 미리 정리해 주니 전체적인 나무를 보고 열매를 공부하러 들어가는 느낌이라 정리가 더 잘되는것 같아 좋았다. 

 

본격적인 강의는 탐색적 데이터분석이 어떤것인지 알아보는것으로 부터 시작된다. 

(raw data) 데이터를 관찰하고, 특징을 발견하고, 데이터를 시각화 하고 원하는 데이터를 얻어내는 전체적인 개념을 이야기해준다. 

 

이것이 데이터 분석이다 with 파이썬 한빛미디어 웹크롤링 (15).jpg

 

이 책을 보고싶었던 가장 큰 이유 웹크롤링.

'나무위키 최근 변경 페이지' 텍스트 데이터를 분석 출력하는 실전예제를 통해 웹크롤링을 배울 수 있다. 

 

마지막 5단원에서는 2~4단원 에서 배운 데이터 분석 기술 응용을 통해 실생활에서 바로 쓰일 수 있는 예제를 실습해보게 함으로써, 지금까지의 공부 내용을 정리할 수 있도록 이끌어 주고 있다. 

 

파이썬 프로그래밍 입문자가 따라하기에는 문제가 없다. 탄탄한 기초공사는 매우 중요하니까 ! 

깊은 데이터 분석 보다는 실생활에서 재미를 느끼며 분석가능한 정도라 부담이 없었다. 

역시 ~이것이 시리즈는 믿고보는 최고의 입문서. 

 

 

주전공은 신문방송학이지만 우연히 관심이 생겨서 컴퓨터공학과 복수전공을 하게 되었고,

약 2년, 그러니까 4학기의 시간 동안 C, 논리회로, 자료구조, 알고리즘 등

다양한 컴공과의 전공과목을 수강했었지만(어쩌면 주전공보다 더... 열심히... 흑)

학교 내에서의 수업만으로는 뭔가 충분한 경험을 쌓지 못했다는 생각이 작년 내내 들었거든요 :(

 

그래서 휴학으로 남는 시간 동안, 평소에 관심있었지만 시간이 없어서 혹은 어려워서

다음으로 미뤄두었던 공부를 해보려 하는데, 그 중 하나가 바로 '데이터 분석' 이에요!

 

때마침 한빛미디어 [나는리뷰어다] 활동에 선정되어 처음으로 받게 된

<이것이 데이터 분석이다 - with 파이썬> 책으로 데이터 분석에 발을 들일 수 있었습니다.


 

 

책 표지를 보면,

'실생활 예제', '단계별 분석', '구조적'이라는 말이 눈에 띄네요.

이 책의 가장 큰 장점이라고 볼 수 있습니다.

 

아무래도 연습에 쓰이는 예제가 너무 동떨어진 내용이다 보면 분석 툴을 손에 익히는 건 몰라도 몰입은 덜할 텐데,

이 책의 예제들을 살펴보면

- 국가별 음주 데이터

- 비트코인 시세 예측

- 강남역 맛집 리뷰

과 같은 실생활과 밀접한, 친근한 키워드를 자주 볼 수 있어서 호기심이 가더라고요 ㅎㅅㅎ

 

(개인적으로는 '국가별 음주 데이터'가 참 궁금했습니다 ㅋㅋㅋㅋㅋ

과연 우리나라는 술을 얼마나 독하게 마실 지....?! 어느정도 예상은 가시겠지만 직접 분석을 통해 확인하는 걸 추천합니다^_^)

 

또한 데이터 분석이 처음이시거나 익숙하시지 않은 분들은 그냥 데이터가 주어지면

어떤 방향으로 분석을 진행해야 할 지 난관을 겪게 될 수도 있는데,

그럴 땐 세부적으로 나눠진 단계별 분석을 참고해서 여러 번 따라하다 보면

어느 순간 '여기서는 이걸 먼저 하고 저걸 알아봐야겠다'라고 생각할 수 있게 될 거에요!

저도 그렇게 능숙해지는 날이 오길 바라며...

 

사진 설명을 입력하세요.

 

이 책의 또 다른 장점, 바로 동영상 강의 제공이에요!

가끔씩은 책만 보고서는 이해하기 어려울 때가 종종 있는데,,,,

유튜브에 책 제목으로 검색하시면 바로 강의를 찾을 수 있으니

참고하여 함께 공부하면 시너지가 되겠죠?

 

본격적인 데이터 분석에 앞서 나오는 페이지입니다.

이 책을 추천할 수 있는 독자 유형고 그렇지 않은 유형을 말해주고 있네요.

저 같은 경우는 어렴풋이 데이터 분석에 대해서만 들어보았지

어떻게 시작해야하는지, 어떤 포인트에 중점을 둬야하는지 등등을 하나도 몰랐기 때문에

이 책이 필요한 독자 유형이었다고 보면 되겠네요.

 

 

다만, 밑부분에 있는 이런 사람이 보면 그다지 좋지 않을 수도 있습니다 항목 또한 주의깊게 볼 필요가 있어요.

책 제목에서도 알 수 있듯이 이 책의 데이터 분석 과정은 모두 파이썬 프로그래밍을 기반으로 합니다.

알고리즘, 문제 해결법....처럼 기초 이상의 프로그래밍 기법을 요구하지는 않지만,

모듈, 라이브러리, 함수 등 기본적인 파이썬 내 기능 자체를 활용하여 분석을 하기 때문에

이러한 개념에 대한 기본적인 이해가 전제되어야 원활한 학습이 가능합니다.

 

혹시 파이썬 및 프로그래밍에 대한 이해가 전혀 없거나 아직 부족하신 분들은,

점프 투 파이썬(https://wikidocs.net/book/1) 을 참고해서 기초적인 지식을 습득하거나

그때그때 구글링을 통해 필요한 부분을 검색해보면서 학습을 진행하는 것도

하나의 방법이 될 수는 있을 것 같아요.

 


지금까지 한빛미디어 출판사의 <이것이 데이터 분석이다 - with 파이썬> 도서에 대해 간단하게 살펴봤는데요,

제가 언급한 내용은 아주아주 일부분이랍니다!

실제로 여러분이 직접 코드를 치고 결과를 확인하며 익히는 과정이 있어야

진짜 여러분의 데이터 분석 실력이 되겠죠?

 

최근 IT분야, 특히 그 중에서도 '빅데이터' 가 크게 주목을 받으며

데이터 분석에 관심을 갖는 분들이 많아졌는데요,

 

친근한 예제들과 함께 흐름을 따라가며 분석 과정 자체를 손에 익히며 실력을 늘리고 싶은 입문자 분들에게는

이 <이것이 데이터 분석이다 - with 파이썬> 책이 도움이 될 것 같습니다.

흥미를 끌기에 충분한 너무나 많은 데이터가 공유되는 때에

단순해보이는 데이터들에서

진흙속 진주를 찾아내듯이

유의미한 데이터로서 변모시킬 수 있는

데이터분석은 너무나 매력적인 일인 것 같다.

 

이러한 데이터 분석을 하기 위해

너무나 잘 어울리는 책이 있어 소개해보려한다.

 

바로 "이것이 데이터 분석이다 with 파이썬" 이다.

 

 

이것이데이터분석이다.jpg

 

 

데이터 분석의 시작부터 화려한(?!) 마무리까지를

깔끔하고 쉽게 풀어낸 듯하다.

 

주제에 맞는 데이터 분석을

어떤 시각으로 어디에서 부터

어떻게 접근해야 하는지에 대해

단계별로 자세하게 안내하고 있다.

 

더불어 중간중간 보이는 용어와 개념에 대한 설명들은

적재적소에 가려운 곳을 잘 긁어주는 역할을 해준다.

 

데이터 분석은 나만 알아보고

글자로서 무언가를 보여주는 것도 가능하겠지만

역시나 모든 것은 시각화 아닌가?

 

이 책의 거의 모든 데이터 분석은

항상 시각화 처리로 끝내고 있고

시각화 처리를 어떻게 해야하는지에 대한

안내를 해주고 있어서

정말 데이터 분석의 시작부터 끝까지를 잘 이끌어주고 있다.

 

데이터 분석과 함께

약간의 파이썬까지

두마리 토끼를 잡고 싶은 분들에게 강력 추천한다.

 

요즘 전 산업분야에서 가장 많이 쓰이는 단어 중 하나가 '데이터'이다.
예전에는 전혀 가치도 의미도 없던 것들이 이제는 하나하나가 소중한 자원이 되어 버렸다.
데이터는 그대로인데 그것을 바라보는 시각이 바뀌었다.
다이아몬드도 가공하지 않으면 의미가 없는 것처럼 데이터도 그러하다.
데이터가 담고 있는 의미, 그것을 찾아내야 한다.
 
이 책 '이것이 데이터 분석이다'는 바로 데이터속에서 다이아몬드보다 귀한 것을 찾는 방법을 알려주고 있다.
 

data.jpg

 

 
데이터를 다루는 도구, 프로그래밍 언어는 많다.
미니탭, SAS와 같이 전문적인 도구도 있고, R, 파이썬과 같은 언어도 있다.
이 책은 가장 대중적인 프로그래밍 언어인 파이썬으로 설명하고 있다.
파이썬에 대한 기초지식만 있다면 누구나 쉽게 따라할 수 있는 코드를 제공하고 있다.
 
하지만 이 책의 본질은 파이썬이 아니다.
주제인 '데이터 분석'을 설명하기 위한 도구로 파이썬을 사용하고 있는 것 뿐이다.
물론 파이썬으로 데이터 분석을 공부하는 분들에게는 최고의 책이겠지만, 데이터 분석에 관심이 있는 분들에게도 좋은 책이라는 의미이다.
 
사실 데이터 분석이라고 하면 무척 막막하게 느껴진다.
책에서도 사용하는 넘파이, 판다스를 잘 다루지만 막상 데이터를 주고 분석을 요청하면 의미없는 결과를 받을때도 있다.
도구의 문제가 아니라, 분석의 문제인 것이다.
 
데이터를 통해 도출할 수 있는 유의미한 결과를 끄집어 내는 것. 그것이 데이터 분석이고, 그것을 잘 할 수 있다면 파이썬이 아니라 엑셀, 계산기도 환영이다.
그런 의미에서 이 책은 데이터 분석의 흐름을 잘 보여주고 있다.
주변에서 쉽게 접할 수 있는 데이터로 어떤 유의미한 결과를 어떻게 도출할 수 있는지를 단게별로 잘 알려주고 있다.
이론이 아닌 실무에서의 사용법을 알려주고 있고, 이해가 되지 않는다면 무료로 제공하는 동영상 강의를 참고하면 좋다.
 
데이터 분석에 대한 개념과 흥미를 갖고 싶다면 이 책이 도움이 될 것이다.
최고의 입문서인지는 모르겠지만, 나에게는 많은 도움이 되는 입문서임에는 틀림없다.

‘이것이 데이터 분석이다’는 데이터 분석 입문책인데 그 도구로 파이썬을 이용하고 있습니다.  다른 언어로도 데이터 분석이 가능하지만 요즘 가장 많이 사용하는 언어가 파이썬입니다. 이 책은 파이썬 기초를 설명하지 않기 때문에 모른다면 파이썬을 먼저 익히고 읽을 것을 권합니다. 파이썬은 프로그래밍 언어 중에서도 쉽고 입문용으로 어울리기 때문에 쉽게 배울 수 있습니다.

 

이 책은 데이터 분석을 시작하는 사람에게 어울립니다. 지루하고 어려운 데이터 분석 이론, 단순 파이썬 라이브러리 사용법을 설명하는 책이 아닙니다. 바로 데이터 분석을 따라하기 방식으로 도전해볼 수 있는데 이 과정이 어렵지 않고 흥미롭습니다. 어떻게 데이터 분석을 하는지 이 책을 통해 맛을 보면 다음에 필요한 내용은 알아서 공부할 수 있을 것 같습니다. 참고로 이 책은 파이썬 데이터 분석 도구로 판다스(Pandas), 넘파이(Numpy), Matplotlib 라이브러리를 사용합니다.

 

책에서 설명하는 데이터 분석 과정은 간단합니다. 데이터를 수집하고 그걸 분석하고 가공해서 예쁘게 시각화하여 보여주면 됩니다. 데이터를 얻는 방식은 단순 파일부터 웹 크롤링, 트위터 같은 데이터 제공 API를 사용할 수 있습니다. 이렇게 얻은 데이터를 잘~ 가공하면 되는데 이것이 이 책의 주제입니다.

 

뒤쪽으로 갈수록 어려운 코드, 수식, 그래프도 나오는데 전부 이해하지는 못해도 따라하다 보면 감은 잡을 수 있습니다. 잘 모르겠으면 이런게 있구나 넘어가고 필요하면 본격적으로 찾아서 공부하면 될 것 같습니다.

 

‘이것이 데이터 분석이다’로 데이터 분석 책을 처음 접했는데 생각보다 재밌네요. 데이터 분석을 본격적으로 공부해서 재미있는 사이트를 많이 만들고 싶은 욕심도 생기고. 많은 데이터를 다루는 직장인이라면 엑셀에서 머물지 말고 파이썬을 활용해서 다양한 도전을 해보는 것도 괜찮을 것 같습니다.

데이터 분석을 해보고자 하는 초심자를 위한 책이다.

주제를 제시하고 이를 해결해 가는 과정을 보여줌으로써 실제 데이터 분석 업무를 경험해 볼수 있도록 안내하고 있다.

각 주제에서 데이터를 제시하고, 이를 단계적으로 분석해 가며, 최종 분석자료를 만들어가는 일련의 과정을 배울 수 있다.

 

 

1.jpg

2.jpg

 

 

책의 모든 소스코드 및 실행 결과가 노트북(Jupyter Notenbook)으로 제공되어 설명하고 있는 내용을 즉시 확인 할수 있다.

또한 저자 직강 동영상 강의가 공개되어 있다.(저자의 유튜브에 현재 5장까지 전부 공개 되었다.)

 

이렇게 노트북으로 소스를 제공하면 독자가 단순히 실행/확인 만 하고 넘어가기 쉽다.

이런 단점을 연습문제로 보완하고 있다.(물론 연습문제의 결과도 제공한다.)

인터넷 강의를 들으며 따라가는 식으로 공부하고 이후 연습문제로 점검하는 방식으로 학습하기에 아주 적합하게 구성된 책이다.

 

전체적으로 구성이나 진행면에서 나무랄데 없는 좋은 책이다.

다만, 이론에 대한 설명이 부족한 부분이 있고, 딮러닝 등 새로운 분석방법을 사용하진 않는다. 

진짜 데이터 분석가가 되고자 한다면, 깊이 있는 다른 책을 더 봐야한다는 점은 꼭 유의해야 한다.

 

저자가 제시하는 이 책을 활용하는 방법이다.

본 강의는 코드를 따라 치거나, 이론적인 설명에 집중하지 않습니다.

입문자 입장에서 동영상을 보는 여러분께서는, 코드를 따라치는 것보다는 예제를 풀어나가는 과정을 구경하는 것을 권장드립니다.

예를 들어 축구하는 법을 배우고 싶을 때, 아직은 축구하는 법을 잘 모르지만 구경부터 시작하는 것과 비슷합니다.

축구를 하는 사람들을 구경하면서 볼을 다루는 법을 유심히 관찰한 뒤, 자신이 연습할 때 그 부분들을 신경써서 연습하는 것입니다.

 

데이터 분석을 시작하고자 하는 초심자에게 데이터 분석의 흐름을 알려주는 좋은 길잡이가 되리라 생각한다.

 

 
개인적으로 이론 설명이 많은 교과서 같은 책 보단 실습이 많은 책을 선호하기에 기분 좋게 공부할 수 있었습니다.
최근 캐글과 데이콘 같은 대회를 통해 분석에 대한 감을 잡고 직접 도전 해보는 모습을 주변에서 종종 보고있는데,
해당 도서에서 설명하는 절차 및 팁 들이 익힌다면 이런 대회를 시작하시는 분들에게는 많은 도움이 될 것 같습니다.
 
데이터 분석에 대한 감을 잡고 캐글, 데이콘과 같은 분석 대회에 도전해 보고 싶으신 분들에게 추천 드립니다. Emotion Icon

 

 

이 책을 추천하고 싶어 마음만은 많이 쓰고 싶지만 보는 사람의 입장에서 지루할꺼 같아 개조식으로 쓰겠습니다.

 

1.      장점

A.     쉽게 표현해 놓음

                         i.         다른 데이터 분석 책들의 경우 이론도 많은 편이고 전문 용어가 많아 힘든 부분이 많아 난해하였는데 이 책은 초보자도 이해를 쉽게 할 수 있게 간단하면서도 쉽게 표현

                        ii.         응용해볼 프로그래밍 코드도 주석으로 표현해줘서 이해하기 쉬움

                       iii.         이해가 안될 경우 무료 강의 영상 제공

B.      바로 응용해 볼 수 있음

                         i.         데이터 분석에 대한 다양한 주제를 시각화 하여 볼 수 있어 재미있음

C.      핵심 위주로 뽑음

                         i.         데이터 분석에 대한 차트시각화크롤링, API, 미래 예측 등 핵심적인 부분을 종합해 놓음

 

2.      단점

A.     기본적인 파이썬 문법을 알아야한다.

                         i.         이 책은 파이썬을 응용하는 책이라 기본적인 파이썬 문법을 알고 있어야함

 

3.      추천대상

A.     데이터 분석을 해보고 싶은 입문자 및 응용에 부족한 사람이 읽으면 좋음

 

 

 

20200325_211416.jpg

 

 

 

 

이것이.jpg

 

 

 


이 책은 파이썬 문법을 어느정도 알고 있으며, 데이터분석이 처음이거나 

 

익숙치 않은 분들을 대상으로 작성된 책입니다.


파이썬 가상환경 설치부터, 데이터 수집 및 크롤링, 데이터 정제과정 

 

그리고 데이터 분석까지의 일련의 과정을


상세하고 쉽게 알려주고 있습니다.


대신 넓은 분야를 다루고 있기 때문에, 하나의 분석에 대한 깊이가 조금 얕습니다.


그래도 책을 보며, 여러가지 데이터를 수집하고 직접 분석해 볼 수 있습니다.


파이썬이나 텐서플로우에서 제공하는 기본 데이터셋이 아닌, 

 

중고 거래나 비트코인 가격, 특정 브랜드의 주문 데이터


같이 일상에서 접할수 있는 데이터를 분석하는 법을 배울수 있습니다.


요약하자면, 파이썬을 어느정도 알지만 데이터분석이 처음이거나 

 

여러가지 분야에 적용해 보고 싶다 하시는 분들께


추천드립니다.

요약

 

- 쉽게 데이터 분석에 접근해보고 싶다면 추천!

- 수학적 능력이나 딥러닝등에 사용될 내용을 찾는다면 비추천!!

- 책 내용이 하나하나 친절하다. 굿쨥!

- 실생활에서 한번쯤은 생각했을법한 내용들로 접근해 흥미를 갖게한다.

 

우앙!

한빛에서 혼공 시리즈와 함께 밀고있는

'이것이' 시리즈!

 

이것이 오라클이다.

이것이 자바다

를 이미 소유하고 있었지만

이것이 시리즈인것은 이번에 새롭게 안 사실...?!

뭐 딱히 연관관계가 있는것은 아니지만

'이것이 바로!!' 느낌의 제목이 팍팍 머리속에 들어온다.

 

이 책의 타겟 독자는?

그렇다고 한다.

최신 기술(딥러닝같은)을 원하거나,

수학적인 능력을 기르고 싶은 분들에겐 비추!

 

데이터 분석이 처음이거나

약간의 지식이 있지만 막연히 따라하는 예제보단

분석의 흐름과 실생활 예제를 살펴보고 싶다면 추천!

 

그리고

'파이썬을 조금이라도 접해본 사람을 대상'으로 한다

라고 한다.

 

파이썬은 최근들어 C언어를 대신해서

프로그래밍 입문자에게 추천할 만큼 '쉬운 언어'로 소개되지만

문법이나 다른 프로그래밍 언어에서 활용되던 개념이 약간 다른 느낌을 갖기 때문에 (본인 피셜)

파이썬을 알고있는 독자들을 타겟으로 잡은것 같다.

 

친절하구먼!

개발환경을 어떻게 구축할것인지,

소스코드를 GIT-HUB에서 어떻게 다운받을수 있는지,

학습을 진행하다가 막히면 활용할수 있는 수단은 어떻게 있는지

등등 친절하게 설명하고 있다.

 

사실 프로그래밍을 조금 해봤다고 하는 사람들 중에는

'변화를 싫어하는' 사람들이 꽤 많다.

'이런게 있다...' 정도로 알고 있지만 바꾸거나

기능을 업그레이드 할 필요를 못느껴

신기술을 모르는 경우가 많기 때문이다.

 

파이썬을 사용하던 프로그래머 중에는

pycham같은 특정 IDE만을 써왔다면

'아나콘다'라는 것을 몰랐을테고,

SVN 형상관리 툴만을 사용해왔던 사람은

GIT 이라는 형상관리 툴은 들어서 알지만 써보지 않았을 수도 있다.

 

이렇게 친절하게 알려주면 입문자 입장에서는 고마울 수 밖에 없다!

게다가 유튜브 강의까지!!

저자분이 직접 답변을 해주신다니까 모르는게 있으면 직행하자!

 

저자분에게 질문하러 고고!

각 장으로 넘기면 학습 목표의 핵심개념이 무엇인지 간략하게 설명하고,

해당 장 에서 어떤 데이터 분석을 할지 이미지를 미리 보여준다.

인기 있는 메뉴는 뭘까..!?

저자가 소개했던 말처럼

소스코드를 보고 직접 해보면서

실전에서 쓰일법한 예제들을 다룬다.

 

데이터를 직접 활용할 수 있는 방법을 보여주기 위해

SNS와 특정 문서(나무위키 같은) 를 크롤링 해서 직접 데이터를 구성하여

위와 같은 데이터들을 볼 수 있다.

 

'분석' 이라는 말이 갖게 하는 느낌,

어렵고 복잡할 것 같은 느낌을 지울수 없다.

분명 처음엔 이미지, 그래프들로 쉬움을 강조하지만

학습할수록 숫자와의 싸움을 벗어날순 없다.

 

하지만 이 책은 그 '어려움'을 최소화 하기 위해

실제 한번쯤은 궁금했을법한 내용들을 사용하고

어떻게 이런 코드가 사용됐는지를

독자와 함께 진행하면서 대화하는 느낌을 통해 이해하게 한다.

 

커버에 저자분의 얼굴인진 모르겠지만...(맞겠지?)

확실히 얼굴 내놓을만한 책이라고 생각한다.

 
오늘 리뷰하는 책은 "이것이 데이터 분석이다 with 파이썬" 이다.
 
파이썬 기반의 데이터 분석 관련 책은 전에 다른 책을 본 적도 있으나, 그때 그책은...좀 살짝 지루했다. 
 
이유는 간단하다. 살짝 부담스러운 분량, 편집이나 레이아웃, 흑백 인쇄, 번역서 였기 때문이다.
 
이 책은 부담 없이 쭉쭉 볼 수 있었는데 그 이유는 바로 위의 이유 대부분을 피해갔기 때문이었다.
 
 
 
일단 칼라 인쇄는 항상 옳다. 특히 이런 챠트나 그림이 많이 나오는 책에서는 그 진가를 확실하게 발휘한다.
 
아래 사진이 바로 그런 점들을 증명하고 있다. 같은 내용이라도 흑백 인쇄보다 가독력이 뛰어나고, 
 
내용도 팍팍 머리에 들어오는 느낌을 준다.
 
 
 
 
 
목차에서도 맘에 부분이 있었다. 데이터 분석의 핵심 키워드들이 큰 목차에 그대로 있고 해당 예제들을 다루는 점이 좋았다.
 
 
 
위의 워드 클라우드에서도 보았지만 원서에서는 구경하기 힘든 한글 처리 부분과 한국 지도 서비스 연동 하는 등의
 
애국적인 예제들로 설명하고 있으니 좀 더 쉽게 이해가는게 당연하다.
 
 
 
곳곳에 통계나 데이터 분석 관련 용어들도 설명이 되어 있어서 좋았다.
 
용어들은 꼭 익혀 두는게 좋다. 머신 러닝, 딥러닝에서도 동일하거나 관련 있는 용어들이 많이 나온다.
(예를 들면 원 핫 인코딩)
 
때로는 설명이 약간 부족한듯한 부분도 있지만 분량을 줄이려면 어쩔수 없을터.
 
아주 어려운 용어도 가끔 있었다. 이런건 검색을 이용하거나 따로 공부를 해야 할듯...
 
 
이 책은 각각의 라이브러리에 대해서는 간단하게만 설명을 하고 있다. 
 
데이터 분석을 주도 다루는 책이니 당연한 것이니, 라이브러리 설명 부족은 해당 매뉴얼을 보는게 정답이다.


부담 없는 분량으로 자칫 지루하기 쉬울 수 있는 통계, 데이터 분석 등의 내용을 화려한 컬러 인쇄로 볼 수 있어서 

좋은 책이었다. 유투브에 동영상 강의도 있다고 하니 가서 들어보자~!



한빛미디어에서 출판된 "이것이 데이터분석이다 with 파이썬"은 데이터 분석 입문자들에게 완전 추천하는 책이다.

만약 파이썬 기초문법에 대해서 다 배우고 어떤 책으로 넘어와야 할 지 모르겠다면,

실제 예제를 풀어가며 데이터 분석에 대한 기초를 차근차근 쌓을 수 있게 도와주는 입문서로 완전 추천한다.


책 안의 깃헙 주소로 들어가면 예제를 손쉽게 다운받을 수 있다.

바로바로 따라하며 데이터 분석 기초를 다져주니 훨씬 이해도 쉽고 문과생들도 쉽게 따라갈 수 있다.

문과생인 내가 이해를 하면서 따라간다는 것은 다른 문과생들도 쉽게 할 수 있다는 보증수표이다.

 

기존에 라이브러리가 없던 사람들도 따라하기 쉽게 처음부터 시작한다.

입문자들은 라이브러리 다운로드에서부터 막히는 사람들이 많은데 그러한 문제를 겪지 않게 상세하게 설명이 되어있다.

또한, 여러가지 데이터 분석 사례들을 다루고 있기 때문에 입문책으로 공부하다가

어떤 데이터 분석을 좀 더 공부하면 좋을 지에 대해서 생각 할 수 있는 기회를 준다.

 

특히 재밌었던 부분은 비트코인 예측하기이다.

요즘 주식이 너무 심하게 요동쳐서 이 책에서 다룬 시세예측을 현재 주식판에 연결해서 적용해봐도 재밌을 것 같다.

 

또한, 책만으로 공부가 어려운 사람들을 위해 아래 유튜브를 들어가면 저자직강을 볼 수 있어 더더욱 도움이 된다.

보통은 저자직강을 유튜브 채널로 제공해주는 경우는 잘 없는데 너무 유용하게 공부할 수 있었다.

책 내에서도 코드와 함께 실행 결과를 함께 보여줘서 공부하기 편했는데, 저자직강을 들으니 좀 더 이해가 쏙쏙 되서 책과 강의를 함께 보는 것을 추천한다.

https://www.youtube.com/user/HanbitMedia93





[한줄평]

실생활 예제로 쉽게, 단계별 분석에 따라 구조적으로 배우는 데이터 분석 입문서


[목차구성]

Chapter 00. 들어가기 전에

Chapter 01. 데이터에서 인사이트 발견하기

Chapter 02. 텍스트 마이닝 첫걸음

Chapter 03. 미래를 예측하는 데이터 분석

Chapter 04. 데이터 분류 모델

Chapter 05. 데이터 분석 종합 예제


[이 책의 특징]

① 데이터 분석의 이론보다는 ‘흐름’을 담았습니다. 

② 단계별/반복적으로 학습하며 데이터 분석을 체계적으로 배울 수 있습니다. 

③ 저자 직강 동영상 강의 무료 제공


[대상 독자]

-라이브러리를 사용하는 프로그래밍을 경험해본 사람

-데이터 분석에 대해 어렴풋이 들어봤지만 제대로 공부해본 경험이 없는 사람

-입문자에게 중요한 분석 포인트를 알고 싶은 사람


[서평]

이 책은 입문자의 입장에서 단계적으로 데이터 분석에 접근하는 방법을 잘 설명하고 있습니다. 데이터 분석 입문자에게 가장 중요한 것은 이론이나 스킬이 아닌, 문제에 올바르게 접근하는 사고의 과정이라 생각합니다. 여기 책에서는 총 5챕터로  대표적인 분석 방법을 설명하지만 데이터 분석 이론, 라이브러리 사용법은 자세하게 다루지는 않습니다. 하지만 데이터 분석에 가장 중요한 문제를 어떻게 해결 하는지 과정을 자세하게 다루고 있습니다. 그리고 문제를 해결하는 과정에서 꼭 필요한 이론에 대해서는 쉽게 이해 할수 있게 설명하고 있습니다.


이책은 파이썬문법을 사용한다는 과정하게 진행하기 때문에 파이썬에 대한 기초적인 문법은 알고 있어야 합니다. 이부분이 조금 아쉬웠습니다. 파이썬 기초 문법에 대해서는 설명을 하면 좋지 않았을까 생각합니다.


데이터 분석에 대해서 처음 시작 하고 싶다면 이책을 통해서 데이터 분석 방법과 실무에 사용하는 다양한 예제를 배우고 데이터에대한 인사이트를 발견할 수 있을 것이라 생각합니다.



 

KakaoTalk_20200322_233323768.jpg

 

나는 처음 책표지를 딱보았을 때 먼저 사람의 모습이 인상적이였다.

지은이는 어떤 분일까 너무 궁금해서 책을 받자마자 지은이의 글부터 읽어보게 되었다.

미디어학과생으로 디자이너를 지망하던 대학생이 인턴십 과정에서 웹 개발 업무를 하게 된 계기로 프로그래밍의 적성을 발견하고  데이터분석의 매력을 느끼고 데이터분석 공부를 하다가 지금은 머신러닝 엔지니어라는 커리어까지 시작할 수 있었다는 부분이 너무나 매력적이였다. 누구나 데이터분석자, 머신러닝 엔지니어는 전공자만 가능하다라는 것을 깨뜨리고 스스로 노력하고 공부하여 자신의 길을 개척하고 극복해 나가는 작가님이 너무 대단한 분이구나 싶다. 무에서 유를 스스로 공부하며 이해하셨기에 입문자들의 어려움을 누구보다 잘 알거란 믿음이 더 가는 부분이다.

 

파이썬과 pandas, Numpy, Matplotlib를 접해봤지만 제대로된 데이터 분석을 해보지 않은 나에게 이 책은 제대로된 데이터분석 흐름을 절차적으로 배울 수 있는 입문서로 보인다.

 

이 책은 데이터 분석 이론과 라이브러리를 상세하게 설명하진 않는다. 그래서 처음부터 일일이 찾아서 공부하면서 하면 첫 Chapter부터 힘이 빠질 것이다. 작가가 의도한 것처럼 먼저 이책의 가장 큰 장점은 데이터 분석으로 문제를 해결하는 과정, 흐름을 볼 수 있는 책이기에 그 흐름을 보는 눈을 키우는 것을 1차 목표로 삼아야 할거 같다. 그러면서 모르는 라이브러리나 이론적인 부분은 체크해 두고서 나중에 책을 모두 실습해 본 후에 천천히 공부하면서 상세히 정리해 가다보면 더 이해가 빠를 듯 하다. 

 

그래서 이 책은 파이썬 프로그래밍을 조금이라도 접해본 사람이 적합하다. 프로그래밍에 대한 개념이 전혀 없으신 분은 추천할 수 없는 책이다. 그리고 데이터 분석에 사용되는 수학적, 통계적 개념을 깊게 이해하고 싶은 분도 적합하지 않다. 데이터 분석의 흐름을 알려주는 것이 가장 핵심 목표이기에 데이터 분석 이론과 수학적, 통계적 개념은 깊게 다루진 않는다. 

 

5개의 Chapter는 단계적으로 학습할 수 있게 이루어져 있다. 각 Chapter마다 다양한 예제를 두어서 지루할 틈이 없다. 

앞에서 말한것처럼 데이터 분석의 흐름을 배울 수 있게 예제 자체들을 Step별로 나눠서 문제 해결 하는 과정이 이해의 구조화를 해 줘서 너무 좋다.  예제들을 하다보면 또다른 확장된 주제로 생각이 뻗어 나가며 분석해보고 싶은 또다른 것들이 떠오르게 됨을 경험하게 되고 그러면서 데이터 분석의 재미를 느끼게 한다. 

간간히 미니퀴즈, 연습문제들은 약간의 긴장감을 주면서 제대로 코딩 연습을 다시 해 보게 되는 좋은 학습 동기가 된다. 

 

예제만 따라해본다해도 결코 난이도가 낮지 않는 그러면서도 많이 높지도 않은 그러면서도 지루하지도 않는 데이터 분석의 맛을 느낄 수 있는 책인거 같다.

 

 

 
 

한빛미디어에서 나온 '이것이 OO다' 시리즈 책을 많이 갖고 있다.

'이것이 리눅스다', '이것이 오라클이다' 등등 Programming language나 운영 체제, DBMS 등의 기본석 역할을 하는 시리즈인 것 같다. 그래서 도움을 많이 받았고, 회사에서도 '이것이 C#이다'라는 책으로 본인의 메인 컴퓨터 언어가 된 C# 프로그래밍을 하고 있다.

 

KakaoTalk_20200321_234218944.jpg

 

 

이 시리즈 특유의 표지 디자인이 있다. 그런데 이번엔 조금 다르다. 보통이라면 로봇이나 기계 같은 것이 등장하고 형광빛을 내는 제목이 새겨져 있는데 기존 시리즈를 아는 사람이면 누구나 알 것이다. 이번 표지는 많이 다르다는 것을 사실 나도 의아했다. 책도 '이것이 파이썬이다' 같은 것으로 나올 줄 알았는데 데이터 분석 책이 이 시리즈로 출간이 되었다. 그래도 이 시리즈는 믿고 본다.

 

 

 

이 책을 볼때 유념할 점은 파이썬에 대한 지식이 어느정도 있다는 것을 가정하고 진행된다. 개발 환경 구축 같은 것은 스크린샷을 통해 친절히 안내하고 있지만 말이다.

 

 

그래서 초반에는 파이썬 언어에 대한 내용보다는 파이썬 설치라든지, 파이썬 라이브러리, 아나콘다와 같은 환경 설정에 초점을 둔다. 이 책이 파이썬 언어 책이 아니기 때문에 파이썬 언어에 대한 중요 개념 정리도 지면 관계상 다 싣지는 못한 것으로 보인다. 그래서 파이썬 기초 책을 먼저 보고 이 책을 보면 좋을 것이다.

 

 

그래도 다른 컴퓨터 언어에 대한 지식이 있으면 그렇게 어렵지 않고 자연스럽게 이해는 될 수준이다. 환경 구축은 상세히 설명해주니 이 부분만 보고 따라한다면 데이터 분석 프로세스에 집중하여 공부를 해나가면 될 것 같다.

이 책은 꽤 다양한 케이스를 가지고 실습을 진행한다. 그냥 코드만 보여주는 막무가내식 실습이 아니라 '탐색→ 인사이트 발견 → 탐색적 분석 → 통계적 분석'으로 단계별로 데이터 분석을 진행한다.

 

 

책에서 다루고 있는 케이스를 살펴보면 프랜차이즈 주문데이터, 국가별 음주 데이터, 소셜 네트워크 분석, 영화 평점 예측, 중고나라 휴대폰 거래가격 예측 등이 있다. 데이터 분석을 하기에 매우 흥미로운 사례 등이다.

 

그리고 데이터 분석에 그치지 않는다. 데이터 분석을 하려면 데이터가 있어야 한다. 데이터를 21세기의 원유라고 하던데 그 원유가 있어야 가공을 하거나 연료로 사용할 것이 아닌가.

 

그래서 웹 크롤링 하는 방법에 대해서도 중간에 설명이 되어 있다. 파이썬으로 웹 크롤링 하는 방법을 배우고 싶다면 이 책을 선택해도 좋다. 실제로 크롤링한 데이터를 가공하고 분석하는 일은 실무에서도 정말 많이 사용된다고 들었다. 그외에도 Pandas, Numpy 등 매우 중요한 라이브러리 활용을 많이 하고 있으니 이 참에 확실히 배워두면 두고 두고 사용할 곳이 많을 것이다.

 

 

중간중간 통계적 용어 및 기법들을 사용한다. 그렇지만 해당 용어와 기법의 근본이 되는 이론이라든지, 증명 방식, 수식 등 깊은 설명은 하고 있지 않다. 그러니까 이 파이썬이라는 도구를 가지고 얻고자 하는 결과물을 내놓는 것에 이 책이 의미가 있는 것이다.

 

 

텍스트마이닝, 데이터 분류, 미래 예측 분석 등 데이터 분석 범주에 속하는 다양한 방법들이 소개된다. 개인적으로 나무위키를 크롬의 개발자 도구를 통해 URL 정보를 따온뒤, BeautifulSoup이라는 아주 유명한 웹 크롤링 라이브러리로 데이터를 수집해보고 말뭉치를 만들어 워드 클라우드까지 완성하는 부분이 관심을 끌었다.

 

 

정리하자면, 이 책의 장점과 차별성은 하나의 방법론처럼 '단계별 분석'을 적극적으로 활용하고 있다는 점이다. 데이터 분석을 해야하는데 어떻게 해야할지 모르는 사람들에게는 이런 분석 방법을 사용해야 좀 더 체계적으로 데이터를 통해 인사이트를 얻을 수 있다.

 

 
 
 
 

찾아보니 저자의 동영상 강의도 포함되어 있다. 개념이 너무 어렵다면 유튜브에 공개된 동영상 강의를 참고하는 것도 좋을 것 같다. 특히 파이썬이 익숙하지 않은 사람은 더욱 동영상 강의가 필요할지도 모른다.

 

이 책으로 공부해보니 R에서 했던 데이터 분석을 모두 파이썬에서 똑같이 할 수 있을 것 같다. 그리고 다른 사례의 데이터를 분석하게 될 기회가 주어진다면 책의 가장 비슷한 사례를 벤치마킹하는 것도 큰 도움이 되지 않을까?

 



image.png

데이터 분석, 데이터 과학쪽을 가고 싶다고 고등학교때 부터 꿈꿔 대학교에 컴공으로 진학을 했지만, 대학교에서 배우는 과목으론 데이터 분석을 다 배우긴 힘들어 혼자서 공부를 해야한다는 필요성을 느끼게 되었습니다. 어떤 책으로 공부를 하면 좋을지 이것저것 찾아보다가 독학을 하던 도중 이 책을 만나게 되었습니다.

 

이 책의 제일 좋은 점은 확실히 실생활과 밀접한 예시가 많다는 것입니다. 데이터 분석이라 해도 과학적인 자료를 이용해서 분석을 하는 경우가 많거나 데이터 셋을 구하기 힘들어 분석을 하는데 어느정도 힘들었는데, 이 책은 예제로서 자료도 충분히 있을 뿐더러 설명을 하는 예시들도 비트코인이나 맛집 분석등 실생활에서 들어볼 법한 익숙한 소재들을 활용해 더욱 친숙하다는 느낌을 받았습니다.

 

또한 강의로도 친절하게 설명을 해주어서 책으로만 이해하기 힘든 내용도 쉽게 배울 수 있다는 점이 무척이나 좋았습니다. 하다가 막히는 부분이 있어도 영상을 보며 문제를 해결할 수 있을 뿐더러 질문을 하면 답도 해준다 하니 강의를 보면서 차근차근 배워볼까 싶습니다.

단점이 있다면 이 책은 파이썬을 어느정도 안다는 전제하에 공부를 하면 더욱 좋을 것 같았습니다. 마침 이책을 만날때 즈음 파이썬 공부를 다 했기에 라이브러리 설치나 이해가 원활했지만 완전 초보자가 본다면 파이썬을 활용하는데서 막힐게 조금 있을 것이라 생각되기에 기본적인 파이썬 구문과 라이브러리를 해석하는 정도의 실력을 갖추면은 좋을거라 생각이 되네요.

 

 

책에서도 강의에서도 볼 수 있듯 이 책의 제일 좋은 점은 이론이 아닌 흐름을 배우는 겁니다. 대부분의 데이터 분석에서 중요하게 얘기하지만 이 책에서는 특히 더 어떻게 분석을 하고, 결과를 해석할지에 대한 전반적인 사고력을 더 중요시 여깁니다. 이 사고 방식을 얻는 것만으로도 이 책에서 충분히 얻을 건 다했다는 생각이 듭니다. 데이터 분석으로 무얼 공부해야할지 망설이는 사람들에게 적극적으로 권장하고픈 도서이며, 강의를 보면서 천천히 공부하면 책을 덮은 뒤에 실력이 늘어난 자기자신을 볼 수 있다고 생각됩니다.

 

이 책은 데이터 분석 입문자들을 위해 만들어진 책입니다 

필자의 노고가 많이 담겨 있고 데이터분석 입문자들의 입장에서 책이 작성되어서 

파이썬으로 데이터 분석을 도전해보고 싶은 분들에게 많은 도움이 될것입니다 

 

단! 데이터분석에 있어서 수학적인 부분과 파이썬의 기초적인 부분은 다루지 않으니 

미리 알고 오신다면 더욱 도움이 될 것입니다

 

조금더 자세한 리뷰를 보고싶으시면 

 

https://allhpy35.tistory.com/45 

 

위의 링크를 참조해주세요

책 표지를 통해 '데이터분석', '파이썬', '입문' 이라는 키워드를 통해 데이터 분석에 관심있는 입문자들을 위한 도서라는 걸 알 수 있었고, '실생활 예제', '단계별 분석', '구조적' 이라는 키워드를 통해 이 책은 우리 생활과 밀접한 예시들을 사용하려 하고, 이를 체계적으로 다루려는 인상을 받았다. 마지막으로 4시방향에 있는 동영상 강의 무료 제공은 타겟팅을 입문자로 잡다 보니, 혹시나 진입에 두려워할 사람들을 위해 제공하는거 같다는 느낌이 들었다.

1. 단계적으로 학습 : 5개의 Chapter 안에 각 단계가 step으로 구성되어 체계적으로 공부 할 수 있음.

2. 이론 보다는 흐름을 배움 : 저자는 이론보다는 문제 해결 과정에 집중하기 위해, 수식보다는 직관적인 설명만 담음.

3. 대상 독자 : 파이썬을 조금 접해본 사람(조금의 기준 : 변수, 자료구조, 객체와 같은 개념정도)를 추천하며, 저자는 프로그래밍 개념이 전혀 없거나, 데이터 분석 수학적, 통계적 개념을 깊게 이해하고 싶거나, 최신이론에 관심있는 사람은 다른 책을 추천한다고 한다.

4. 책을 읽는 방법 : 깃허브에 올려놓은 코드를 통해 실행해보며 공부하는 걸 추천한다.

교과서처럼 각 챕터 별 배울 핵심개념들을 미리 소개 하고 있다.

표로 정리하고 퀴즈 및 연습문제로 각 쳅터 별 배운 개념들을 확인한다.

책 만으로 해소 안되는 부분을 동영상 강의 및 Q&A를 유투브로 해결해주시는 모습이 인상적이다.

목차

Chapter 00. 들어가기 전에

0.1 개발환경 구축하기

0.2 데이터 분석을 위한 라이브러리

Chapter 01. 데이터에서 인사이트 발견하기

1.1 탐색적 데이터 분석의 과정

1.2 멕시코풍 프랜차이즈 chipotle의 주문 데이터 분석하기

1.3 국가별 음주 데이터 분석하기

연습문제

Chapter 02. 텍스트 마이닝 첫걸음

2.1 웹크롤링으로 기초 데이터 수집하기

2.2 나무위키 최근 변경 페이지 키워드 분석하기

2.3 특정 키워드가 있는 게시물 크롤링을 위해 API 사용하기

2.4 트위터 API로 ‘손흥민’과 연관된 키워드 분석하기

연습문제

Chapter 03. 미래를 예측하는 데이터 분석

3.1 프로야구 선수의 다음 해 연봉 예측하기

3.2 비트코인 시세 예측하기

3.3 미래에 볼 영화의 평점 예측하기

연습문제

Chapter 04. 데이터 분류 모델

4.1 타이타닉의 생존자 가려내기

4.2 강남역 맛집 리뷰로 알아보는 감성 분류

연습문제

Chapter 05. 데이터 분석 종합 예제

5.1 중고나라 휴대폰 거래가격 예측하기

5.2 구매 데이터를 분석하여 상품 추천하기

목차를 통해 알 수 있듯이 데이터 분석에 있어 EDA, 텍스트 마이닝, 웹 크롤링, 예측, 분류 등에 관심이 있

는 분들에게 한빛미디어의 '이것이 데이터 분석이다'를 추천드리고 싶다.

리뷰어클럽 서평단 자격으로 작성한 리뷰입니다.

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 도서명 :
이것이 데이터 분석이다 with 파이썬
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
이것이 데이터 분석이다 with 파이썬
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
이것이 데이터 분석이다 with 파이썬
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실