메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

처음 시작하는 R 데이터 분석

쉽고 재밌게, 실무 예제로 끝낸다! 7일 완성 로드랩

한빛미디어

집필서

절판

  • 저자 : 강전희 , 엄동란
  • 출간 : 2018-10-05
  • 페이지 : 328 쪽
  • ISBN : 9791162241202
  • 물류코드 :10120
  • 초급 초중급 중급 중고급 고급
4.5점 (36명)
좋아요 : 17

빠르고 재밌게,

풍부하고 흥미로운 실습 예제로 R 데이터 분석에 입문한다!

 

7일 완성 로드맵에 따른 체계적인 학습

무엇이든 입문할 때 가장 어려운 것이 ‘어떻게 시작하는가?’이다. 이 책에서 제공하는 [7일 학습 로드맵]에 따라 차근차근 학습한 후 하루 만에 끝내는 요약 정리, 4가지 실전 프로젝트로 복습하면 어느새 실제 업무에서도 활용하고 있을 것이다.

 

R 스튜디오를 통째로 옮겨 놓은 친절한 구성

새로운 도구를 배울 때 가장 좋은 학습 방법은 직접 따라해 보면서 익히는 것이다. 하지만 이동 중, 혹은 실습 환경이 갖춰지지 않은 곳이라면? 이 책은 언제 어디서나 ‘제대로’ 학습할 수 있도록 R 스튜디오의 Script 창과 Console 창의 내용을 그대로 옮겨 담았다. 또한 1:1 과외처럼 친절하게 거의 모든 코드에 주석을 달아 독학의 어려움을 최소화했다.

 

저자 직강 동영상 강의와 편리한 질의응답 편의 제공

함께 학습하는 사람이나 주변에 도움 받을 사람이 있다면 좋겠지만, 독학 시에는 작은 도움도 크게 느껴진다. 이런 독자의 마음을 고려하여 유튜브를 통해 핵심 포인트, 혼자 하기 어려운 내용 등을 동영상 강의로 제공하고 있다. 또한 책을 보면서 궁금한 내용이 생겼을 때 저자의 GitHub에 방문하여 [Issues] 탭에서 질의응답을 할 수 있다.

어떤 독자를 위한 책인가? 

  1. 빠르게 배워 실무에서 R 데이터 분석을 이용하려는 직장인
  2. 경제, 경영, 통계학 등 데이터 분석이 잦은 학과 전공자
  3. 데이터 분석에 입문하려는 컴공 전공자

 

※ 참고 동영상 :  https://www.youtube.com/watch?v=yZpBDOjlko0

Google map API 사용이 변경되어 <처음 시작하는 R 데이터 분석> 중 다음 페이지는 이 동영상을 참고해주세요.

  • P 236~239 ggmap 패키지
  • P 292~296, 306~310 지하철역 데이터 가공하기

Updated : 2019-01-02

 

※ 구글 API 변경으로 구글 지도를 활용하는 ggmap 패키지 부분을 수정합니다.

구글 지도를 활용하는 ggmap 패키지 내려받기 ↓

http://hanbit.smilecdn.com/download/ggmap_pack.pdf

 


750_상세이미지.jpg

 

 

강전희 저자

강전희

컴퓨터공학과 인공지능을 공부했으며, 게임 회사를 거쳐 현재 TVING에 재직 중입니다. AI, 빅데이터, 정보 보안, 온갖 Gadget과 업무 자동화 등에 관심이 많습니다. 국내 최초로 MCN 사업인 DIA TV를 런칭한 경험을 바탕으로 사업 개발, 광고 영업, 광고 데이터 분석을 해왔으며 현재 클라우드 엔지니어로 일하고 있습니다. 네이버 클라우드 플랫폼 마스터와 국내 최대 클라우드 자격증 커뮤니티인 ‘IT 다 봐요’에서 부운영자로 활동하고 있으며, 클라우드 기술과 정보 공유를 위해 노력하고 있습니다.

엄동란 저자

엄동란

통계학을 공부한 후 컨설팅 회사에 입사하여 CRM 기반의 분석 업무를 경험하였다. L사에서 회원 기반의 빅데이터 분석 업무를 담당했고, 빅데이터 기획, 분석 외에 마케팅 분야에서도 다양한 경험을 보유하고 있다.

 

PART 01 데이터 분석과 R 

Chapter 01  R&R 스튜디오 : 사용 환경부터 제대로 준비하자

01. R이란?

02. R을 설치하고 실행하기

03. R 스튜디오 설치와 기본 환경 설정하기

04. 스크립트 생성 및 코드 실행하기

05. 도움말 사용하기

 

Chapter 02 데이터 분석과 구조 : 데이터는 어떻게 생겼을까?

01. 데이터 분석 과정 알아보기

02. 데이터의 생김새와 변수와 함수

 

Chapter 03 데이터 종류 : 구조와 형태에 따라 데이터 이름도 다르다

01. 데이터 구조 간 관계 파악하기

02. 데이터 구조의 가장 기본인 벡터

03. 벡터를 행/열로 구성한 행렬, 행렬의 확장인 배열

04. 여러 데이터를 그룹화한 리스트, 리스트의 확장인 데이터 프레임

      한입에 쏙

      연습문제

 

PART 02 데이터 분석을 위한 기본기 다지기

Chapter 04 데이터 수집 : 분석할 데이터를 준비한다

01. 원시 자료 입력 및 엑셀 파일 가져오기

02. read.table() 함수로 TXT 파일 가져오기 

03. 직관적인 메뉴로 원시 데이터 가져오기

04. R 데이터 저장하고 불러오기

 

Chapter 05 데이터 가공 : R은 데이터를 이렇게 다룬다

01. 데이터 분석의 기초, 연산자

02. 분석을 위한 데이터 기본 정리

03. 데이터 추출부터 정제까지, 데이터 전처리

04. 데이터 분석을 위한 기초 통계 분석 함수

05. 데이터의 이해도를 높일 수 있는 그래프

      한입에 쏙

      연습문제

 

PART 03 데이터 분석을 위한 필수 패키지와 함수

Chapter 06 패키지 : R에 기능을 더하다

01. 필요할 때 추가해서 사용하는 패키지

02. 패키지 설치 및 사용 방법

03. 컴퓨터 간 동일한 패키지 환경 만들기

 

Chapter 07 reshape2 패키지 : 데이터의 행을 열로, 열을 행으로!

01. 가로로 긴 데이터 모양을 세로로 전환하는 melt() 함수

02. 세로로 긴 데이터 모양을 가로로 전환하는 cast() 함수

 

Chapter 08 KoNLP 패키지 : 한글을 분석한다

01. KoNLP 패키지와 wordcloud 패키지 설치하기

02. 애국가로 형태소 분석하기

03. 애국가 단어로 워드클라우드 만들기

 

Chapter 09 dplyr 패키지 : 데이터 가공 마법사

01. dplyr 패키지 실습 준비하기

02. 데이터 추출 및 정렬하기

03. 데이터 추가 및 중복 데이터 제거하기

04. 데이터 요약 및 샘플 추출하기

05. 함수와 함수를 연결하는 %>% 연산자

 

Chapter 10 ggplot2 패키지 : 데이터 분석의 꽃, 시각화

01. ggplot2 패키지로 그릴 수 있는 다양한 그래프

02. 그래프의 이해를 높이는 객체 추가하기

03. 함께 알면 유용한 googleVis 패키지와 ggmap 패키지

      한입에 쏙

      연습문제

 

PART 04 데이터 분석 실전 프로젝트 

Project 01 치킨집이 가장 많은 지역 찾기

01. 업종별 데이터 다운로드 및 기초 가공

02. 데이터 가공 및 트리 맵 표현하기

 

Project 02 지역별 미세먼지 농도 비교하기

01. 서울시 대기 환경 정보 다운로드

02. 상자 그림으로 시각화 및 t 검정

 

Project 03 트위터 키워드 크롤링으로 워드클라우드 그리기

01. 트위터 API 사용하기

02. 트위터 키워드 검색 및 워드클라우드 표현

 

Project 04 지하철역 주변 아파트 가격 알아보기

01. 공공 데이터 다운로드

02. 지하철역 데이터 가공하기

03. 아파트 실거래가 데이터 가공하기

04. 구글 지도에 지하철역과 아파트 가격 표시하기

 

APPENDIX부록

Appendix 01 통계 분석 기법 맛보기

Appendix 02 연습문제 정답

이세행(네이버 클로바) : R이라고 하는 생소한 언어를 쉽게 설명하여 첫걸음을 내딛기가 수월했습니다. 

 

김승희(다우기술 서비스개발본부) : 이 책 덕분에 데이터를 분석하고, R을 사용하는 게 그리 어려운 게 아니라는 걸 알았습니다.

 

김경식(엑셈 빅데이터 개발자) : ‘비전공자도 볼 수 있는 R 데이터 분석’이란 말이 가장 먼저 떠오를 만큼 누구나 이해하고 따라 할 수 있는 책입니다.

 

김유(한국IBM 마케팅팀) : 빠르면 일주일, 넉넉하게 한 달이면, 소셜 데이터를 수집하고 데이터를 분석, 시각화하고 있는 자신을 발견할 수 있을 것입니다.

 

강전영(뉴욕주립대 버팔로 지리학과 박사후 연구원) : R 초보자들이 기초를 파악하고, 프로젝트에 적용할 수 있게 도와주는 ‘가이드’가 되는 책입니다.

딥러닝 이전엔 빅데이터와 함께 R 프로그래밍이 많이 언급되었지만 

데이터 분석 전 전후처리, 데이터 시각화 등 통계 및 데이터 과학과 관련한 파이썬의 강력한 기능에 많이 잊혀지지 않았나 싶다.

 

그럼에도 불구하고 우연한 계기로 R Studio를 이용해 데이터 분석 작업을 경험을 하였고

R 과 R을 이용한 직관적인 일련의 데이터 분석 작업에 관심이 있었다.

그 차에 이 책을 읽을 기회가 생겨 리뷰를 남긴다.

 

제목에서 밝히듯이 처음 시작하는 초심자를 위한 컨셉의 책이다. 

당장 종이 질만 봐도 투박한 책의 디자인에 지레 겁먹지 않도록 배려하여 책을 읽고자 독자의 손이 가도록 한다.

책 내용은 설치부터 R Studio의 세세한 화면까지 설명한다.

개인적으로는 미주알 고주알 중요하지 않은 내용도 포함되지 않았나 싶은 감도 없지 않아 있지만

처음 시작하는 초심자의 관점에서 본다면 이런 세세한 설명이 필요하기도 싶다.

 

'R'을 이용하는 '데이터 분석' 책이라는 점에서

데이터 분석에 대한 배경 지식에 대한 설명과 툴로써 사용하는 R 언어에 대한 설명이 필요한데

이 책에서는 언어 R에 대한 문법 설명과 데이터 분석에 유용한 기능들을 설명하고 있다.

데이터 분석에 대한 이론 및 통계에 대한 내용은 별도의 이론서를 이용해 따로 공부해야 할 필요가 있다.

사실 책 두께를 본다면 어느 정도 R 언어에 대한 설명으로 이루어 졌을 것 같다는 예상은 했었다.

 

데이터 분석에 대한 배경 지식이 부족함에 대한 불만은 없으며 

그런 결정에 대해서도 이해한다.

생각을 해보면 과연 책한권으로 설명을 끝낼수나 있나? 싶기도 하다.

다만 그런 기대를 하는 사람들을 위해 미리 밝힌다.

 

R 언어와 R Studio의 일부 사용에 대한 설명 중에는 그림을 조금 더 활용해 서술했으면 어땠을까 하는 아쉬움이 생긴다.

프로그래밍 언어가 구현하는 개념과 통계나 데이터 분석에서 사용하는 실제 개념사이에는 차이가 있다. 

그래서 프로그래밍 언어를 이용해 데이터 분석과 통계에서 사용하는 개념을 표현하기 위해서는 두가지 모두에 대해 깊이 이해하고 온전히 활용할 수 있는 상태여야 한다. 그래서 조금 더 직관적으로 이해할 수 있도록 노력이 있었으면 어땠을까 하는 아쉬움이 남는다.

IMG_2980.jpeg

 

 

 

그림-1.jpg

 

표현이 좀 거칠긴 한데, 다들 회사에서 업무에 시달리다 보면, 새로운 것을 배울 때 보통 이런 생각을 하게 됩니다. 이 책을 읽으면서, 계속 이런 생각이 들었습니다. "군더더기가 없구나 ~". 이 책은 입문자용 입니다. 그렇기 때문에, 'R이 이렇게 쓰는 거구나'를 파악하는데 충실한 책입니다. 제가 경험에 비춰 초창기 관련서적과 비교한다면, 입문자들에게 이 책을 권장하고 싶네요. 입문을 어떻게 보느냐에 대한 관점 차이인데, R이 뭘 할 수 있는지를 중심에 둔다면, 다양한 패키지를 소개하는게 맞을 겁니다. 그러나, 실무에서 뭘 많이 하고, 뭐부터 배워야 하는냐를 중심에 둔다면, 내용이 크게 달라집니다. 이 책은 후자에 중심으로 두고 있고, 이를 필요한 사람들에게는 좋은 선택이 될 수 있을 것 같습니다.

 

그림-2.jpg

 

[기본환경 설정에 대한 충실성!]

 

이 책에서는 입문자들이 실습환경 구축에서, 중도 포기할 수 부분을 잘 설명해 주고 있습니다. 예를 들어 R 스튜디오의 경우 영문과 달리 멀티바이트를 사용하기 때문에 UTF-8 설정이 필요합니다. 일반적으로 다른 서적들은 이를 놓치고 바로 실습을 설명하는 경우가 있는데, 이 책은 이한 것들을 언급하고 넘어가기 때문에, 입문자들에게 도움이 될 것 같습니다.

 

 

그림-3.jpg

 

그림-4.jpg

 

 

[실무 중심의 예시를 보이다 !!!]

이 책에서 가장 강조하고 싶은 부분은 바로 4장 입니다. 4가지의 작은 데이터 분석 실전 프로젝트로 제공하는데, R을 이용해서, 보다 구체적인 실습을 해보고 싶은 독자에게는 큰 도움이 될 수 있을 것 같네요

- 치킨집이 가장 많은 지역 찾기

- 지역별 미세먼지 농도 비교하기

- 트위터 키워드 크롤링으로 워드 클라우드 그리기

- 지하철역 주변 아파트 가격 알아보기

 

사실 R을 다루는 입문서에서는 이와같이 세부 사례를 제공하는게 조금 부담스럽습니다. 그래서 대부분의 책들은 원론을 중심으로 통계분석을 다루죠. 이 책은 이런 점이 기존의 책과 차이점이 있습니다. 어디서 데이터를 얻고, 어떻게 분석하는지 이해하기 쉽게 설명되어 있습니다. 취업을 준비하는 학생들에게는 이러한 내용을 통해 좀 더 차별화된 콘텐츠를 개발한다면, 업무 포트폴리오 작성에 큰 도움이 될 것 같습니다.

 

 

R데이터 분석에 관해 관심을 가지고 있는 사람, 혹은 데이터를 어떻게 분석해야할지 모르는 상태에서 읽기 좋은 책인것 같다.

대용량 분석에 활용하기에는 많이 부족하지만, 데이터의 형태, 분석의 방법론을 이해하기에는 기본기가 좋은 책임에 틀림 없다.

데이터 분석을하기위하여 TXT, CSV, Excel 데이터등을 활용하여 실무에서 사용 할 수 있는 가능한 범위 내에서 설명을 잘해 놓아서 책의 내용대로 따라하다보면 어느세 데이터 분석에 재미를 느끼고 있을 것이다. 또한 공공데이터를 가지고 분석을 하는 부분이 가장 재미있게 느껴졌는데 이 예제가 데이터 분석을 어떻게 응용할수 있는지에 생각을 키워준 것 같다.

이책은 여러 처음 시작하는 시리즈와 비슷한 맥락으로 무겁지 않고 가볍우면서도 쉽게 데이터 분석을 접근 하도록 하는 책이기에 데이터 분석 입문을 하는 사람에게는 꼭 추천을 해주고싶다.

R. 본인은 잘 R 지 하는 미지의 언어. 

작년에 특히나 많이 쏟아져 나온 데이터 분석 도서들은 크게 R 파이썬 도서로 구분된다. '')

 

표지에는 '7 완성 로드맵' 이라고 적혀 있음

노우. 이렇게 적혀 있는 책으로 뭔가 완성하신 분을 적이 없는데

어째서 이런 제목의 책들은 계속 나오는 것인지 굳이 고찰할 필요는 없고. '')

첫째날, 둘째날은 

R R 스튜디오 설치 일단 hello world 출력해보고,

변수, 함수, 라이브러리 패키지 인스톨, 데이터 형태를 살살 익혔다

아직은 수월해 수월해.

셋째날은 

엑셀, txt, csv 등의 데이터 파일 로드하는 방법을 익히고

R 스튜디오로 작업하는게 매우 편하다는 것을 알려줌. '')

넷째날부터는 익혀야 것들이 폭발한다.

데이터 가공을 위한 연산자들과 함수들, 파생 변수 생성 방법, 그리고 이들을 기반으로 데이터 전처리 방법과 그래프 (줄기 그림, 히스토그램, 막대 그래프, 상자 그림

데이터 분석을 위한 패키지들의 소개와 찾기, 설치 방법과 컴퓨터 동일한 패키지 환경 만들기.

이미 7 완성은 글렀어. 글렀다구. '-');

이제 날짜를 적는 것이 의미가 없어짐.

reshape2 (데이터 구성 변경), KoNLP (한글 분석), dplyr(데이터 가공), googleVis, ggmap

데이터를 주무르기 위한 유용한 패키지들에 대한 소개가 펼쳐지고

'데이터 분석 실전 프로젝트' 라는 제목으로 특정한 몇가지 주제들에 관해 

데이터 수집부터 전처리, 분석 시각화 단계를 하나하나 살펴 보는데, 이것이 책의 백미인 것이다

'')b 

물론 한권만으로 데이터 분석 짱짱맨이 수는 없지만

입문용으로 좋은 점수를 있는 책이라 생각한다.

 

무엇보다 지루하지 않아서 좋아요. 

 

7일 완성 로드맵 보고, 2일차 까지만 읽고 나머지는 다음에 읽을려고 했는데 단숨에 부록까지 읽게되었습니다. 

물론 실습없이 내용만 먼저 봤어요. 책에 입력과 출력값이 잘 나와 있어서 실습 없이도 큰 의문 없이 술술 읽혀요. 

마지막에 실 데이터로 그래프 그려보는 예제들이 있어서 원하는 데이터를 당장 분석할 수 있을것만 같은 의욕이 불끈 솟아납니다. 

 

어렵게만 느껴지는 통계분석기법에 대한 후속편도 나왔으면 좋겠습니다. 

 

 R을 알고는 싶은데 어려울 것 같아 막연하셨던 분들이 보시면 좋을 것 같습니다. 물론 전문적으로 하시는 분들이 보기에는 너무 쉬운 부분이라 느낄 수 있을 것 같지만, 가볍게 '이런 거구나!' 느끼기엔 좋은 책인듯 합니다.

  

 

 R 스튜디오에 대한 설치, 툴 사용법부터 시작하는 이 책은 개발에 관련이 없으신 분들도 비교적 쉽게 접근 할 수 있도록 신경쓰신게 느껴집니다. 또한 R 개발에 대한 문법보다, 엑셀에서 데이터를 목적에 맞게 정제해 내가 원하던 데이터를 뽑아내고, 이를 보여주고 싶은 그래프로 표현할 수 있는 방법들을 보여주는데 초점이 맞춰저 있는 것 같습니다. 간단간단하게 만들 수 있는 예제들은 내가 만든 코드들이 바로 시각화되니 해보는 재미도 있었습니다.

 

 유튜브에 강의 채널도 있어서 같이 보니까 이해하기도 더 쉬웠습니다.

 
 

책 가독성이 높게 작성되어 있고 실습을 위주로 만들어져 있습니다.

 

Rgui, R Studio 설치 후 빠르게 접근이 가능하며, 예제 실습 부분에서 한글이 깨진다는 부분이 있다고 하는데 아직 거기까지는 못해봤습니다.

처음 시작하는 R 데이터 분석.jpg

 

'시추에이션이 좋아~'

 

요즘은 언제 배우는지 모르겠지만 수학 시간에 배웠던 집합을 떠올리면 좀 더 이해하기 쉬울거라 생각합니다. 마이크로소프트 엑셀에서 이런저런 함수를 사용해 본 경험이 있다면 어렵지 않게 따라할 수 있습니다.

 

집합과 더불어 수학 시간에 들어봤음직한 개념이 하나 더. 블랙박스를 비유삼아 설명하곤 했던 ‘함수’.
개념이라고 해서 거창하게 나갈 것도 없이 그저 '불러줄 이름이 있고, 이름과 함께 필요로 하는 조건을 갖춰주면 결과를 보여준다' 정도만 알아도 충분합니다.

 

이정도 개념에 거부감이 없다면 책 앞부분에 있는 학습 로드맵을 따라 매일 많은 시간을 할애하지 않고도 재미있게 읽을 가능성이 크다고 봅니다. 하지만, 함수라는 말조차 생소하거나 어렵게 느껴진다면 로드맵은 생각하지 말고 그저 따라가기만 해도 어느새 가까워질 수 있지않을까 합니다.

 

책의 구성이 많은 걸 알려주려고 무리하게 우겨넣는 분위기는 아닙니다.
배우고자 하는 의욕이 크신 분은 부족함을 느낄 정도입니다. 아쉬운 듯한 구성이 오히려 끝까지 볼 수 있도록 하는 요인 가운데 하나라고 생각합니다.

각 부분이 끝날때마다 내용을 정리해 놓아 지난 내용들을 떠올리며 되짚어볼 수 있습니다. 그리고 앞에 나왔던 내용이라도 뒤에서 관련이 있으면 짤막하게 언급하여 기억을 환기시켜 줍니다.

설명 중간중간에 있는 팁도 알찹니다. 본문에서 기본 내용을 얘기했다면 팁에서는 조금더 실용적이거나 알아두면 도움이 되는 내용들을 간략하게 알려줍니다.

이렇게 읽다보면 어느새 책 내용이 끝납니다. 이게 전부(?)라는 느낌이 들 정도입니다. 그리고 4가지 실전 프로젝트를 만납니다. 또다른 출발이자 실전을 앞둔 스파링 정도로 생각하면 될 듯합니다.

 

아쉬운 부분이 있다면 데이터 모양을 전환하는 함수 설명이 선뜻 와닿지 않습니다. 이렇게, 조금 어려울 듯하면 '그런것도 있구나' 하며 지나가고 다음을 기약하면 됩니다.

 

재미있는 이야기를 읽은 느낌입니다.
책을 읽고나면 이정도만으로 충분하다는 분들도 있을테고, 자신의 이야기를 덧붙여 나가고 싶은 분들도 있을 거라 생각합니다.
개인적으로는 후자입니다.

 

 

이 책은 <Hello Coding> 시리즈이다. 동 시리즈의 다른 도서인 <개념부터 처음 배우는 프로그래밍>, <쌩초보의 처음 프로그래밍 파이썬> 등의 도서와 같이, 비전공 초보자가 쉽게 이해할 수 있는 상세한 설명이 장점이다. R 언어도 모르고, 데이터 분석도 처음인 사람들을 주 독자층으로 한다. 코딩/수학/통계 셋 모두를 전혀 몰라도 이해하고 따라하는데 전혀 지장이 없을 것으로 보인다. 

 

그만큼 내용이 쉽다. 지금까지 읽어본 모든 R 관련 도서 중에 가장 쉬운 책이다. 표지에 7일 완성이라고 적혀있지만, 프로그래밍에 조금의 지식이 있는 사람이라면 3~4일이면 완독할 수 있는 내용이다. 총 300페이지가 넘으니 그리 작은 분량은 아니지만, 많은 스크린 캡처와 상세한 설명이 상당한 분량을 차지하고 있는 것으로 생각된다.

 

R & RStudio 설치와 환경 설정부터 시작해서 R언어 기초 문법, 필수 패키지와 함수를 거쳐 '치킨집이 가장 많은 지역 찾기' 등 간단한 데이터 분석 프로젝트까지 진행하며 가장 좋았던 점은 막힘이 없다는 것이었다. 중간에 독자가 이 정도는 알아서 하겠거니 하고 뛰어넘거나 생략하는 부분이 거의 없다. 오히려 입문자 입장에서 쉽게 혼동하거나 어려움을 겪을만한 거의 모든 지점에 TIP이나 별도의 설명이 추가되어 있었다. 

 

이 책은 진도도 쑥쑥 나가고 재미도 있다. 그런데 책을 완독한 후에 혼자서 간단한 프로젝트를 진행할 수 있는가라면 그에 대한 답은 '아니오'이다. 이 책으로 R을 사용하는 데이터 분석에 대한 전체적인 그림을 그리고 난 후 공부를 한참 더 해나가야 한다. 수학으로 따지면 사칙연산을 막 배운 직후라고 해야 할까. 

 

입문서의 가장 큰 미덕은 독자가 어떤 새로운 분야에 대해 감을 잡을 수 있게 해주는 것이라고 생각한다. 이 책은 R 기초, RStudio 사용, 데이터 분석의 전체적인 흐름 모두를 즐겁게 맛볼 수 있게 해준다. 마치 유튜브 강의를 보면서 따라하는 것과 같은 편안한 경험을 주는 즐거운 책이었다. 

 

안녕하세요. 

처음 시작하는 R 데이터 분석.jpg

 


바로 요즘 대세 of 대세인 '데이터 분석' 입문자를 위한 책인 '처음 시작하는 R 데이터 분석' 리뷰입니다.

아래와 같이 네이버에서 검색해도 나옵니다.

처음 시작하는 R 데이터 분석

저자 강전희, 엄동란

출판 한빛미디어

발매 2018.10.05.


요즘 빅데이터, AI 이런 말을 흔하게 들을 수 있죠? 그 중에서 빅데이터는 뭔가 데이터 분석과 관련이 있어 보이지 않나요?

맞습니다.
빅데이터를 분석 및 연구하는 것을 데이터 과학이라고 하고 그러한 연구에 쓰이는 프로그래밍 언어 중 하나가 바로 'R'입니다.

그래서 이 책은 크게보면 데이터 과학에 입문하기 위한 첫걸음을 뗄 수 있도록 해주는 책입니다.

빅데이터?프로그래밍?... 난 그런거 모르는데...

라고 걱정하실 필요가 없습니다. 앞서 말했듯이 입문자를 위한 책이고 R은 우리가 흔히 아는 SW개발자의 프로그래밍 언어와는 전혀 다릅니다. 오히려 행렬에 대한 수학 지식이 많으면 훨씬 유리합니다.

이 책에서는 R 프로그래밍을 하기 위한 환경설정도 친절히 안내하고 있습니다. 프로그램 설치는 물론이거니와 도움말 사용법까지 안내되어 있습니다. 심지어 글꼴 테마 설정까지 안내되어 있으니 걱정은 No, No입니다.

그렇다고해서 기존의 SW개발자분들도 겁낼 필요가 없습니다. 완전히 다른 분야구나...라고 생각하지 않아도 됩니다. 문법은 기존 개발언어와 다를 수 있지만 기본적으로 함수를 호출하고 결과값을 가공하는 등의 행위는 프로그래밍 능력이 있다면 이해하는데 훨씬 도움이 됩니다.

(그리고 역시나 최초 예제는 Hello World 출력하기 입니다!!)

그리고 이 책의 큰 특징이면서 마음에 들었던 점은 내용을 요약해주는 부분이 있습니다. '한 입에 쏙!'이라는 코너인데 내용을 정리하거나 추후에 되새김질 할 때 아주 도움이 될 것 같습니다.

그리고 많은 프로그래밍 책들이 간과하는 부분이라고 생각하는데 이 책에는 '연습문제'가 있습니다. 프로그래밍도 결국 숙달이 필요하고 반복적을 통해서 자연스럽게 체득(문법의 암기, 알고리즘 활용 등)이 가능합니다.

창의성이 중요하니 알고리즘 능력을 타고 나야한다 같은 소리는 그 이전에 피나는 노력을 배제한 나쁜 핑계라고 생각합니다. (창의성도 모방에서 온다는 소리도 있잖아요. ㅎㅎㅎ)

그래서 연습문제가 간단하게라도 있는 점이 참 좋습니다. 개념을 읽고 '아~'하고 넘어가는 것과 정말 간단한 것이라고 직접해보는것은 천지차이니까요.

그러니까... 데이터 데이터 지겹게 듣는 데이터!! 한 번 뭔지 알아보자! 하는 비전공자 일반인부터 통계를 전공하고 R 프로그래밍이 필요한 초보자, 내가 개발자인데 데이터도 알면 좋지 않을까? 고민하는 분들까지 모두 R 프로그래밍을 배우고 싶다면 쉽게 씌여진 이 책으로 시작하면 좋을 것 같습니다.

 

<이 책의 리뷰는 한빛미디어 '책 읽는 프로그래머'로 부터 책을 지원받아 작성된 글입니다.>



 

빠르고 재밌게,

풍부하고 흥미로운 실습 예제로 R 데이터 분석에 입문한다!

 

7일 완성 로드맵에 따른 체계적인 학습

무엇이든 입문할 때 가장 어려운 것이 ‘어떻게 시작하는가?’이다. 이 책에서 제공하는 [7일 학습 로드맵]에 따라 차근차근 학습한 후 하루 만에 끝내는 요약 정리, 4가지 실전 프로젝트로 복습하면 어느새 실제 업무에서도 활용하고 있을 것이다.

 

R 스튜디오를 통째로 옮겨 놓은 친절한 구성

새로운 도구를 배울 때 가장 좋은 학습 방법은 직접 따라해 보면서 익히는 것이다. 하지만 이동 중, 혹은 실습 환경이 갖춰지지 않은 곳이라면? 이 책은 언제 어디서나 ‘제대로’ 학습할 수 있도록 R 스튜디오의 Script 창과 Console 창의 내용을 그대로 옮겨 담았다. 또한 1:1 과외처럼 친절하게 거의 모든 코드에 주석을 달아 독학의 어려움을 최소화했다.

 

저자 직강 동영상 강의와 편리한 질의응답 편의 제공

함께 학습하는 사람이나 주변에 도움 받을 사람이 있다면 좋겠지만, 독학 시에는 작은 도움도 크게 느껴진다. 이런 독자의 마음을 고려하여 유튜브를 통해 핵심 포인트, 혼자 하기 어려운 내용 등을 동영상 강의로 제공하고 있다. 또한 책을 보면서 궁금한 내용이 생겼을 때 저자의 GitHub에 방문하여 [Issues] 탭에서 질의응답을 할 수 있다.

 

 

 

이번에 받은 책은 강전희, 엄동란 지음의 '처음 시작하는 R 데이터 분석'이라는 책입니다.

 

R이란, 

R 프로그래밍 언어(줄여서 R)는 통계 계산[2]과 그래픽을 위한 프로그래밍 언어이자 소프트웨어 환경이다. 뉴질랜드 오클랜드 대학의 로버트 젠틀맨(Robert Gentleman)과 로스 이하카(Ross Ihaka)에 의해 시작되어 현재는 R 코어 팀이 개발하고 있다. R은 GPL 하에 배포되는 S 프로그래밍 언어의 구현으로 GNU S라고도 한다. R은 통계 소프트웨어 개발과 자료 분석에 널리 사용되고 있으며, 패키지 개발이 용이하여 통계학자들 사이에서 통계 소프트웨어 개발에 많이 쓰이고 있다.

 

- 위키백과

 

R은 통계에 주로 사용되는 프로그램 입니다. Python 과의 호환성도 좋아 최근 관심을 많이 받고 있는 언어 중 하나입니다.

 

통계에 관련 되어 있다고 하니 사용하기 어려울 것 같지만 이번 책을 통해 쉽게 공부 할 수 있었습니다.

 

이 책은 제목 그대로 R을 처음 사용 하시는 사용자에게 정말 좋은 기초서가 될 것 같다는 생각을 했습니다. 설치부터 예제, 설명등

 

이 수학에 관심이 없고 프로그램 언어를 모르는 입문자도 이해할 수 있도록 되어 있다는 점이 포인트입니다.

 

 

 

 

책은 Yes24 기준으로 R을 검색했을 때에는 인기가 가장 좋은 책으로 나옵니다.

 

7일 완성! 이라는 타이틀이 있듯이 단기간에 배우기 좋은 책입니다. 꼭 7일 내에 해야하는 것은 아니기 때문에

 

천천히 공부를 하시는 것도 나쁘지 않다고 보여집니다.

 

추가적인 장점 중 하나는 동영상 강의가 있어서 책만 보고 이해가 되지 않는 부분에 대해 강의를 볼 수 있습니다. (강의주소는 상단 표시)

 

 

기초적인 부분이라 쉽게 넘어가는 부분일 수 있지만 실제로 가장 중요한 부분입니다.

 

모든 통계에 있어서 가장 중요한 것은 어떤 데이터를 가지고 문제를 해결 하려고 하는 지와

 

그 데이터가 얼마나 정확하고, 깔끔하게 정제되어 있는지 입니다.

 

실무에 있다보면 프로젝트에 사용 된 데이터가 잘못되었다는 것을 프로젝트 중간에 알아차리고

 

처음부터 다시 개발하는 경우도 많습니다. 그만큼 데이터의 추출과 정제가 중요하다고 볼 수 있습니다.

 

 

 

 

 

 

책 후반부에는 R을 통해 워드클라우드, 명사 추출등을 진행하는 예제들도 많이 나옵니다.

 

실제 Python으로도 가능한 것들을 R을 통해 구현 할 수 있는 예제를 제공해주는 부분이 좋았습니다.

 



출처: http://remover.tistory.com/155 [Remover]

 

처음 시작하는 R 데이터 분석1.jpg

 

1. 소개

 처음 시작하는 R데이터 분석 진짜 데이터 분석이라는 분야를 처음 접하는 개발자입니다. 데이터 분석이라면 빅데이터를 가지고 있는 기업이나 회사에서 사용할것 같지만 이 책을 읽으면서 공공데이터를 가지고 할 수 있는것들이 있다는 것과 R이라는 언어를 왜 배워야하는지 알수있습니다.

처음 시작하는 R 데이터 분석3.jpg

 

2. 책의 구성

- 표지 :  7일 만에 R을 학습하고 실전에 적용할수 있는 예제가 포함되어있습니다.

저는 개발자지만 예제까지 하는데 10일정도가 걸렸네요^^;

 

처음 시작하는 R 데이터 분석2.jpg

 

 

- 내부 구성 : 대단원 Part와 소단원 Chapter로 구성되며 (여기서잠깐!, Tip, 주의) 등의 참고 사항이 있다. 어떤 개념에 대한 설명이 끝난 후 직접 적용해볼수 있는 예제가 있어 공부했던 내용을 한번데 기억할수 있게 해주고, 대단원이 끝나고 있는 연습문제가 책의 구성을 더 풍부하게 해주는것 같다.

 

3. 프로젝트

 

이 책을 읽으면서 가장 마음에 들고 선택하길 잘했다고 생각했던 Part이다.

책에 나와있는 첫번째 예제를 따라하고 우리 동네의 치킨집 분표를 보여주게 바꾸었다.

 

내가 데이터 분석을 하다니!

처음 시작하는 R 데이터 분석4.jpg

 

통계나 데이터 분석 분야의 지식없이 접한거라 t검정 정도는 다 알고 있다고 판단하고 넘어갔을줄 알앗는데 친절하게 부록에 설명까지 있다.

처음 시작하는 R 데이터 분석5.jpg

 

처음 시작하는 R 데이터 분석6.jpg

 

 개발자 들이 자주 사용하는 OAuth에 대한 개념이나 통계학에서 사용하는 t 검정 등의 내용을 친절하게 설명해주고 있어 어느 분야에 있든지 접할 수 있는 책인것 같다.

본인은 프로그래머로 R이라는 언어가 어떤 언어인지

궁금하던 차에 좋은 기회를 얻어서 책을 읽게 되었습니다.

 

7일간의 코스로 되어 있는데 부록까지 포함해서

8~9일 정도로 잡으면 여유롭게 따라 읽을 수 있습니다.

 

실제로 코스대로 하루씩 따라해봤는데

모든 예제 및 데이터를 직접 치면서 따라했을 경우

1시간 ~ 1시간 30분 정도 걸리는걸 확인했습니다.

(타자 및 설치관련 OS에 익숙한 경우)

 

해당 책은 입문서 답게 쉽게 읽을 수 있을 정도로

설치부터 한단계 한단계 예시화면으로 설명을 해줍니다.

 

또한 큰묶음의 챕터가 끝나면 요약정리 및 연습문제도 존재합니다.

자세한 설명의 입문서이기 때문에 다 읽고 나서는

요약정리만 훓어봐도 다시 읽은 듯한 느낌이 들 정로로 

알차게 정리되어 있습니다.

 

맘에 드는것 중에 하나는 연습문제인데

입문서의 대부분은 따라하기에 주안점을 둬서

읽고 난 후에는 초보자가 응용해 사용하기가 

쉽지 않은 경우가 대부분입니다.

 

이책은 간단한 연습문제를 만들어 줘서 

복습 및 응용을 할 수 있도록 한것이 마음에 들었습니다.

 

다만 너무 쉬운 문제 위주여서 아쉬운 부분이 있는데

학습한 패키지의 설명하지 않은 함수를 이용한 문제가 

조금씩 들어갔으면 어땠을까 생각해봅니다.

 

아쉬운 점은 대부분의 입문서가 그러하듯이 

기초에 너무 많은 지면을 할애하다 보니

주로 많이 쓰게 되이는 부분에 대해서는 

간단하게 설명하고 넘어가는 듯한 느낌이 드는 부분이 있습니다.

 

주로 R을 사용하는 이유가 도표나 그래프를 사용하기 위해서 인듯 한데(추측)

생각보다 많은 설명이 포함되어 있지는 않습니다.

 

다만 부록으로 있는 실제 사례를 활용한 부분은

'이런식으로 R을 활용해 사용하는 거구나' 

라는 이미지를 받을 수 있어서 꼭 끝까지 읽어봐야 될 부분이라 생각됩니다.

 

이책으로 기초를 튼튼히 다지며

심화학습으로 넘어가기 위한 교두보로 사용하면 좋을 듯 싶습니다.

 

다채로운 색상과 깔끔한 구성으로 R을 처음 접하는 분들에게

좋은 입문서가 될것 같아 추천드립니다.

 

 

빅데이터 시대, 누구나 쉽게 배우는 R 데이터 분석 입문!!

누구나 쉽게 배우고 할 수 있어야 진짜 입문서다! 통계를 몰라도, 프로그래밍을 몰라도, 데이터로부터 필요한 정보를 구하는 방법이 여기 있다. R 스튜디오 설치부터 프로젝트에 기반한 데이터 추출, 요약, 데이터 분석, 데이터 시각화까지의 모든 기본기를 이 한 권에 담았다.

 

이 책을 보면?

빠르고 쉽게 R 스튜디오를 이용한 R 데이터 분석에 입문 할 수 있다.

흥미로운 실습 예제가 풍부해 실전에 바로 적용할 수 있다.

데이터 분석을 몰라도, 프로그래밍이 처음이라도, 누구나 R 데이터 분석에 재미를 붙일 수 있다.

 

데이터 분석 전문가로 거듭나고 쉽다면

 

학습 로드맵 7일 만에 끝내는 R데이터 분석


 

 

이 책을 보는 방법

이 책은  입문자도 쉽게 읽고 따라 할 수 있도록 구성되어 있습니다. 본문 내용은 학습 로드맵을 참고하여 단계별 학습이 가능 하며, 초보자의 눈높이에 맞춰 최대한 자세하게 설명 되어 있습니다.. 다양한 예제, 프로젝트, 연습문제 등을 익히다가 보면 R과 데이터 분석에 금새 친숙해질 것입니다.

 

 

 

 

저자소개

저 : 강전희

컴퓨터공학과 인공지능을 공부했고 현재는 CJ ENM에서 일하고 있다. 시스템 구축·설계·운영을 시작으로 인공지능, 빅데이터, 개인 정보 보호, 온갖 가젯과 자료 정리에 관심이 많다. 국내 최초로 MCN인 DIATV 사업을 시작한 MCN계의 화석 같은 존재로 현재는 DIATV 경험을 바탕으로 SNS 데이터 분석과 시스템 기획을 담당하고 있다.


저 : 엄동란

 

통계학을 공부한 후 컨설팅 회사에 입사하여 다양한 CRM 분석을 경험하였다. 롯데카드와 롯데멤버스에서 회원 기반의 빅데이터 분석 업무를 담당했고 현재는 CJ에서 일하고 있다. CRM 을 비롯한 빅데이터 분석, 마케팅 분야의 다양한 경험을 보유하고 있다.


목차

PART01 데이터 분석과 R 
Chapter 01 R&R 스튜디오 : 사용 환경부터 제대로 준비하자

01. R이란?
02. R을 설치하고 실행하기
03. R 스튜디오 설치와 기본 환경 설정하기
04. 스크립트 생성 및 코드 실행하기
05. 도움말 사용하기

Chapter 02 데이터 분석과 구조 : 데이터는 어떻게 생겼을까?
01. 데이터 분석 과정 알아보기
02. 데이터의 생김새와 변수와 함수

Chapter 03 데이터 종류 : 구조와 형태에 따라 데이터 이름도 다르다
01. 데이터 구조 간 관계 파악하기
02. 데이터 구조의 가장 기본인 벡터
03. 벡터를 행/열로 구성한 행렬, 행렬의 확장인 배열
04. 여러 데이터를 그룹화한 리스트, 리스트의 확장인 데이터 프레임
한입에 쏙
연습문제

PART02 데이터 분석을 위한 기본기 다지기
Chapter 04 데이터 수집 : 분석할 데이터를 준비한다

01. 원시 자료 입력 및 엑셀 파일 가져오기
02. read.table() 함수로 TXT 파일 가져오기 
03. 직관적인 메뉴로 원시 데이터 가져오기
04. R 데이터 저장하고 불러오기

Chapter 05 데이터 가공 : R은 데이터를 이렇게 다룬다
01. 데이터 분석의 기초, 연산자
02. 분석을 위한 데이터 기본 정리
03. 데이터 추출부터 정제까지, 데이터 전처리
04. 데이터 분석을 위한 기초 통계 분석 함수
05. 데이터의 이해도를 높일 수 있는 그래프
한입에 쏙
연습문제

PART03 데이터 분석을 위한 필수 패키지와 함수
Chapter 06 패키지 : R에 기능을 더하다
01. 필요할 때 추가해서 사용하는 패키지
02. 패키지 설치 및 사용 방법
03. 컴퓨터 간 동일한 패키지 환경 만들기

Chapter 07 reshape2 패키지 : 데이터의 행을 열로, 열을 행으로!
01. 가로로 긴 데이터 모양을 세로로 전환하는 melt() 함수
02. 세로로 긴 데이터 모양을 가로로 전환하는 cast() 함수

Chapter 08 KoNLP 패키지 : 한글을 분석한다
01. KoNLP 패키지와 wordcloud 패키지 설치하기
02. 애국가로 형태소 분석하기
03. 애국가 단어로 워드클라우드 만들기

Chapter 09 dplyr 패키지 : 데이터 가공 마법사
01. dplyr 패키지 실습 준비하기
02. 데이터 추출 및 정렬하기
03. 데이터 추가 및 중복 데이터 제거하기
04. 데이터 요약 및 샘플 추출하기
05. 함수와 함수를 연결하는 %% 연산자

Chapter 10 ggplot2 패키지 : 데이터 분석의 꽃, 시각화
01. ggplot2 패키지로 그릴 수 있는 다양한 그래프
02. 그래프의 이해를 높이는 객체 추가하기
03. 함께 알면 유용한 googleVis 패키지와 ggmap 패키지
한입에 쏙
연습문제

PART04 데이터 분석 실전 프로젝트 
Project 01 치킨집이 가장 많은 지역 찾기
01. 업종별 데이터 다운로드 및 기초 가공
02. 데이터 가공 및 트리 맵 표현하기

bProject 02 지역별 미세먼지 농도 비교하기
01. 서울시 대기 환경 정보 다운로드
02. 상자 그림으로 시각화 및 t 검정

bProject 03 트위터 키워드 크롤링으로 워드클라우드 그리기
01. 트위터 API 사용하기
02. 트위터 키워드 검색 및 워드클라우드 표현

bProject 04 지하철역 주변 아파트 가격 알아보기
01. 공공 데이터 다운로드
02. 지하철역 데이터 가공하기
03. 아파트 실거래가 데이터 가공하기
04. 구글 지도에 지하철역과 아파트 가격 표시하기

bAPPENDIX부록
Appendix 01 통계 분석 기법 맛보기
Appendix 02 연습문제 정답
 


출판사 리뷰

1. 빠르게 배워 실무에서 R 데이터 분석을 이용하려는 직장인
2. 경제, 경영, 통계학 등 데이터 분석이 잦은 학과 전공자
3. 데이터 분석에 입문하려는 컴공 전공자

빠르고 재밌게,
풍부하고 흥미로운 실습 예제로 R 데이터 분석에 입문한다!

7일 완성 로드맵에 따른 체계적인 학습
무엇이든 입문할 때 가장 어려운 것이 ‘어떻게 시작하는가?’이다. 이 책에서 제공하는 [7일 학습 로드맵]에 따라 차근차근 학습한 후 하루 만에 끝내는 요약 정리, 4가지 실전 프로젝트로 복습하면 어느새 실제 업무에서도 활용하고 있을 것이다.

R 스튜디오를 통째로 옮겨 놓은 친절한 구성
새로운 도구를 배울 때 가장 좋은 학습 방법은 직접 따라해 보면서 익히는 것이다. 하지만 이동 중, 혹은 실습 환경이 갖춰지지 않은 곳이라면? 이 책은 언제 어디서나 ‘제대로’ 학습할 수 있도록 R 스튜디오의 Script 창과 Console 창의 내용을 그대로 옮겨 담았다. 또한 1:1 과외처럼 친절하게 거의 모든 코드에 주석을 달아 독학의 어려움을 최소화했다.

저자 직강 동영상 강의와 편리한 질의응답 편의 제공
함께 학습하는 사람이나 주변에 도움 받을 사람이 있다면 좋겠지만, 독학 시에는 작은 도움도 크게 느껴진다. 이런 독자의 마음을 고려하여 유튜브를 통해 핵심 포인트, 혼자 하기 어려운 내용 등을 동영상 강의로 제공하고 있다. 또한 책을 보면서 궁금한 내용이 생겼을 때 저자의 GitHub에 방문하여 [Issues] 탭에서 질의응답을 할 수 있다.
동영상 강의 : https://bit.ly/HelloJany
GitHub : https://github.com/newstars/HelloR


추천평

이세행(네이버 클로바) : R이라고 하는 생소한 언어를 쉽게 설명하여 첫걸음을 내딛기가 수월했습니다. 

김승희(다우기술 서비스개발본부) : 이 책 덕분에 데이터를 분석하고, R을 사용하는 게 그리 어려운 게 아니라는 걸 알았습니다.

김경식(엑셈 빅데이터 개발자) : ‘비전공자도 볼 수 있는 R 데이터 분석’이란 말이 가장 먼저 떠오를 만큼 누구나 이해하고 따라 할 수 있는 책입니다.

김유(한국IBM 마케팅팀) : 빠르면 일주일, 넉넉하게 한 달이면, 소셜 데이터를 수집하고 데이터를 분석, 시각화하고 있는 자신을 발견할 수 있을 것입니다.

강전영(뉴욕주립대 버팔로 지리학과 박사후 연구원) : R 초보자들이 기초를 파악하고, 프로젝트에 적용할 수 있게 도와주는 ‘가이드’가 되는 책입니다.

처음 시작하는 R 데이터 분석

 

 

최근 4차 산업혁명이 대두되면서 주변에 많은 변화가 일어나고있다.

컴퓨터는 그저 '사무용' 혹은 '게임용'이라고 여겨지던 이전과는 달리 가상에서 머무르지않고 현실과 밀접한 관계가 생기고 있다.

얼마전 한창 시끄러웠던 '코인' 대란과 알파고 vs 이세돌9단의 바둑대결이 대표적인 사례이다.

사람들은 이 사건들로인해 컴퓨터 기술이 현실에 엄청난 영향을 줄 수 있음을 깨닳았을 것이다.

이런 기술력들이 현실에 나타나면서 ''4차 산업혁명'이라는 잘 와닿지 않던 말도 사람들에게 가깝게 다가왔을 것이다.

이러한 분위기에 편승하여 이제는 컴퓨터를 전공하지 않은 사람들도 관련 기술들을 연구하기 시작했는데,

머신러닝, 블록체인, 인공지능 이 대표적인 예이다.

하지만 이 모든것들은 수많은 양의 데이터, 그리고 그 데이터들의 분석으로 시작한다.

 

이 책은 그런 데이터 분석에 사용되는 기술을 설명하고 사용 방법을 알려준다.

책에도 써있는 'R'이라는 문자는 언어이다.

언어라는것은 컴퓨터 기술을 구현할때 사용되는 문자로써, 사람들이 컴퓨터가 알아듣도록 만든 문자체계이다.

C언어, JAVA, PYTHON등이 그 대표적인 예이고, R은 4차산업혁명의 물살을 타고 인기 상승중인 언어중에 하나이다.

잘 모르겠다면 간단히 '일본어는 일본사람이 알아듣게 만든말이고, 중국어는 중국사람이 알아듣게 만든말이고,

R은 컴퓨터가 알아듣게 만든말 중에 하나이다' 라고 이해하면 될것이다.

위에서 언급한것처럼 컴퓨터에서는 다양한 언어들이 사용되는데 일반 사람들이 컴퓨터에 그 언어를 전달하기는 쉽지 않다.

그래서 언어를 만드는 사람들은 컴퓨터가 언어를 알아듣기 쉽게하기위해 그 언어를 쉽게 사용할 수 있는 툴을 만들어준다.

여러가지 툴들이 있지만 이 책에서는 R스튜디오라는 유명한 툴을 사용한다.

이 툴의 설치방법과 사용방법을 자세하게 설명하고, 우리가 사용할 데이터 활용을 위해 데이터를 어떻게 가공할 것이며,

어떻게 사용할 것인지등이 설명되어있다.

 

통계를 공부하고 있거나 언어 한두가지는 사용할 줄 아는 컴퓨터 전공자들이라면 약간의 공부를 통해 쉽게 사용할 수 있겠지만,

기초가 부족하거나 잘 모르겠다 싶은 독자들을위해 목차에서는 선행학습을 위해 다른 챕터를 먼저 읽어도 상관없다고 친절하게 설명하고 있다.

이렇게 3장 전까진 R과, 데이터 분석에 활용되는 기술에 대한 설명, 툴 활용 설명등의 이론학습이 끝나고 본격적으로 실습이 시작된다.

 

상당히 지루한 작업 일 수도 있지만, 독자들이 흥미를 잃지 않게끔 워드클라우드와 같은 재미있는 예제를 실습해보거나,

데이터에 따른 다양한 그래프 결과물을 통해 시각적으로 즐거움을 선사한다.

 

이렇게 이론을 실체화 시키는 실습을 통해 연습을 마치고 나면, 현실세계에서 사용되고 있는 데이터들을 활용해

프로젝트의 느낌으로 실습을 한다. 흥미로운 데이터들이 많은 것 같다.

 

저는 컴퓨터전공 대학생으로써, 전공책을 볼 때 가장 중요한것은 프로젝트라고 생각합니다.

처음부터 어떤걸 해야 할지 막막할때 혹은 뭔가 만들어보고 싶은데 지식이 별로 없을때,

가이드가 되어주는 그런 책이 정말 소중하고 감사하게 생각됩니다.

때문에 '흰것은 종이요, 검은것은 글씨니'와 같은 이론책은 별로 좋아하지도 않고 읽히지도 않습니다.

첫째도 실습, 둘째도 실습, 실습이 구현되고 나서 이론을 해도 늦지 않다고 생각합니다.

 

'처음 시작하는 R 데이터 분석'은 저의 요구사항처럼 '실습'위주로 구성되어 있기 때문에 마음에 듭니다.

독자가 한단계씩 밟아 나아갈수 있도록 도와주며, '몇 일차'의 구성으로 사용자의 의욕을 끌어내고 있습니다.

(책에서는 7일 안에 끝낼수 있다고 하지만, 시간이 어마어마하게 넉넉한 사람이 아니면... 불가능한 일이라고 생각합니다.)

 

최근에 나오는 컴퓨터공학 서적들은 일반인들도 배울수 있도록 배려를 하며 만드는것이 예전 컴퓨터공학 서적들보다 쉬워진 이유라고 생각하며,

좋은 현상이라고 생각합니다.

 

책은 별로 두껍지 않으며, 알차게 구성되어있어 데이터 분석에 관심이 많은 사람이라면 한번쯤은 읽어보는것을 추천합니다!

 

- 요약

1. 4차 산업혁명이 도래하며 일반인들도 컴퓨터공학에 관심이 생겼다.

2. 4차 산업혁명을 이끄는 기술 중 근본이 되는것이 '데이터', 이 데이터를 활용하는 언어중에 하나가 'R'이다.

3. 이 책은 'R'을 활용할 수 있는 툴의 설명과, 데이터 분석에 관련된 정보를 그림을 통해 독자들에게 쉽게 다가가려고 한다.

4. 데이터 분석에 대한 이론을 어느정도 익혔다면, 실습을 해보자 하면서 책이 독자들을 이끈다.

5. 어느정도의 실습이 끝나면 프로젝트 형식으로 실생활에 사용되는 데이터를 활용한 실습을 하는데 이게 정말 마음에 든다.

 

- 장점

1. 차근차근 밟아나가는 느낌의 구성

2. R스튜디오 설치과정과 활용방법이 들어가며 처음 접하는 독자들을 배려

3. 다양한 그림을 통해 독자들을 지루하지 않게 배려

4. 연습문제의 배치로 독자들이 익힌 내용을 다시한번 상기시킴

5. 실습 난이도가 쉬운것부터 점점 난이도가 올라가며 흥미로운 데이터를 활용하는것

6. 싸고 페이지가 많지않음(약 300 페이지) 

7. 디자인이 예쁨

 

- 단점

1. '몇 일 완성'은 독자를 너무 몰아붙이는 느낌이 있지않나 싶어서 개인적으로는 별로

2. 딱히 없음

 

 

처음시작하는R데이터분석.jpg

 

 

내가 R 이라는 언어를 처음 접한 때는 2015년 1월 경 courseraR Programming 이라는 수업에서였다. 통계에서 쓰는 언어는 SPSS, SAS 를 많이 들어봤고 공부도 해본 적이 있었지만 R 은 그때 처음으로 제대로 공부해 보았다. python 을 연상하게 하는 간결한 문법과 직관적인 사용법, 다양한 라이브러리와 오픈 소스 개발이 인상적이었지만 아쉽게도 그 당시에는 우리말로 된 교재를 찾아보기 힘들었다. 정확히 말하자면 대학교재들은 있었지만 일반인이 알기 쉽게 쓰인 책은 거의 없었다고 생각한다.거의 4년이 지난 지금 우리말로 된 R 교재는 번역서와 국내 저자가 쓴 것을 합쳐 100여 권에 이를 정도로 많다. 짧은 시간에 이렇게 많은 책이 나온 데는 기계학습과 빅 데이터의 발전으로 R이 업계에서 차지하는 위치가 이전과는 비교할 수 없을 정도로 높아진 것이 한몫할 것이다. Stackoverflow 의 2018년도 개발자 설문조사에서 R 은 세계에서 19번째로 가장 많이 쓰이는 언어였다. 또 r4stats.com 의 2017년 Job Report 에서 R 은 SAS 를 제치고 Data science 분야에서 5번째로 사랑받는 언어가 되었다(SAS 는 7위, SPSS 는 14위).R에 대해서 많은 책이 나와 있기 때문에 R 에 관심이 생겨서 당장 뭐라도 해보고 싶은 사람들은 교재의 선택에 어려움을 겪을 수 있다. 나같은 경우 한 분야에 입문하기 위해서는 두꺼운 책보다는 얇은 책을 선호하고, 튜토리얼이 세세하게 느껴질 정도로 꼼꼼하게 되어 있는 책을 좋아한다. 이 책은 그런 조건에 부합하고 있다. 풀컬러이며, 책의 시작 부분인 R과 RStudio 의 설치 안내 부분도 빨간색 박스로 눌러야 할 버튼을 강조해가면서 길을 헤매지 않도록 친절하게 안내해주고 있다. github 과 출판사 홈페이지에서 소스코드도 제공하고 있다. 사실 입문서이니만큼 소스코드의 양은 많지 않지만 여기서 쓰는 데이터를 받기 위해 소스코드를 받아야 했다.정리하면 이 책은 초급자와 R을 처음 접하는 사람에게 좋은 입문서이다. 반대로 더 자세하고 많은 내용을 기대하는 중급 이상의 사용자들에게는 권하고 싶지 않은 책이다. 그런 분들에게는 시중에 이미 우리말로 되어 있는 두껍고 다양한 책들을 권하고 싶다.

처음 시작하는 R 데이터 분석

저자 강전희, 엄동란

출판 한빛미디어

발매 2018.10.05.

 

<처음 시작하는 R 데이터 분석>
이 책의 대상자는?

많은 양의 데이터를 바탕으로 한 프로젝트를 기획 및 개발을 해야 하는 사람.
빠른 시간 내에 R 프로그래밍 언어를 습득해야 하는 사람.
데이터를 가공해서 차트로 표현해야 하는 사람.
엑셀 데이터를 분석 및 가공하는 일을 하는 일반 사무직.

이 책의 주제는?

R 프로그래밍에 대한 입문 서적으로, 설치부터 기본적인 활용까지 빠른 시간 내에 습득해서 실무에서 적용할 수 있도록 하는 책입니다.

이 책을 읽는 데 걸리는 시간?

프로그래밍을 한 경험이 있다면, 2~3일 정도면 충분하고,
사전지식이 없다고 하더라도 일주일 남짓이면 읽을 수 있습니다.
책에서는 일주일을 기준으로 목차가 잡혀 있는데
총 239페이지의 얇은 책으로,
설치 및 기본 개념 설명하는 데에 하루로 잡혀 있을 정도로 널널하게 짜여 있습니다.
그동안 엑셀 등으로 데이터를 다루는 일을 해온 경험이 있다면,
(이해가 좀 더 빠르다고 가정하고) 일주일도 걸리지 않을 것 같아요~

책의 짜임새

일주일을 기준으로 1일차부터 7일차까지
1일차 : 학습 및 준비하기
2일차 : 데이터 수집 및 가공
3일차 : 데이터 분석 과정
4일차 : 데이터 행렬 전환
5일차 : 한글 분석하기
6일차 : 데이터 가공 마법사
7일차 : 데이터 시각화
로 로드맵이 짜여져 있습니다.

<처음 시작하는 R 데이터 분석>

간단한 설명과 함께 때로는 시각화된 자료가 처음에 나오고,
또 간단한 예제와 결과가 나와 있습니다.
연습문제도 있지만, 뭔가 하나 설명할 때마다 예제들이 있어서 학습한 걸 바로바로 적용할 수 있는 예제가 많다는 점이 마음에 들었어요.

특히 마음에 들었던 점은 여기서 잠깐! 이라고 해서,
책을 볼 때 뭔가 '이렇게 해 보면 어떨까?', '이런 것도 되지 않을까?', '이런 건 왜 안 되지?' 라고 생각되는 부분이 있을 때 이런 의구심을 바로바로 풀어줬던 것입니다.
팁도 많고 부가 설명도 있는 좋은 파트입니다.

실무에 바로 적용, 응용할 수 있을 것 같은 실전 프로젝트도 네 개가 있습니다.
(치킨집이 가장 많은 지역 찾기, 지역별 미세먼지 농도 비교하기, 트위터 키워드 크롤링으로 워드클라우드 그리기, 지하철역 주변 아파트 가격 알아보기)

한 입에 쏙! 이라는 파워풀한 요약 정리 끝에 연습문제가 있다는 것도 좋은 구성이었습니다.
학습한 것들을 한 번 시각화된 자료와 함께 정리를 한 후에 문제풀이를 하니까 머릿속에 더 잘 박히는 느낌!

아쉬웠던 점?

기획자나 개발을 막 시작하는 입문자용으로는 정말 좋았지만, 입문 서적이라는 것이 좀 아쉬웠네요..!!
책의 구성도 좋고 설명이나 예제가 깔끔하고 보기도 좋아서 매우 마음에 들었는데,
입문용인 만큼 깊이가 있는 내용을 "많이" 다루지 않았다는 것이 안타까웠습니다.
보통 개발 서적의 두께를 생각하면 이 정도의 두께에 담을 수 있는 내용은 정말 모두 담았다고 봐야죠..!
입문서가 갖춰야 할 것들은 모두 갖춘 책이지만, 그래서 아쉬운 책이에요...
이 책의 저자가 이보다 깊이 있는 내용을 다룬 책을 쓴다면 살 의향 100%인데 말이에요 ㅎ;;

새로운 것을 시작하는 것은 언제나 즐거운 일입니다. 그리고 그 새롭게 시작하는 일이 시대적인 흐름에 중심에 있는 일이라면 더욱더 즐겁고 기대가 되는데요. 이번에 소개드릴 책은 'R 네이버 분석'이라는 책으로 요즘 이슈인 빅데이터를 다루는 R 스튜디오 사용법과 실무에서 활용 가능한 여러 기능과 예시를 학습할 수 있는 책입니다. 사실 이 책을 접하기 전에  R 스튜디오에 대해서도 전혀 알지 못해서 어떠한 선입견 없이 새로운 프로그램 와 빅데이터를 다룰 수 있을 거라는 기대감에 여러 번 읽으면서 직접 실습을 해보았던 책이기도 합니다.  

 

책에 대해서 소개를 하자면 앞서 말씀드린 것처럼 R 스튜디오에 대한 인문서이며, 직접 따라 할 수 있는 실습 예제와 함께 예제를 따라 했을 때 화면에 출력되는 결과들을 담고 있는 전형적인 프로그램 책입니다. 책의 디자인이나 구성은 한빛미디어에서 출판한 말끔 깔끔하고 필요한 내용들만 담겨있었고 다만 아쉬운 점이었다면 입문서인 만큼 조금 더 전문적인 그리고 실무에 가까운 활용에 대한 부분은 조금은 부족하다는 생각이 들었습니다. 

책을 직접 따라 하면서 느꼈던 점이라면 R 스튜디오가 가지는 여러 장점들. 쉽고 간편하다 그리고 무료이다.라는 것을 느낄 수 있었고 다른 빅데이터를 처리하는 프로그램과도 비교하면서 읽어보았는데요. 프로그래밍에 대해서 전혀 모르거나 처음 빅데이터를 접하는 이들에게 R 스튜디오는 좋을 것 같다는 생각이 들 만큼 간단하면서 직관적인 부분이 많다고 생각이 듭니다. 또한 다른 측면에서는 가볍게 빅데이터의 개념에 대한 학습하고 싶으시다면  R 스투디오를 추천합니다. 그리고 다른 R 스튜디오에 대한 서적을 접하지는 못했지만 'R 데이터 분석'은 기본에 충실하면서 빅데이터와 R 스튜디오에 흥미를 느낄 수 있는 여지를 많이 남겨놓은 입문서라는 느낌을 받기에 충분했습니다. 

 

책에 소개되어 있는 예제들은 처음 프로그램을 배웠을 때, 접하게 되는 여러 프로그래밍 입문서들과 비슷한 수준으로 작성되어 있는데요. 프로그램에 대해서 전혀 모르는 사람이라도 쉽게 접근할 수 있을 만큼 친절하게 설명되어 있었습니다. 또한 단순하게 보고 따라 하는 것이 아니라 왜 이렇게 사용하는지에 대한 이론적인 배경도 간단하지만 소개되어 있는 만큼 어렵지 않게 소개하고 있는 것이 가장 큰 특징이자 장점입니다. 

 

 

 

 

 

다만 조금 아쉬운 점이 있었다면, 입문서인 만큼 처음 접하는 사람들에게는 좋은 책이지만 R 스튜디오를 어느 정도 사용을 하고 있고 프로그램에 대해서 공부를 한 사람들에게는 부족한 부분이 많이 느껴지는 책이기도 합니다. 실무적인 부분에서 크게 활용되는 부분인 통계 쪽 내용이 다른 내용들에 비해서 부족한 점은 이 책의 다음 시리즈가 나와야 하지 않을까?라는 생각으로 이어질 만큼 아쉬운 점으로 기억될 것 같습니다. 그럼에도 불구하고 앞서 말씀드린 기본기에 충실한 입문서인 만큼 빅데이터와 R 스튜디오에 대해서 관심이 있으신 분들이라면 첫 시작을 이 책을 선택하시면 후회하지 않을 겁니다. 

 

 

 

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 도서명 :
처음 시작하는 R 데이터 분석
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
처음 시작하는 R 데이터 분석
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
처음 시작하는 R 데이터 분석
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실