메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

처음 배우는 머신러닝

기초부터 모델링, 실전 예제, 문제 해결까지

한빛미디어

집필서

절판

  • 저자 : 김승연 , 정용주
  • 출간 : 2017-10-01
  • 페이지 : 376 쪽
  • ISBN : 9791162240045
  • 물류코드 :10004
  • 초급 초중급 중급 중고급 고급
4.8점 (4명)
좋아요 : 34

머신러닝 기초 이론, 실전 예제, 문제 해결까지 한번에

이 책은 구글과 라쿠텐 머신러닝 개발자가 초보자 눈높이에서 머신러닝의 핵심 이론과 실용적인 예제를 제시합니다. 머신러닝 입문자가 이론을 바탕으로 강력한 성능을 내는 머신러닝 시스템을 구현하고 사용할 수 있도록 하는 것이 이 책의 목표입니다.

1부에서는 ‘머신러닝 기초 지식’, 2부에서는 ‘머신러닝 주요 모델’, 3부에서는 ‘머신러닝 시스템 구현’을 알려줍니다. 이론과 실무 예제와 해결 방법까지 모두 담고 있어 입문자뿐 아니라 이미 머신러닝을 현업에서 다루면서 체계적으로 실력을 다잡고자 하는 중고수에게도 최고의 선택이 될 겁니다.

 

상세이미지733-3.png

 

김승연 저자

김승연

막연히 인간이 무엇인지 데이터를 통해 이해하고 싶다며 컴퓨터공학과에 들어간 이후 머신러닝과 소프트웨어 개발의 길을 걷고 있다. 서울대학교에서 컴퓨터공학부를 마치고 조지아 공과대학에서 효율적인 문서의 표현형 학습에 대한 머신러닝을 연구하여 컴퓨터 과학 석사와 박사 학위를 취득했다. 현재 구글 리서치에 소속되어 모바일 환경에서의 머신러닝을 주제로 연구 개발하고 있다.

정용주 저자

정용주

서울대학교에서 컴퓨터공학과 고고미술사학을 전공하면서 발굴 데이터의 전산 분석 강좌를 통해 머신러닝의 가능성을 체험한 후 도쿄대학에서 머신러닝을 이용한 웹 스팸 검출에 관한 연구로 정보이공학 석사와 박사 학위를 취득했다. 그 후 일본 전자상거래기업 라쿠텐에서 데이터 분석 및 부정사용 검출에 종사했다. 현재는 스탠퍼드에서 1년의 방문연구원 생활 후 라쿠텐 미국 지사에서 데이터 분석을 담당하고 있다.

 [Part 1 머신러닝 기초 지식]

 

1장. 머신러닝 시작하기

__1.1 머신러닝 소개 

__1.2 머신러닝을 이해하는 데 필요한 배경 지식

__1.3 머신러닝 발전사 

__1.4 머신러닝의 분류 

__1.5 마치며 

 

 

2장. 머신러닝의 주요 개념

__2.1 모델 : 문제를 바라보는 관점 

__2.2 손실함수

__2.3 최적화 : 실제로 문제를 푸는 방법

__2.4 모델 평가 : 실제 활용에서 성능을 평가하는 방법

__2.5 마치며 

 

[Part 2 머신러닝 주요 모델]

 

3장. 데이터와 문제

__3.1 데이터형

__3.2 데이터양과 품질

__3.3 데이터 표준화

__3.4 문제 유형

__3.5 마치며 

 

4장. 구매 이력 데이터를 이용한 사용자 그룹 만들기

__4.1 군집화 

__4.2 K-중심 군집화 

__4.3 계층적 군집화 

__4.4 밀도 기반 군집화 

__4.5 유사도 계산 

__4.6 마치며 

 

5장. 문서 분석 시스템 만들기

__5.1 문서 분류 시스템 만들기

__5.2 토픽 모델링

__5.3 문법 분석

__5.4 단어 임베딩 학습 - word2vec

__5.5 마치며 

 

6장. 영화 추천 시스템 만들기

__6.1 영화 추천 시스템 

__6.2 유사도 계산 

__6.3 내용 기반 추천 시스템 

__6.4 협업 필터링

__6.5 표준화 

__6.6 마치며 

 

7장. 이미지 인식 시스템 만들기

__7.1 이미지 처리의 기본 개념 

__7.2 이미지 인식 

__7.3 이미지 인식에 사용하는 피처 

__7.4 딥러닝을 이용한 이미지 인식 

__7.5 마치며 

 

8장. 머신러닝의 다양한 문제점 해결하기

__8.1 모델 문제 

__8.2 데이터 문제

__8.3 속도 문제

__8.4 마치며 

 

[Part 3 머신러닝 시스템 구현]

 

9장. 머신러닝 소프트웨어 소개

__9.1 파이썬 설치와 라이브러리 

__9.2 유명 라이브러리 소개 

__9.3 이 책에서 사용하는 툴킷

__9.4 마치며 

 

10장. 구매 이력 데이터를 이용한 사용자 그룹 만들기 - 실전

__10.1 데이터셋 

__10.2 데이터 전처리 

__10.3 K-평균 군집화 

__10.4 올바른 클러스터 수 K 정하기 

__10.5 계층적 군집화 

__10.6 마치며 

 

11장. 문서 분석 시스템 만들기 - 실전

__11.1 스팸 문자 필터 만들기(문서 분류) 

__11.2 토픽 모델 시스템 만들기 

__11.3 품사 분석 시스템 만들기 

__11.4 고유명사 태깅 시스템 만들기 

__11.5 한국어 위키백과를 이용한 word2vec 만들기

__11.6 마치며 

 

12장. 영화 추천 시스템 만들기 - 실전

__12.1 데이터셋 구하기 

__12.2 데이터 전처리 

__12.3 내용 기반 영화 추천 시스템 만들기 

__12.4 협업 필터링 기반 영화 추천 시스템 만들기 

__12.5 마치며 

 

13장. 이미지 인식 시스템 만들기 - 실전

__13.1 이미지 데이터를 이용한 K-평균 군집화 

__13.2 주성분 분석을 이용한 사람 얼굴 인식 

__13.3 CNN을 이용한 손글씨 숫자 분류 

__13.4 마치며 

 

부록 : 용어표

 ★ 이 책에서 다루는 내용

이 책은 머신러닝 입문자가 알아야 하는 머신러닝의 전반적인 내용을 다룹니다. 여러분은 머신러닝이 왜 쓸모 있고 어떤 모델과 문제가 있는지, 실무에서 어떻게 사용하는지, 머신러닝의 다양한 문제를 어떻게 해결할 수 있는지, 프로그램 코드를 어떻게 만드는지 알게 될 겁니다.

 

[1부 머신러닝 기초 지식]

머신러닝과 딥러닝이 무엇이고 어떤 분류와 어떤 개념이 있는지 알아봅니다. 1부의 기본 개념은 3부의 실습에서 유용하게 사용되므로 정확히 알고 가는 것이 좋습니다.

 

-1장 머신러닝 시작하기

머신러닝의 큰 그림을 이해하는 데 도움이 되는 내용을 소개합니다. 머신러닝과 딥러닝이 무엇인지, AI와 다른 관련 분야들과는 어떠한 관계를 갖고 있으며 어떻게 분류하는지 설명합니다.

 

- 2장 머신러닝의 주요 개념

머신러닝의 주요 개념을 설명합니다. 이론적인 부분을 최대한 쉽고 실용적으로 설명했습니다. 이 장을 읽고 나면 머신러닝을 도입했을 때 문제를 어떻게 바라보고 어떻게 표현하며 어떻게 해결 방법을 찾는지, 그리고 예측에 어떻게 사용하는지에 대해 알 수 있습니다. 이들 개념은 성능에 커다란 영향을 끼치므로 어렵더라도 읽어보기 바랍니다.

 

[2부 머신러닝 주요 모델]

머신러닝 주요 모델의 이론과 개념을 실제 적용 사례와 함께 설명합니다. 회귀, 군집화 등 머신러닝의 모델에 대해 어느 정도 알고 있지만 바탕이 되는 이론이나 적용할 수 있는 문제가 무엇인지에 대해 구체적으로 알고 싶으면 2부를 꼭 읽어보세요. 특히 8장은 실제로 이론을 적용했을 때 발생하는 다양한 문제를 해결하는 방법을 소개합니다.

 

- 3장 데이터와 문제

문제의 종류와 데이터에 대해 이해해야 머신러닝을 제대로 수행할 수 있습니다. 데이터와 문제의 종류를 소개하여 머신러닝으로 해결할 수 있는 문제를 이해하는 데 도움을 줍니다.

 

- 4장 구매 이력 데이터를 이용한 사용자 그룹 만들기

수치 항목으로 구성된 구매 이력 데이터로 사용자 그룹을 만드는 문제를 다룹니다. 수치 데이터를 이용하는 대표적인 모델인 회귀와 군집화를 좀 더 자세히 알아봅니다.

 

- 5장 문서 분석 시스템 만들기

문서를 분석하는 다양한 방법에 대해 설명합니다. 문서를 주어진 카테고리에 맞게 분류하는 방법, 숨겨진 토픽을 찾는 방법, 문법을 분석하는 방법, 문서에서 고유명사를 추출하는 방법 등 이론적인 기반을 소개합니다. 또한 최신 유행하는 임베딩 학습으로 문서를 분석하는 방법도 소개합니다.

 

- 6장 영화 추천 시스템 만들기

넷플릭스, 유튜브 등의 서비스는 사용자가 좋아할 만한 영상을 어떻게 찾아낼까요? 추천 시스템의 기본 이론에 대해 알아봅니다.

 

- 7장 이미지 인식 시스템 만들기

이미지의 내용을 어떻게 인식하는지에 대해 설명합니다. 비슷한 사진 찾기, 이미지에 들어 있는 주요 물체를 찾는 인식 기법에 대해 설명합니다. 또한 최신 기법인 신경망을 이용한 이미지 분류에 대해서도 살펴봅니다.

 

- 8장 머신러닝의 다양한 문제점 해결하기

머신러닝을 최초로 구현했을 때부터 바로 좋은 성능을 보인다면 정말 운이 좋은 겁니다. 같은 방법을 사용하더라도 여러 가지 상황에 따라 좋은 성능이 나오지 않을 수 있습니다. 대부분의 경우에는 몇 가지 문제만 해결해도 엄청난 성능 향상을 얻을 수 있습니다. 모델의 다양한 문제점을 해결하는 방법, 까다로운 데이터를 처리하는 방법, 속도 향상을 위한 방법 등을 알아

봅니다.

 

[3부 머신러닝 시스템 구현]

3부에서 설명한 이론을 실제로 구현하는 방법과 라이브러리를 이용하는 방법을 소개합니다. 모델을 실제로 적용하는 방법을 더 빨리 알고 싶다면 2부보다 3부를 먼저 읽어도 됩니다.

 

- 9장 머신러닝 소프트웨어 소개

머신러닝 태스크에 사용되는 프로그래밍 언어와 각 언어에서 사용하는 대표적인 머신러닝 라이브러리 및 딥러닝 프레임워크를 소개합니다. 이 책에서 주로 사용할 라이브러리는 사이킷런과 텐서플로입니다. 이 두 라이브러리의 기본적인 사용법에 대해서도 알아봅니다.

 

- 10장 구매 이력 데이터를 이용한 사용자 그룹 만들기 - 실전

4장에서 소개한 ‘구매 이력 데이터를 이용한 사용자 그룹 만들기’를 실제로 구현해봅니다. 데이터와 프로그래밍 코드를 함께 살펴보면서 다양한 군집화 구현에 대해 살펴봅니다.

 

- 11장 문서 분석 시스템 만들기 - 실전

5장에서 살펴본 다양한 ‘문서 분석 시스템’을 구현해봅니다. 스팸문자 분류기와 문서 내용을 간추리는 데 사용되는 토픽을 찾는 방법, 한국어 처리와 임베딩 학습을 통한 문서 분석 방법을 알아봅니다.

 

- 12장 영화 추천 시스템 만들기 - 실전

6장에서 설명한 ‘영화 추천 시스템’을 구현해봅니다. 실제 데이터와 프로그래밍 코드를 살펴보면서 협업 필터링 구현 방법에 대해 소개합니다.

 

- 13장 이미지 인식 시스템 만들기 - 실전

7장에서 살펴본 이미지 관련 기술을 이용해 ‘이미지 인식 시스템’을 만듭니다. 기본적인 이미지 데이터를 다루는 방법과 얼굴 사진 분류 및 딥러닝을 이용한 손글씨 분류를 구현해봅니다.

undefined

그냥 지나갈 뻔 했는데, 사이트의 리뷰 시스템에서 별점을 굳이 주라고하니까 다시 생각된다.

인공지능, 머신러닝 관련해서 몇 권을 훑어봤는데, 그 중에서 흡수력, 구성면에서 제일 낫다. 역사를 다루고, 자세하게 들어가는 건 몇 개 더 있는데, 2천 몇 페이지 그거 다 읽을 시간 없다. 그리고, 그거 다 읽고서 내 것으로 만들어서 논문 쓸 일 없다. 이게 제일최적이다.

 

일단, 개인적으로 문서 관련 부분을 제대로 다뤄주니 좋았고, 실무에서 쓰던 사람들이 집필한 책이라는 느낌이 들어서 좋았다.

실무자들이 집필했기 때문에 내가 바로 써먹는 건 한계가 있겠지만, 그들이어떻게 썼다는 흐름만 이해해도 내게는 이득이다.

특히 이론 다 설명해놓고서 Ch. 8의 문제점 해결하기 를 제시하는것은 현업에서는 주로 디버깅이나 문제 해결에 노력이쓰인다는 면에서 가려울 때 제대로 긁어주는 느낌이다.

 

항상 책에 나온 수식과 선이 연결된 복잡도가 있을 때에 특히 소프트웨어로만 된 경우에는 실제 복잡도는 그것의 100배에 해당하는 것이라고 머리 속에서 확장을 해서 봐야 한다.

3 * 3 정도로 표시가 되어 있다고 하면 기본으로 30 * 30 정도의 복잡도를 고려해야 할 것이다. 이것을 잊어버리고하다보면 처음에는 손쉽게 여기면서 하찮게 여길수도, 나중에는 의외의 복잡도에 놀라서 스스로 실망하게될 수도 있다. 항상 어느 정도의 각오는 필요하다.

 

손실함수 (Loss Function) 의 정의는 품질손실을 '제품이 다음 공정이나 소비자에게 출하된 뒤에 성능특성치의산포로 인하여 사회에 미치는 재정적인 손실' 로 정의할 때 이러한 손실이 화폐단위로 측정되고 수량화할수 있는 제품특성이나 관리방법을 평가할 수 있는 함수라고 대한상공회의소 홈페이지에 이렇게 나온다.

손실함수라는 개념은 새로운 것도 아닌데, 왜 나는 생전 처음보는 걸까? 그만큼 이 쪽하고는 인연이 없었다는 거다. 단어 설명은 최적화 쪽과관련되는 것 같은데, 단어 자체는 이 책에서 처음 본 인연이다. 이미봤었는데, 잊고 있었던 건가? 뭔가 비어있는 느낌판타지 속의 망각 저주, 존재 소멸 마법 같은 게 이런 느낌이려나?

 

이 책의 미덕은 아무리 생각해봐도 이론과 구현의 분리이다. 이론을직접 구현하는 쪽과 연결해서 보여주면 당장에 좋을 것 같기는 한데, 이론에서 이론으로 양상을 전개해가는면에 있어서는 흐름이 뚝뚝 끊기게 된다. 예전에는 이론 한 꼭지 보여주고, 그것을 어떻게 구현하는가에 대해서 코드 보여주고, 다음 것을 또그런 식으로 진행하는 식으로 써오곤 했다. 그리고, 대학교수님들 교재 같은 경우에는 순전히 이론과 수식만 들어가고 아예 구현부는 빠지든지 그리 정확하지도 않은Pseudo Code 2~3 개 정도 들어가고 땡. 이기도 했다.

 

각 장별 연관성이 다음과 같이 층위를 가지는 형태라서 몇 번 읽고 나서는 결국에 이렇게 다시 읽게 된다.

 1 –2 – 3 – 9 – 8

           4– 10

           5– 11

           6– 12

           7– 13

4 – 5 – 6 – 7

 

각 주제별로 따로 잡고서 주제 1, 이론, 실습주제 2, 이론, 실습, … 의 순서로 엮인 책과 비교한다면 각각의 장단점이 있을 것이다. 그런데, 머신 러닝과 관련된 부분들이 너무 넓은 영역을 감당해야 한다. 그렇기때문에 작업자는 균형 잡힌 시각을 가지고 있다가, 나중에 써먹어야 할 때가 오면 해당 분야에 가장 적합한방법을 취사선택해서 가져올 수 있어야 할 것이다.

 

만약 Part 2 – 이론,Part 3 – 실전을 분리해놓지 않고 각 주제에 대해서 하나로 놓았을 때에도 나는 이것을 미덕이라고 했을까?

편집과 내용이 거기에 맞춰서 납득이 간다면 좋아했을 수 있지만, 지금이 책의 구성을 보고 난 다음이라 이론별-구현별 구분된 방식이 더 납득된다.

 

 

읽은 사람의 수준에 따라 편차가 있을 수도 있지만, 수식의 내용이나형식 등도 너무 번잡하지 않고, 너무 간단하지 않은 적당한 상태이다.

 

머신러닝의 내용에 대해서 알면 알수록,

, 사람은 덜 수고하고, 기계를 고생시키는 노가다의 결정체이구나.” 라는 생각을 하게 된다.

겸사겸사, 일에 대한, 비즈니스에대한 관점을 바꿔보게 된다는 덤도 있다.

 

나중에 내 사이트에서 여러 가지 라이브러리에 대해서 활용은 완전히 제쳐두고, 설치와연결 확인 여부에 대해서만 모아도 장사될 것 같다. 특히 리눅스 기반으로 된다는 것들을 윈도 기반에서어떻게 잘 연결시키나... 를 가지고

여기에서는 바로 설치 확인된 것은 numpy 하나 뿐이고, 나머지는 설치 자체가 너무 힘들다.

 

아나콘다를 거부한 내 잘못인가?

 

 

 

 

 

책을 읽게 된 이유

얼마전까지만해도 머신러닝이라는 것은 저와는 완전히 동떨어진 기술이고, 관심은 가지만 알필요는 없을 것 같다는 생각을 가지고 있었습니다. 왜냐하면 머신러닝을 설명하는 글들을 보면 항상 복잡한 수학 공식이 적혀 있었고, 이 공식들을 사용해서 컴퓨터를 학습시켜 미래를 예측한다는 내용이었기 때문에 너무 어려워보이고 범접할 수 없는 느낌이 들었기 때문입니다. 하지만 불과 1,2년 사이에 먼 이야기 같았던 머신러닝이 점점 생활 속으로 들어오고 익숙한 단어가 되고, 주 마다 찾아가는 서점에서도 머신러닝, 딥러닝에 대한 책들이 점점 많아지는 것을 느꼈습니다. 그만큼 많은 사람들이 관심을 가지고 이에 대한 공부를 하고 있고, 제 주변에서도 관심을 가지고 살펴보는 사람들이 늘어가고 있었습니다.

최근에 회사에서 진행한 프로젝트와 주말마다 진행하는 스터디를 통해 데이터를 다루는 일이 많아지면서 이제는 머신러닝에 대해 한번 공부해보고 적용할 수 있었으면 좋겠다는 생각을 가지게 되었습니다. 그러면서 처음 머신러닝에 대한 개념을 잡기 위해 한빛미디어에서 출간한 처음 배우는 머신러닝이라는 책을 읽게 되었습니다. 처음 배우는 이라는 타이틀이 붙은 만큼 쉽게 쓰여져 있을 것이라 기대하고 읽기 시작하였습니다.

 

 

이 책을 읽으려면

이 책은 머신러닝을 처음 배우는 프로그래머나, 머신러닝 전공 희망자, 데이터 과학자를 대상으로 하기 때문에 입문자를 위한 책이기는 하지만 어느정도 프로그래밍에 대한 기초지식은 있어야 한다고 생각합니다. 실전 예제에 들어가기 전까지 이론적인 부분들은 프로그래밍 지식이 없이도 읽을 수 있지만 후반부에 실제로 실습을 하는 부분에서는 파이썬을 사용하여 코딩을 하고, 파이썬 문법에 대한 언급은 없으므로, 기본적인 지식이 있어야 따라해보며 이해해 나갈 수 있을 것입니다.


 

내가 책을 읽었던 방법

입문자용 책이었기 때문에 머신러닝의 개념들에 대한 설명이 깊이 있게 들어가지는 않고 추상적인 설명이 주를 이루고 있습니다. 아마도 깊게 들어가면 수학공식이 복잡하게 나올 것이기 때문에 저와 같은 입문자들에게는 적절한 난이도라고 생각합니다. 하지만 쉽게 쓰여진 이 개념들도 종류가 너무 많다보니 머릿속에 정리가 잘 되지는 않았습니다. 수학 공식이 등장하는 부분은 대부분 이런게 있구나 하고 넘어갔고, 개념적인 설명이 있는 부분은 정독을 하며 최대한 이해해보려고 노력하며 읽어내려갔습니다. 하지만 이 또한 두세번정도 읽어도 이해가 안되면 그냥 넘어갔습니다. 머신러닝은 여러번의 시행착오를 거쳐가며 개선해나가는 과정을 통해 익숙해지고 이해가 되기 때문에 너무 이론적인 부분에서 막혀 있을 필요는 없을 것 같다는 생각이었습니다. 수학 공식 또한 이 공식이 어떠한 곳에 사용되고 왜 사용해야하는지 정도만 이해하면 어차피 검증된 라이브러리들이 잘 구현되어 있기 때문에 적절한 곳에 가져다 쓰면 된다고 생각하여 그정도 까지만 이해하고 넘어갔습니다.


 

책을 읽으며 좋았던 점

9장까지 이론적인 내용들을 읽고나면 이제 실제로 코딩을 해볼 수 있는 실전 예제들이 등장합니다. 저는 이론적인 부분은 난해하고 조금 지겨움을 느꼈었는데 실전 예제를 직접 따라해보고 실제 결과를 눈으로 확인하니 큰 재미를 느꼈습니다. 그리고 이전에 이해가 잘 안되던 부분도 어느정도 이해가 되면서 실제 업무에 적용할 수 있을만한 요소들에 대한 인사이트를 얻을 수 있었습니다. 저는 이 과정에서 재미와 경험, 인사이트를 얻을 수 있었기 때문에 이론적인 부분을 스킵하더라도 실전 예제는 꼭 직접 해보실 것을 추천합니다. 조금씩 다른 유형의 실전 예제들이 4가지나 수록이 되어 있기 때문에 전부 다 따라해본다면 이 책에서 설명하고 있는 이론적인 부분들 또한 함께 이해가 될 것이라 생각됩니다.

 

마무리

이 책을 읽고나서 머신러닝이라는 다가가기 힘들었던 기술에 대해 어느정도 감을 잡고, 예제를 따라해보며 더 해보고 싶어지는 재미와 나도 머신러닝을 해볼 수 있겠다는 자신감을 가질 수 있게 되어 만족스러웠습니다. 이 책의 추상적인 이론에서 조금 더 자세히 들여다 보고 싶은 분들은 유투브에서 김성훈님의 모두를 위한 딥러닝 강좌를 보실 것을 추천드립니다.

 

 평소에 머신러닝과 딥러닝에 대해서 한번 알아보고 싶어서 계속 생각만 하다가 좋은 기회가 생겨 이렇게 책을 보게 되었습니다.

확실히 이 분야가 많은 수학지식을 요구하는 분야라서 많이 어렵게 다가왔습니다. 하지만 이 책은 굉장히 상세하고 친절하게 소개하고 있습니다. 그래서 읽는데 고등학교 수학지식을 가지고 읽었는데 크게 문제는 없었습니다. 예제코드는 파이썬으로 되어있었습니다. 그림과 수식, 도표가 잘 되어 있어서 보는데 아주 도움이 많이 되었습니다.

다양한 머신러닝 활용 예를 통해 머신러닝이 이런놈이구나 정도를 실감하고 체험하고 느끼게 되었습니다. 역시 머신러닝은 참 신기한 분야군요 ㅎㅎ

 

“처음…”, “… 첫걸음” 시리즈의 책들을 다 보진 못했지만, 근래 본 책은 다소 기대에 못 미쳤다. 그런데 이 책을 리뷰 서적 중 하나로 선택한 이유는 ‘헬로 데이터 과학’의 저자이며, ‘데이터 지능’ 팟케스트도 진행하고 계신 김진영님의 추천 때문이다. (그런데 어디서 추천했는지(글이었는지, 팟케스트에서였는지) 찾을 수가 없다. 혹은 다른 책을 추천했는지도 모르겠으나… 이 책에 앞부분에 나오는 첫번째 추천글이 김진영님의 글이니 맞을꺼라 생각한다.)

딥러닝의 인기를 실감하면서 개발자로서 이 현상을 어떻게 받아들여야 하는지 아직 확신이 없다. 데이터 과학자와 개발자라는 영역을 정확히 구분하긴 어렵지만, 분명 서로의 직업군을 형성하고 있는 것은 사실이다. 그런데 이게 애매해 지고 있다. 딥러닝의 발전과 함께 비전문가도 쉽게 딥러닝(또는 머신러닝)을 사용하는 시대가 곧 올꺼라고들 하는데, 개발자의 필수 기술로 요구될 것은 너무 자연스럽기 때문이다. 특히 백앤드 개발자에게는 더욱 그렇지 않을까…

이 책은 제목처럼 배경지식이 없는 사람을 위한 머신러닝 입문서이다. 머신러닝의 개념과 함께 다양한 방법론의 알고리즘으로 무엇을 할 수 있는지를 알려준다. 우선 이 책의 장점을 들자면,

  • 잘 짜여진 구성
  • 쉬운 설명
  • 적절한 예제

크게 세 파트로 나눠져 있고, 각 파트는 기본개념, 모델, 구현에 대한 내용을 담고 있다. 개인적으로 파트2인 ‘머신러닝 주요 모델’이 가장 좋았다. 다양한 데이터형에 대한 설명을 시작으로 ‘데이터 표준화’에 대한 부분을 읽고 많은 깨달음을 얻었다. 이미 데이터는 주변에(개인적으로나, 회사에서나) 널려있는데, 이런 데이터를 이용하기 위해 먼저 어떻게 고민해봐야 할 지에대한 나름의 가이드를 얻은 것 같아서 좋았다. 그리고 다양한 방법론과 각 알고리즘이 적지않은 수식들과 함께 설명되어 있는데, 밸런스가 아주 적절했다. 수식에만 너무 빠지지도 않고, 그렇다고 수식을 대충 넘기지도 않는다. 이 수식이 무엇을 의미하는지, 왜 필요한지에 대한 설명에 더 힘을 쏟고 있다. 물론 부족한 수학지식에 수식 자체를 100% 이해하고 넘어가지는 못하지만, 어떤 문제를 해결하기 위해 이 알고리즘이 어떤 역할을 하는지에 대한 이해는 충분히 되었다고 생각한다. 그리고 책에도 반복적으로 언급하는 것 처럼.

…(중략) 특별한 구현 없이 라이브러리로 바로 사용할 수 있습니다.

그렇다. 이미 다양한 머신러닝 라이브러리가 있고, 그것을 이용하면 그만인 것이다. 책에서도 다양한 라이브러리들을 소개하고 있고, 실전 예제에서 그 라이브러리들을 이용한다. 즉, 중요한 것은 내가 풀고자 하는 문제에 어떤 방법, 어떤 알고리즘을 활용할 것인지에 대해서 아는 것이 아닌가 생각해본다. 그런 의미에서 이 책이 큰 도움이 되어 줄 것 같다.

개인적으로 이전에 읽은 ‘밑바닥부터 시작하는 딥러닝’ 에서 봤던 용어나 수식들이 적잖게 등장해서 이해하는데도 조금은 도움이 되었던 것 같다.

책표지

부록/예제소스
자료명 등록일 다운로드
DOWNLOAD 예제소스(from GDrive) 2024-02-23 다운로드
결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 도서명 :
처음 배우는 머신러닝
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
처음 배우는 머신러닝
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
처음 배우는 머신러닝
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실