메뉴 바로가기 검색 및 카테고리 바로가기

한빛미디어

혼자 공부하는 머신러닝+딥러닝

한빛미디어

집필서

판매중

  • 저자 : 박해선
  • 출간 : 2020-12-21
  • 페이지 : 580 쪽
  • ISBN : 9791162243664
  • 물류코드 :10366
초급 초중급 중급 중고급 고급
4.9점 (39명)
좋아요 : 59

- 혼자 해도 충분하다! 1:1 과외하듯 배우는 인공지능 자습서 

 

이 책은 수식과 이론으로 중무장한 머신러닝, 딥러닝 책에 지친 ‘독학하는 입문자’가 ‘꼭 필요한 내용을 제대로’ 학습할 수 있도록 구성했다. 구글 머신러닝 전문가(Google ML expert)로 활동하고 있는 저자는 여러 차례의 입문자들과 함께한 머신러닝&딥러닝 스터디와 번역·집필 경험을 통해 ‘무엇을’ ‘어떻게’ 학습해야 할지 모르는 입문자의 막연함을 이해하고, 과외 선생님이 알려주듯 친절하게 핵심적인 내용을 콕콕 집어준다. 컴퓨터 앞에서 <손코딩>을 따라하고, 확인 문제를 풀다 보면 그간 어렵기만 했던 머신러닝과 딥러닝을 개념을 스스로 익힐 수 있을 것이다! 

 

- 베타리더가 함께 만든 입문서

 

베타리딩 과정을 통해 입문자에게 적절한 난이도, 분량, 학습 요소 등을 고민하고 반영했다. 어려운 용어와 개념은 한 번 더 풀어 쓰고, 복잡한 설명은 눈에 잘 들어오는 그림으로 풀어 냈다. ‘혼자 공부해본’ 여러 입문자의 마음과 눈높이가 책 곳곳에 반영된 것이 이 책의 가장 큰 장점이다.

 

 

누구를 위한 책인가요?

  • 인공지능, 머신러닝, 딥러닝 학습의 필요성을 인지하고 파이썬 정도의 기초 프로그래밍 언어를 입문한 독자
  • 머신러닝, 딥러닝에 관심은 있지만 너무 어려운 내용으로 시도가 힘들었던 독자
  • 개념만 어렴풋이 아는 데 그쳐버리거나 여전히 각 의미가 헷갈려 제대로 낮은 단계부터 다시 배우려는 독자

 

 

도서 특징

 

하나,  탄탄한 학습 설계 : ‘입문자 맞춤형 7단계 구성’을 따라가며 체계적으로 반복 학습한다

이 책은 머신러닝과 딥러닝의 핵심 내용을 7단계에 걸쳐 반복 학습하면서 자연스럽게 머릿속에 기억되도록 구성했다. 모든 절에서 [핵심 키워드]와 [시작하기 전에]를 통해 각 절의 주제에 대한 대표 개념을 워밍업한 후, 이론과 실습을 거쳐 마무리에서는 [핵심 포인트]와 [확인 문제]로 한번에 복습한다. ‘혼자 공부할 수 있는’ 커리큘럼을 그대로 믿고 끝까지 따라가다 보면 인공지능 공부가 난생 처음인 입문자도 무리 없이 책을 끝까지 마칠 수 있다!

 

둘, 파이썬만 안다면 프로젝트별 ‘손코딩’으로 머신러닝과 인공지능을 제대로 익힌다

파이썬 기초 지식이 있는 독자라면 이론 설명은 두 눈과 머리로 술술 읽으며 넘어가고, 직접 손코딩하며 실전 감각을 익히도록 엄선된 프로젝트 실습 예제를 담았다. 반복 학습과 연습이 가장 필수적인 입문자도, 실전형 코드로 연습하면서 책에 담긴 코드를 ‘나의 코드’로 만들 수 있다. 7장부터 시작하는 딥러닝은 머신러닝 중 4장 내용을 반복 학습한 다음에 익히도록 한다. 

 

셋, ‘혼공’의 힘을 실어줄 동영상 강의, 학습 사이트 지원

http://hongong.hanbit.co.kr

책으로만 학습하기엔 여전히 어려운 입문자를 위해 저자 직강 동영상도 지원한다. 또 학습을 하며 궁금한 사항은 언제든 질문할 수 있도록 학습 사이트를 제공한다. 저자가 질문 하나하나 직접 답변하고 있으며, 관련 최신 기술과 정보도 공유한다. 게다가 혼자 공부하는 그 길에 함께 공부하기를 원하는 사람들의 모임인 혼공 학습단을 운영하여 마지막까지 포기하지 않고 독자가 완주할 수 있도록 최대한 지원하고 있다.

 

넷, 언제 어디서든 가볍게 볼 수 있는 혼공 필수 [용어 노트] 제공

꼭 기억해야 할 핵심 개념과 용어만 따로 정리한 [용어 노트]를 제공한다. 처음 프로그래밍에 입문하는 사람에게 낯선 용어가 어렵듯이 머신러닝과 딥러닝을 처음 접하는 사람에게도 낯선 용어가 진입 장벽이 된다는 것을 베타리더를 통해 확인했고, 어려운 것이 아니라 익숙하지 않아서 헷갈리는 것이므로 잘 생각나지 않을 때는 언제든 부담 없이 펼쳐보자. 제시된 용어 외에도 새로운 용어를 추가하면서 자신만의 용어 노트를 완성해가는 것도 또 다른 재미가 될 것이다.

 

다섯, 스토리텔링 속 주인공과 함께 독자도 성장

낯설고 어렵기만 한 이론을 풀기 위해서 한빛 마켓에 입사한 신입사원이 업무에서 머신러닝, 딥러닝을 어떻게 활용하는지를 스토리텔링으로 풀었다. 앱에 새로운 기능을 더해가는 신입사원의 이야기를 통해 독자도 함께 머신러닝, 딥러닝을 학습할 수 있도록 구성했다. 각 절의 끝에는 [문제해결 과정]을 두어 신입사원이 어떤 과정을 통해 문제를 해결했는지 간략하게 정리한다.

 

 

먼저 읽은 베타리더들의 한 마디

  • 이 책 하나만 있어도 충분히 인공지능 기초를 다질 수 있다고 자신있게 얘기할 수 있습니다. _이동훈 님
  • 기초 개념과 핵심 키워드, 복습을 도와주는 마무리, 확인 문제 등 내용이 알차서 머신러닝과 딥러닝을 처음 시작하는 입문자에게 많은 도움이 될 것 같아 추천합니다. _이석곤 님
  • 책 속의 주인공이 문제를 해결하며 머신러닝 개발자로 성장하는 과정을 통해 머신러닝을 어떻게 활용할지 자연스럽게 습득할 수 있습니다. _김윤태 님
  • 컴퓨터 설정부터 차근차근 알려주는 책이라 좋았습니다. 의료나 산업, 경영 등에도 접목할 수 있으리라 기대합니다. _김현수 님
  • 일상 비즈니스를 사례로 들고 쉬운 알고리즘을 활용해 머신러닝의 개념을 익힐 수 있습니다. 코랩을 활용한 덕에 초보자에게 진입 장벽을 낮춰줍니다. _허민 님
  • “조금 더 공부하고 싶다”란 생각을 가질 수 있게 해준 책이라 더욱 고맙게 느껴집니다. _도혜리 님
  • 이론을 충실하게 설명하면서도 이론을 체감할 수 있는 코드의 배치도 아주 절묘합니다. 독학으로 딥러닝 실무를 익히기 위한 책을 한 권만 고르라면 이 책이지 않을까요? _ 임지순 님

 

 

혼자 공부하는 머신러닝 딥러닝 상세이미지(new_940px).jpg

박해선 저자

박해선

기계공학을 전공했으나 졸업 후에는 줄곧 코드를 읽고 쓰는 일을 했다. 지금은 머신러닝과 딥러닝에 관한 책을 집필하고 번역하면서 소프트웨어와 과학의 경계를 흥미롭게 탐험하고 있다. 『혼자 공부하는 머신러닝+딥러닝』(한빛미디어, 2020)과 『Do it! 딥러닝 입문』(이지스퍼블리싱, 2019)을 집필했고, 『케라스 창시자에게 배우는 딥러닝(개정 2판)』(길벗, 2022), 『핸즈온 머신러닝(2판)』(한빛미디어, 2020)을 포함한 다수의 머신러닝 책을 우리말로 옮겼다.

 

Chapter 01 나의 첫 머신러닝 ▶️이 생선의 이름은 무엇인가요?

__ 01-1 인공지능과 머신러닝, 딥러닝 ▶️ 인공지능과 머신러닝, 딥러닝은 무엇일까요?

____ 인공지능이란

____ 머신러닝이란

____ 딥러닝이란

____ 키워드로 끝내는 핵심 포인트

____ 이 책에서 배울 것은

__ 01-2 코랩과 주피터 노트북 ▶️코랩과 주피터 노트북으로 손코딩 준비하기

____ 구글 코랩

____ 텍스트 셀

____ 코드 셀

____ 노트북

____ 키워드로 끝내는 핵심 포인트

____ 표로 정리하는 툴바와 마크다운

____ 확인 문제

__ 01-3 마켓과 머신러닝 ▶️마켓을 예로 들어 머신러닝을 설명합니다.

____ 생선 분류 문제

____ 첫 번째 머신러닝 프로그램

____ [문제해결 과정] 도미와 빙어 분류

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 02 데이터 다루기 ▶️수상한 생선을 조심하라!

__ 02-1 훈련 세트와 테스트 세트 ▶️ 모델을 훈련 시키는 훈련 세트와 검증하는 테스트 세트로 나누어 학습하기 

____ 지도 학습과 비지도 학습

____ 훈련 세트와 테스트 세트

____ 샘플링 편향

____ 넘파이

____ 두 번째 머신러닝 프로그램

____ [문제해결 과정] 훈련 모델 평가

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 02-2 데이터 전처리 ▶️정교한 결과 도출을 위한 데이터 전처리 알아보기

____ 넘파이로 데이터 준비하기

____ 사이킷런으로 훈련 세트와 테스트 세트 나누기

____ 수상한 도미 한 마리

____ 기준을 맞춰라

____ 전처리 데이터로 모델 훈련하기

____ [문제해결 과정] 스케일이 다른 특성 처리

____ 키워드로 끝나는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 03 회귀 알고리즘과 모델 규제 ▶️농어의 무게를 예측하라!

__ 03-1 k-최근접 이웃 회귀 ▶️회귀 문제를 이해하고 k-최근접 이웃 알고리즘으로 풀어 보기

____ k-최근접 이웃 회귀

____ 데이터 준비

____ 결정계수(R2)

____ 과대적합 vs 과소적합

____ [문제해결 과정] 회귀 문제 다루기

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 03-2 선형 회귀 ▶️ 사이킷런으로 선형 회귀 모델 만들어 보기

____ k-최근접 이웃의 한계 

____ 선형 회귀

____ 다항 회귀

____ [문제해결 과정] 선형 회귀로 훈련 세트 범위 밖의 샘플 예측

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 03-3 특성 공학과 규제 ▶️특성 공학과 규제 알아보기

____ 다중 회귀

____ 데이터 준비

____ 사이킷런의 변환기

____ 다중 회귀 모델 훈련하기

____ 규제

____ 릿지 회귀

____ 라쏘 회귀

____ [문제해결 과정] 모델의 과대적합을 제어하기

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 04 다양한 분류 알고리즘 ▶️럭키백의 확률을 계산하라!

__ 04-1 로지스틱 회귀 ▶️로지스틱 회귀 알고리즘을 배우고 이진 분류 문제에서 클래스 확률 예측하기 

____ 럭키백의 확률

____ 로지스틱 회귀

____ [문제해결 과정] 로지스틱 회귀로 확률 예측

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 04-2 확률적 경사 하강법 ▶️경사 하강법 알고리즘을 이해하고 대량의 데이터에서 분류 모델을 훈련하기

____ 점진적인 학습

____ SGDClassifier

____ 에포크와 과대/과소적합

____ [문제해결 과정] 점진적 학습을 위한 확률적 경사 하강법

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 05 트리 알고리즘 ▶️화이트 와인을 찾아라!

__ 05-1 결정 트리 ▶️결정 트리 알고리즘을 사용해 새로운 분류 문제 다루기

____ 로지스틱 회귀로 와인 분류하기

____ 결정 트리

____ [문제해결 과정] 이해하기 쉬운 결정 트리 모델 

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 05-2 교차 검증과 그리드 서치 ▶️검증 세트가 필요한 이유를 이해하고 교차 검증해 보기

____ 검증 세트

____ 교차 검증

____ 하이퍼파라미터 튜닝

____ [문제해결 과정] 최적의 모델을 위한 하이퍼파라미터 탐색

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 05-3 트리의 앙상블 ▶️ 앙상블 학습을 알고 실습해 보기

____ 정형 데이터와 비정형 데이터

____ 랜덤 포레스트

____ 엑스트라 트리

____ 그레이디언트 부스팅

____ 히스토그램 기반 그레이디언트 부스팅

____ [문제해결 과정] 앙상블 학습을 통한 성능 향상

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 06 비지도 학습 ▶️비슷한 과일끼리 모으자!

__ 06-1 군집 알고리즘 ▶️ 흑백 이미지 분류 방법과 비지도 학습, 군집 알고리즘 이해하기

____ 과일 사진 데이터 준비하기

____ 픽셀값 분석하기

____ 평균값과 가까운 사진 고르기

____ [문제해결 과정] 비슷한 샘플끼리 모으기

____ 키워드로 끝내는 핵심 포인트

____ 확인 문제

__ 06-2 k-평균 ▶️k-평균 알고리즘 작동 방식을 이해하고 비지도 학습 모델 만들기

____ k-평균 알고리즘 소개

____ KMeans 클래스

____ 클러스터 중심

____ 최적의 k 찾기

____ [문제해결 과정] 과일을 자동으로 분류하기

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 06-3 주성분 분석 ▶️차원을 알고 차원 축소 알고리즘 PC 모델 만들기 

____ 차원과 차원 축소

____ 주성분 분석 소개

____ PCA 클래스

____ 원본 데이터 재구성

____ 설명된 분산

____ 다른 알고리즘과 함께 사용하기

____ [문제해결 과정] 주성분 분석으로 차원 축소

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 07 딥러닝을 시작합니다 ▶️패션 럭키백을 판매합니다!

__ 07-1 인공 신경망 ▶️ 텐서플로로 간단한 인공 신경망 모델 만들기

____ 패션 MNIST

____ 로지스틱 회귀로 패션 아이템 분류하기

____ 인공 신경망

____ 인공 신경망으로 모델 만들기

____ 인공 신경망으로 패션 아이템 분류하기

____ [문제해결 과정] 인공 신경망 모델로 성능 향상

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 07-2 심층 신경망 ▶️인공 신경망에 층을 추가하여 심층 신경망 만들어 보기

____ 2개의 층

____ 심층 신경망 만들기

____ 층을 추가하는 다른 방법

____ 렐루 활성화 함수

____ 옵티마이저

____ [문제해결 과정] 케라스 API를 활용한 심층 신경망

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 07-3 신경망 모델 훈련 ▶️인경 신경망 모델 훈련의 모범 사례 학습하기 

____ 손실 곡선

____ 검증 손실

____ 드롭아웃

____ 모델 저장과 복원

____ 콜백

____ [문제해결 과정] 최상의 신경망 모델 얻기

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 08 이미지를 위한 인공 신경망 ▶️패션 럭키백의 정확도를 높입니다!

__ 08-1 합성곱 신경망의 구성 요소 ▶️합성곱 신경망의 개념과 동작 원리를 배우고 간단한 실습하기 

____ 합성곱

____ 케라스 합성곱 층

____ 합성곱 신경망의 전체 구조

____ [문제해결 과정] 합성곱 층과 풀링 층 이해하기

____ 키워드로 끝내는 핵심 포인트

____ 확인 문제

__ 08-2 합성곱 신경망을 사용한 이미지 분류 ▶️케라스 API로  합성곱 신경망 모델 만들기 

____ 패션 MNIST 데이터 불러오기

____ 합성곱 신경망 만들기

____ 모델 컴파일과 훈련

____ [문제해결 과정] 케라스 API로 합성곱 신경망 구현

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 08-3 합성곱 신경망의 시각화 ▶️신경망이 이미지에서 학습하는 게 무엇인지 이해하기

____ 가중치 시각화

____ 함수형 API

____ 특성 맵 시각화

____ [문제해결 과정]

____ 시각화로 이해하는 합성곱 신경망

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 09 텍스트를 위한 인공 신경망 ▶️한빛 마켓의 댓글을 분석하라!

__ 09-1 순차 데이터와 순환 신경망 ▶️순차 데이터의 특징과 개념 이해하기 

____ 순차 데이터 

____ 순환 신경망

____ 셀의 가중치와 입출력

____ [문제해결 과정] 순환 신경망으로 순환 데이터 처리

____ 키워드로 끝내는 핵심 포인트

____ 확인 문제

__ 09-2 순환 신경망으로 IMDB 리뷰 분류하기 ▶️텐서플로 순환 신경망으로 영화 리뷰 분류하기 

____ IMDB 리뷰 데이터셋

____ 순환 신경망 만들기

____ 순환 신경망 훈련하기

____ 단어 임베딩을 사용하기

____ [문제해결 과정] 케라스 API로 순환 신경망 구현

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 09-3 LSTM과 GRU 셀 ▶️순환 신경망의 중요 기술을 사용해 모델 만들어 보기

____ LSTM 구조

____ LSTM 신경망 훈련하기

____ 순환층에 드롭아웃 적용하기

____ 2개의 층을 연결하기

____ GRU 구조

____ GRU 신경망 훈련하기

____ [문제해결 과정] LSTM과 GRU 셀로 훈련

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

__ 부록 A 한발 더 나아가기

__ 부록 B 에필로그

 

____ 정답 및 해설

____ 찾아보기

< 혼자 공부하는 머신러닝+딥러닝 - 한빛미디어 >

 

 

이번달 나는 리뷰어다를 통한 리뷰할 도서는 "혼자 공부하는 시리즈"인 "혼자 공부하는 머신러닝+딥러닝" 편이다.

이미 머신러닝이 대중들에게더 알려진지도 오래된 듯하다.

그래서 관련 분야에 종사하진 않지만 관심은 있어서 머신러닝 관련된 책을 몇권 접해봤었다. 

 

하지만 그럴 때 마다 매번 책들을 보면 수식이 난무하거나 생소한 단어들로 구성된 책들이 많았다.

그래서 혼자 공부하는 시리즈인 이 책이 더 끌렸는지 모르겠다.

 

과연 정말 혼자 공부하는데 포기하지 않고 나아갈 수 있을지 궁금해진다.

 

그럼 이 책에 목차를 먼저 살펴보고 몇 주간 접해보면서 느낀점들을 적어보겠다.

 

 


도서 목차

 

  • 챕터 1 - 나의 첫 머신러닝
  • 챕터 2 - 데이터 다루기
  • 챕터 3 - 회귀 알고리즘과 모델 규제
  • 챕터 4 - 다양한 분류 알고리즘
  • 챕터 5 - 트리 알고리즘
  • 챕터 6 - 비지도 학습
  • 챕터 7 - 딥러닝을 시작합니다
  • 챕터 8 - 이미지를 위한 인공 신경망
  • 챕터 9 - 텍스트를 위한 인공 신경망

 


이 책은 말이지?

 

메인으로 어필하는 부분은 "수식을 왠만하면 배제하고 그림과 예제를 통해 직관적으로 공부할 수 있으면 입문자도 끝까지 일을 수 있으리라 생각해 이 책을 집필"했다라고 한다.

 

그리고 선행지식으로 다른건 필요없다고 한다.

"파이썬" 기초 문법만 알고 있다면 모든 예제 코드를 따라 갈 수 있다고 한다.

 

또한 개발 환경 구축을 위해 시간과 돈을 쓸 필요도 없다고 한다.

"코랩(Colab)"이라는 온라인 개발환경을 구글에서 무료로 제공하기 때문에 누구나 바로 예제를 실행해 볼 수 있다고 한다.

 

아래 학습 로드맵이 이 책을 어떻게 읽어 나가야 할지 방향성을 제시해주고 있다.

긍적적인면은 어느정도 머신러닝 및 딥러닝에 대해 알고 있는 사람이라면 큰 그림을 그릴 수 있도록 해주는 것 같다.

다른측면으로는 입문자에게는 그저 험란한 길임을 알게 해준다.(머리가 아파 온다. 하하)

 


어랏? 읽어 나가다보니?

 

책을 펴고 읽어나가는데 데자뷰 현상 같이 느껴지는 것이 아닌가?

생선 분류 문제로 시작하는데? 뭐지?

 

알고보니 나는.. 이 책을 첫 발매했을 시점에 리뷰를 했었던 것이었다.

벌써 2년이라는 시간이 지났구나!

하지만 나의 머신러닝, 딥러닝에 대한 지식은 늘은게 없구나를 다시 한번 느꼈다.

 

 


다시 각잡고 읽어볼까?

 

이런말이 있죠? 

책은 못해도 3번은 읽어야 한다.

아는만큼 책의 내용도 다르게 다가오는 법이죠!

 

이 책의 최대 장점은 "스토리텔링"이다. 

단순히 개념을 딱딱하게 설명하는 것이 아니라 등장인물을 배치하고 그가 겪는 사례들을 가지고 이야기를 풀어나간다.

이게 은근히 재미있고 내용에 빠져들게 하는 묘한 매력이 있다.

 

물론 그렇다고 해서 내용 자체가 쉬워지는 것은 아니다.

분명히 어려운 용어들이 나온다.

하지만 최대한 추가 설명을 해주고 있기 때문에 이해하려고 노력하거나 그냥 암기하는 정도로 넘어가도 될 것 같다.

 

샘플 코드를 파이썬으로 코딩하다보면 정말 라이브러리가 제공되고 있어서 다행이라는 생각이 들었다.

없었다면 내가 저걸 어떻게 구현해 나가지? 머리가 아파온다.

 

 


정리해볼까?

 

 

아무리 수식을 최대한 배제한다고 해도 기본적인 용어, 수학적 개념, 알고리즘 등 관련한 내용들에서는 어려움이 있을 수 밖에는 없는 것 같다. (물론 이런 분야를 잘하는 사람이라면 말이 달라질 수 있다.)

 

그래도 희망적인 것은 정말로 천천히 읽어 나가는 재미가 있다는 점이다.

그리고 파이썬이라는 비교적 배우기 쉬운 언어와 머신러닝과 딥러닝을 위하여 제공되는 라이브러리코랩이라는 개발 환경이 있기에 혼자서 공부할 수 있다라는 점이다.

 

정리하면, 머신러닝, 딥러닝을 시작함에 있어서 첫 디딤돌이 될 수 있는 책이라고 생각된다.

 

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


KakaoTalk_20230423_235453685.png

 

도서명: 혼자 공부하는 머신러닝+딥러닝

출판사: 한빛미디어

 

세줄요약

머신러닝과 딥러닝에 대해서 입문자용으로 쉽게 설명해 준다.

다양한 예제를 많이 다루어서 예제를 바탕으로 이해하는데 좋다.

책의 구성 순서가 좋다: 회귀알고리즘, 분류알고리즘, 트리알고리즘, 비지도학습, 딥러닝, 이미지 인공신경망, 텍스트 인공신경망

 

장점

입문자용으로 내용을 쉽게 쓰였으며 설명이 자세하다.

다른 입문용 책은 파이썬기초가 많이 할애되는경우가 많은데 이책은 조금만 다루어서 좋다.

실제 파이썬 예제가 잘 나와 있어서 따라해보고 이해하는데 좋다.

마무리 및 확인문제가 있어서 공부한 내용을 정리 및 테스트해볼 수 있어서 좋다.

혼공 시리즈답게 혼자서 공부하기에 좋은 책이다.

 

단점

컨텐츠와는 별개로 폰트나 화면 구성이 눈에 잘 들어오지 않는다.

  -> 디자인적인 요소라 제 개인적인 의견입니다.

 

후기

혼공 시리즈가 그러하듯이 입문자가 혼자 공부하기에는 정말로 좋은 책입니다. 

이 책을 처음부터 끝까지 쭈욱 보고나면 머신러닝+딥러닝에 대한 기초 개념이 잘 잡힙니다.

다만, 입문자용이므로 조금 더 깊이 있게 공부하고자 한다면 초중급, 중급용 책으로 진행하시면 됩니다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

나는 머신러닝 개발자로 일하고 있지만 아직도 알고리즘이 어렵다.
어떤 알고리즘이 어떤 특징이 있는지, 어디에 유용한지 등을 제대로 이해하지를 못해서 기능 개선을 못하는 답답함...

 


이런 나에게 어느 날 한줄기 빛과도 같은 책이 나타났다. 바로 《혼자 공부하는 머신러닝 딥러닝》!
시중에 있는 대다수의 도서서들은 데이터 분석이랍시고 데이터 읽어오는 법, 예쁘게 만드는 법들만 소개한다.
그러나 이 책은 데이터 처리보다는 회귀, 분류, 군집 알고리즘 등 다양한 모델들을 소개한다.

 

KakaoTalk_20230423_231019267.jpg

 

 

페이지를 넘기면 뒷쪽에는 딥러닝 신경망까지 갖추고 있다. 와...
이 책은 현업에 있는 사람들이 정말 필요로 하는 내용들을 알려주고 있다.
각 분석 알고리즘들이 어떻게 생겼는지, 어디에 유용한지, 파라미터들은 뭘 의미하는지 등 개발자가 가려워하는 부분을 정확하게 긁어준다.

 

​그동안 알고리즘 공부하느라 머리싸맸던거 생각하니 살짝 억울한 기분ㅎㅎ
어려울 수 있는 알고리즘을 그림과 비유 등을 통해 쉽게 설명해준다.
​하... 이 책을 왜 이렇게 늦게 알았죠...

 


* 한빛미디어 <나는 리뷰어다> 활동을 위해 책을 제공받아 작성한 서평입니다. *

 

 

 

0. 소개

 

인공지능 알고리즘인 머신러닝과 딥러닝에 대해 잘 정리되어 있는 책입니다.

 

쉽게 쓰여져 있어 인공지능에 입문하기에 좋은 책입니다. 

 

인공지능이라는 분야 자체가 가져다주는 무게감으로 인해 입문하기가 어려웠던 독자들에게 도움이 될 것 같습니다.

 

또한, 핸즈 온 머신러닝의 번역을 맡으신 박해선 번역가님이 번역을 맡으신 것도 이 책의 큰 장점 중 하나입니다.


1. 구성

 

Chapter 01 나의 첫 머신러닝 ▶️이 생선의 이름은 무엇인가요?

__ 01-1 인공지능과 머신러닝, 딥러닝 ▶️ 인공지능과 머신러닝, 딥러닝은 무엇일까요?

____ 인공지능이란

____ 머신러닝이란

____ 딥러닝이란

____ 키워드로 끝내는 핵심 포인트

____ 이 책에서 배울 것은

__ 01-2 코랩과 주피터 노트북 ▶️코랩과 주피터 노트북으로 손코딩 준비하기

____ 구글 코랩

____ 텍스트 셀

____ 코드 셀

____ 노트북

____ 키워드로 끝내는 핵심 포인트

____ 표로 정리하는 툴바와 마크다운

____ 확인 문제

__ 01-3 마켓과 머신러닝 ▶️마켓을 예로 들어 머신러닝을 설명합니다.

____ 생선 분류 문제

____ 첫 번째 머신러닝 프로그램

____ [문제해결 과정] 도미와 빙어 분류

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 02 데이터 다루기 ▶️수상한 생선을 조심하라!

__ 02-1 훈련 세트와 테스트 세트 ▶️ 모델을 훈련 시키는 훈련 세트와 검증하는 테스트 세트로 나누어 학습하기 

____ 지도 학습과 비지도 학습

____ 훈련 세트와 테스트 세트

____ 샘플링 편향

____ 넘파이

____ 두 번째 머신러닝 프로그램

____ [문제해결 과정] 훈련 모델 평가

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 02-2 데이터 전처리 ▶️정교한 결과 도출을 위한 데이터 전처리 알아보기

____ 넘파이로 데이터 준비하기

____ 사이킷런으로 훈련 세트와 테스트 세트 나누기

____ 수상한 도미 한 마리

____ 기준을 맞춰라

____ 전처리 데이터로 모델 훈련하기

____ [문제해결 과정] 스케일이 다른 특성 처리

____ 키워드로 끝나는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 03 회귀 알고리즘과 모델 규제 ▶️농어의 무게를 예측하라!

__ 03-1 k-최근접 이웃 회귀 ▶️회귀 문제를 이해하고 k-최근접 이웃 알고리즘으로 풀어 보기

____ k-최근접 이웃 회귀

____ 데이터 준비

____ 결정계수(R2)

____ 과대적합 vs 과소적합

____ [문제해결 과정] 회귀 문제 다루기

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 03-2 선형 회귀 ▶️ 사이킷런으로 선형 회귀 모델 만들어 보기

____ k-최근접 이웃의 한계 

____ 선형 회귀

____ 다항 회귀

____ [문제해결 과정] 선형 회귀로 훈련 세트 범위 밖의 샘플 예측

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 03-3 특성 공학과 규제 ▶️특성 공학과 규제 알아보기

____ 다중 회귀

____ 데이터 준비

____ 사이킷런의 변환기

____ 다중 회귀 모델 훈련하기

____ 규제

____ 릿지 회귀

____ 라쏘 회귀

____ [문제해결 과정] 모델의 과대적합을 제어하기

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 04 다양한 분류 알고리즘 ▶️럭키백의 확률을 계산하라!

__ 04-1 로지스틱 회귀 ▶️로지스틱 회귀 알고리즘을 배우고 이진 분류 문제에서 클래스 확률 예측하기 

____ 럭키백의 확률

____ 로지스틱 회귀

____ [문제해결 과정] 로지스틱 회귀로 확률 예측

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 04-2 확률적 경사 하강법 ▶️경사 하강법 알고리즘을 이해하고 대량의 데이터에서 분류 모델을 훈련하기

____ 점진적인 학습

____ SGDClassifier

____ 에포크와 과대/과소적합

____ [문제해결 과정] 점진적 학습을 위한 확률적 경사 하강법

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 05 트리 알고리즘 ▶️화이트 와인을 찾아라!

__ 05-1 결정 트리 ▶️결정 트리 알고리즘을 사용해 새로운 분류 문제 다루기

____ 로지스틱 회귀로 와인 분류하기

____ 결정 트리

____ [문제해결 과정] 이해하기 쉬운 결정 트리 모델 

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 05-2 교차 검증과 그리드 서치 ▶️검증 세트가 필요한 이유를 이해하고 교차 검증해 보기

____ 검증 세트

____ 교차 검증

____ 하이퍼파라미터 튜닝

____ [문제해결 과정] 최적의 모델을 위한 하이퍼파라미터 탐색

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 05-3 트리의 앙상블 ▶️ 앙상블 학습을 알고 실습해 보기

____ 정형 데이터와 비정형 데이터

____ 랜덤 포레스트

____ 엑스트라 트리

____ 그레이디언트 부스팅

____ 히스토그램 기반 그레이디언트 부스팅

____ [문제해결 과정] 앙상블 학습을 통한 성능 향상

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 06 비지도 학습 ▶️비슷한 과일끼리 모으자!

__ 06-1 군집 알고리즘 ▶️ 흑백 이미지 분류 방법과 비지도 학습, 군집 알고리즘 이해하기

____ 과일 사진 데이터 준비하기

____ 픽셀값 분석하기

____ 평균값과 가까운 사진 고르기

____ [문제해결 과정] 비슷한 샘플끼리 모으기

____ 키워드로 끝내는 핵심 포인트

____ 확인 문제

__ 06-2 k-평균 ▶️k-평균 알고리즘 작동 방식을 이해하고 비지도 학습 모델 만들기

____ k-평균 알고리즘 소개

____ KMeans 클래스

____ 클러스터 중심

____ 최적의 k 찾기

____ [문제해결 과정] 과일을 자동으로 분류하기

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 06-3 주성분 분석 ▶️차원을 알고 차원 축소 알고리즘 PC 모델 만들기 

____ 차원과 차원 축소

____ 주성분 분석 소개

____ PCA 클래스

____ 원본 데이터 재구성

____ 설명된 분산

____ 다른 알고리즘과 함께 사용하기

____ [문제해결 과정] 주성분 분석으로 차원 축소

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 07 딥러닝을 시작합니다 ▶️패션 럭키백을 판매합니다!

__ 07-1 인공 신경망 ▶️ 텐서플로로 간단한 인공 신경망 모델 만들기

____ 패션 MNIST

____ 로지스틱 회귀로 패션 아이템 분류하기

____ 인공 신경망

____ 인공 신경망으로 모델 만들기

____ 인공 신경망으로 패션 아이템 분류하기

____ [문제해결 과정] 인공 신경망 모델로 성능 향상

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 07-2 심층 신경망 ▶️인공 신경망에 층을 추가하여 심층 신경망 만들어 보기

____ 2개의 층

____ 심층 신경망 만들기

____ 층을 추가하는 다른 방법

____ 렐루 활성화 함수

____ 옵티마이저

____ [문제해결 과정] 케라스 API를 활용한 심층 신경망

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 07-3 신경망 모델 훈련 ▶️인경 신경망 모델 훈련의 모범 사례 학습하기 

____ 손실 곡선

____ 검증 손실

____ 드롭아웃

____ 모델 저장과 복원

____ 콜백

____ [문제해결 과정] 최상의 신경망 모델 얻기

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 08 이미지를 위한 인공 신경망 ▶️패션 럭키백의 정확도를 높입니다!

__ 08-1 합성곱 신경망의 구성 요소 ▶️합성곱 신경망의 개념과 동작 원리를 배우고 간단한 실습하기 

____ 합성곱

____ 케라스 합성곱 층

____ 합성곱 신경망의 전체 구조

____ [문제해결 과정] 합성곱 층과 풀링 층 이해하기

____ 키워드로 끝내는 핵심 포인트

____ 확인 문제

__ 08-2 합성곱 신경망을 사용한 이미지 분류 ▶️케라스 API로  합성곱 신경망 모델 만들기 

____ 패션 MNIST 데이터 불러오기

____ 합성곱 신경망 만들기

____ 모델 컴파일과 훈련

____ [문제해결 과정] 케라스 API로 합성곱 신경망 구현

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 08-3 합성곱 신경망의 시각화 ▶️신경망이 이미지에서 학습하는 게 무엇인지 이해하기

____ 가중치 시각화

____ 함수형 API

____ 특성 맵 시각화

____ [문제해결 과정]

____ 시각화로 이해하는 합성곱 신경망

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

Chapter 09 텍스트를 위한 인공 신경망 ▶️한빛 마켓의 댓글을 분석하라!

__ 09-1 순차 데이터와 순환 신경망 ▶️순차 데이터의 특징과 개념 이해하기 

____ 순차 데이터 

____ 순환 신경망

____ 셀의 가중치와 입출력

____ [문제해결 과정] 순환 신경망으로 순환 데이터 처리

____ 키워드로 끝내는 핵심 포인트

____ 확인 문제

__ 09-2 순환 신경망으로 IMDB 리뷰 분류하기 ▶️텐서플로 순환 신경망으로 영화 리뷰 분류하기 

____ IMDB 리뷰 데이터셋

____ 순환 신경망 만들기

____ 순환 신경망 훈련하기

____ 단어 임베딩을 사용하기

____ [문제해결 과정] 케라스 API로 순환 신경망 구현

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

__ 09-3 LSTM과 GRU 셀 ▶️순환 신경망의 중요 기술을 사용해 모델 만들어 보기

____ LSTM 구조

____ LSTM 신경망 훈련하기

____ 순환층에 드롭아웃 적용하기

____ 2개의 층을 연결하기

____ GRU 구조

____ GRU 신경망 훈련하기

____ [문제해결 과정] LSTM과 GRU 셀로 훈련

____ 키워드로 끝내는 핵심 포인트

____ 핵심 패키지와 함수

____ 확인 문제

 

__ 부록 A 한발 더 나아가기

__ 부록 B 에필로그

 

____ 정답 및 해설

____ 찾아보기

 

 

2. 대상 독자

 

머신러닝과 딥러닝에 대해 궁금하신 분, 인공지능에 입문하고 싶으신 분들에게 이 책을 추천합니다.

 

 

한빛미디어 '나는 리뷰어다' 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

# 내용

한줄 요약: 

머신러닝과 딥러닝에 대한 교과서

KeyPoint: 

# 느낀 점

혼자 공부하는 머신러닝과 딥러닝 책은 머신러닝과 딥러닝을 처음 접하는 사람에게 적극 추천하고 싶은 책이다. 머신러닝을 처음 공부할 때 가장 막막한 부분이 수식이며 이로인해 많이 포기하곤 하는데, 이 책에서는 최대한 수식을 다루고 있지 않은 점에서 정말 추천하고 싶다. 물론 그렇다고 빠져있는 부분이 있는 것도 아니다. 기초를 이해하는 데 충분한 서적인 것 같다. 

추가로, 책에 대해 궁금한 점이 있으면 오픈 채팅(암호: flow)이나 구글 그룹 Q&A를 통해 바로 답변을 해주신다고 하니 정말 혼자 공부하기 편한 서적같다.

혼자 공부할 수 있도록 도와주는 혼공단 시리즈의 야심작 혼자 공부하는 머신러닝 딥러닝입니다처음 이 책을 받았을 때 당황했는데책의 두께는 약 530쪽으로 무섭도록 두껍습니다그렇지만 이러한 내용은 초보자들도 이해하기 쉽도록 가르치니 너무 걱정하지 않으셔도 됩니다.

책 서두에서 파이선 기본 문법과 배울 의지만 있으면 충분하다는 말과 함께 다양한 이야기를 통해 머신러닝의 세계를 풀어나갑니다예를 들어 레드 와인과 화이트 와인을 잘 구별할 수 있는 모델을 만들었는데이러한 모델 검증을 테스트 케이스에만 의존하지 않고 객관적으로 검증할 수 있게 만드는 방법을 검증 세트라고 하는 점처럼 일상생활 속에서 찾아볼 수 있는 다양한 예제를 통해 이를 설명하고 있습니다.

또한 구글 코랩을 사용하면서 실습을 쉽게 하면서 배워나갈 수 있고이를 그림과 설명을 통해 자세하게 풀어나가고 있습니다또한각 단계에서 손 코딩으로 직접 해당 문제를 입력해서 풀어보는 시간을 가지며기억할 수 있도록 돕는데이 점이 마음에 들었습니다.

각 장에서도 앞서 말한 이야기에 대한 문제해결 과정을 열거하듯이 설명하며 이와 비슷한 다른 프로젝트에도 어떻게 적용해야 할지 사고하는 방법을 기르고이를 장 마지막 장에서 핵심 요약과 함께 확인 문제를 풀며 복습할 수 있게 만들었습니다.

또한 실습 예제를 내려받아 손 코딩에서 에러가 날 시에 이와 비교해서 진행할 수 있고온라인 강의도 제공되어 있기에 막히는 부분은 해당 강의 영상을 접하며 알아가시면 좋을 것 같습니다.

물론 과목이 과목인 만큼 쉽게 가르친다고 하지만서도 어려운 부분이 존재하는 건 당연합니다그리고 그만큼 많이 헤매실 수도 있습니다그래도 끈기를 가지고 계속 나아가시다 보면 GPT의 기초를 이해할 만큼 성장하실 수 있으리라 믿습니다.


<< 이 글은 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다. >>

20230423_215450.jpg

 

이번에 리뷰할 책은 혼자 공부하는 머신러닝+딥러닝 책을 제공받았습니다. 현재 4차 산업혁명을 맞아 인공지능 기술이 각광을 받으면서 많은 사람들이 딥러닝에 관심을 가지기 시작하였고, 현재 공과대학에서 파이썬을 주요 프로그래밍 언어로 채택하여 가리키고 있습니다.

본 책은 예제들이 자세히 나와있고 연습문제와 코드들이 적혀있으며, 한 번씩 혼자 생각하고 연습할 수 있게 내용들이 알차게 구성되어 있습니다. 제일 눈에 띄었던 점은 개념에 대한 설명과 알고리즘을 어떠한 상황에 적절하게 적용해야 하는지도 설명하여 좋았습니다.

책을 읽으면서 연구​자로써 한 번 더 기본을 탄탄히 다질 수 있는 책이였으며, 추후 딥러닝을 입문하시는 분들께도 추천드리고 싶은 책입니다.

마지막으로 좋은 책 제공과 기회를 주신 한빛미디어 담당자 분들께 감사 드립니다. 5월에도 내용이 탄탄한 도서를 읽고 빨리 리뷰를 남기고 싶습니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

"한빛미디어 <나는 리뷰어다>활동을 위해서 책을 제공받아 작성된 서평입니다."

IMG_1152 중간.png

 

기존의 기초 머신러닝, 딥러닝이라고 해도 프로그램을 통한 알고리즘과 수식으로 수포자에게는 쉽게 접근하기 어려운 경우가 많았다. 

하지만 이 책은 이야기를 풀어가는 형식으로 진행을 하여 처음 접근하기에 부담이 없이 따라가며 진행을 할 수 있다.

 

IMG_1153 중간.png

 

이 책은 기본적으로 파이썬의 기본 문법을 습득한 상태에서 예제를 따라 진행을 하면 좋을듯하다.

또한 부록 편에는 이 책에서 소개된 내용은 빙산의 일각이라는 내용과 함께 더 깊은 공부를 원하는 경우에 대한 소개도 하고 있다.

물론 이 책으로 머신러닝, 딥러닝에 대해 공부하고 관심을 갖게 된 사람이라면 더욱 자세히 찾아보겠지만 말이다.

 

IMG_1154 중간.png

 

나는 개발자이지만 머신러닝, 딥러닝에 기술에 대해 회의감을 갖고 있다.

하지만 머신러닝, 딥러닝에 대해 기본적인 학습은 있어야 대화가 가능할 것이다.

막연하게 머신러닝딥러닝이 뭐지라는 궁금증을 갖고 있는 사람에게 추천하고 싶은 책이다

혼공 도서는 헤드퍼스트 시리즈처럼 내용과 편집, 구성의 조합이 완벽하다고 생각합니다.

ML/DL 관련 도서는 많지만 이렇게 초보자에게 친절하게 설명하는 책은 없었던 것 같습니다. 

 

다른 책에서 당연하게 진행하는 과정들을 왜 이렇게 해야하는지 독자가 생각하고 이해할 수 있게 만들어 주는게 이 책의 가장 큰 장점인거 같습니다.

책의 내용을 따라만 하는게 아니라 스스로 생각하고 이해할 수 있게 구성이 되어 있어 끝까지 재밌게 공부할 수 있었습니다.

다양한 사례와 실습으로 구성되어 있어 누구든 쉽게 ML/DL을 시작할 수 있을 것 같습니다.

 

감히 제가 생각하기에 ML/DL 입문서로는 제일 좋은 것 같습니다.

입문서로 많이 추천하는 "핸즈온 머신러닝" 책이 처음 봤을 때 어려운 느낌을 받았었는데, 이 책을 보고 본다면 이해에 많은 도움이 될 것 같습니다.

강력하게 추천 드립니다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

글 / 사진 : 서원준 (news@toktoknews.com


 

 


본 소개 글은 한빛미디어 “나는 리뷰어다” 를 통해 도서를 제공받아 작성되었습니다. 


2023년도 이제 4월 하순을 넘어 4월 말로 치닫고 있다. 날씨가 추웠다 더웠다를 반복하면서 일교차가 굉장히 크다. 계절상 늦은 봄에서 초여름으로 넘어가고 있긴 하나 아침저녁으로는 날씨가 서늘하다. 바깥 활동을 하시는 분들은 옷차림과 건강에 각별히 신경을 써 주시기 바란다. 


이 포스팅에서 살펴볼 도서는 혼자 공부하는 사람들을 위한 책, 그러니까 독학으로 공부하는 분들을 위한 책이 되겠다. 그런데 이 책은 조금 틀리다. 너무 어려운 거 아니냐고 할 지 모르지만 최근 많은 주목을 받고 있는 분야임에 틀림없다. 


프로그래밍을 배운 분들이라면 이것도 쉽게 정복할 수 있다. 그러면 이렇게 묻는 분들이 계실 수 있다. 엥? 독학으로? 가능하다. 바로 “혼자 공부하는 머신러닝, 딥러닝” 이란 책이 그 답을 제공해 준다. 


 

 

 

 

 

 

 

 

 

 

 

 

 

 


“혼자 공부하는 머신러닝, 딥러닝” 책은 최근 그 중요성이 더욱 커졌다. 이유는 다름아닌 챗GPT의 존재 때문이다. 이 챗 GPT는 전혀 다른 분야여서 책을 따로 사야 하는 거 아니냐고 생각하기 쉽다. 그런데 필자가 인터넷에서 자료를 뒤져보니 전혀 아니었다. 


챗 GPT는 “머신러닝의 일종인 딥러닝의 발전 과정에서 나온 것” 이라고 되어 있었고 수많은 학자들과 다양한 기사 및 관련자료들도 챗 GPT, 머신러닝, 딥러닝이 관계가 있음을 인정하고 있다. 그러므로 혼자 공부하는 “머신러닝, 딥러닝”을 잘 이해하게 된다면 현재 화두가 되고 있는 챗 GPT 도 이해가 가능해지게 되는 셈이다. 


또한 이 책을 꼭 봐야 하는 이유는 최근 화두가 되고 있는 초거대 인공지능의 원리를 알아야 하기 때문이다. 날로 발전하는 인공지능에 뒤처지지 않으려면 인공지능을 프로그래밍적으로 구현한 머신러닝, 딥러닝에 대한 기본적인 이해가 필요하다. 그리고 이 책은 어려운 프로그램을 가지고 환경설정이니 뭐니 할 것 같으나 실제는 아니다. 구글 코랩을 사용하여 환경설정 없이 바로 실습할 수 있도록 도와준다. 


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


도서 소개를 마치면서


“혼자 공부하는 머신러닝 딥러닝” 은 출간한지 오래 된(?) 책이어서 그런지 챗 GPT에 대한 설명은 아예 빠져 있다. 이 책이 출간된 2020년 12월에 챗 GPT가 수면 위로 떠오르리라고 생각한 이는 없을 것 같은데 지금은 세상을 지배하는 무기가 되고 있다. 


그 당시 시점으로 보면 이 책이 중요하지 않겠지만 지금 초거대 인공지능의 시대가 우리 앞에 다가오는 것을 보면 “혼자 공부하는 머신러닝 딥러닝” 책의 필요성은 더욱 커진다. 지금 시점에서 이 책을 읽고 실습하며 이해하는 것은 대단히 중요한 의미를 가진다고 하겠다. 

 

 

혼자 공부하는 머신러닝 + 딥러닝

 

홍공머신 : 혼자공부하는 일에 능숙한 사람 혹은 그런 무리를 일컫는 신조어

 

이 책은 이론과 방식 설명에 예를 들어 설명해줘 접근이 쉽도록 도와주는 책으로 비전공자도 입문서로 활용하기에 좋은 책입니다. 책 안에 학습로드맵이 있어서 어떤 부분을 건너뛰고 어떤 부분을 집중적으로 봐야 하는지가 설명이 되어 있어서 인상적이었습니다. 

 

혼자 공부하는 7단계 길잡이

  1. 핵샘키워드 : 해당 절에서 집중적으로 볼 내용을 확인
  2. 시작하기 전에 : 해당 절에서 배울 주제 및 주요 개념 설명
  3. 말풍선 : 지나치기 쉬운 내용 혹은 기억해야 할 내용
  4. 손코딩 : 코드를 직접 손으로 입력하고 실행
  5. 문제해결 과정 : 이 내용을 통해 실제 프로젝트에서 문제를 해결할때 어떤 사고 과정을 거치는지 확인
  6. 핵심 포인트/패키지와 함수 : 핵심포인트, 핵심 패키지와 함수를 통해 핵심 키워드를 리마인드하고, 중요한 함수의 기능 학습
  7. 확인문제 : 문제를 풀면서 지금까지 학습한 내용 확인

 

Chapter 1. 나의 첫 머신러닝

 

인공지능(AI)이란? 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술

머신러닝(Machine Learning)은 규칙을 일일이 프로그램하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야, 사이킷런이 대표적 라이브러리

딥러닝(Deep Learning)은 머신러닝 알고리즘 중에 인공신경망(Artificial Neural Network)을 기반으로 한 방법을 통칭, 텐서플로우, 파이토치가 대표적 라이브러리

 

구글 코랩(Colab)은 웹 브라우저에서 무료로 파이썬 프로그램을 테스트하고 저장할 수 있는 서비스로 클라우드 기반 주피터 노트북 개발환경입니다.  무료라 최대 5개 가상서버를 활용할 수 있습니다. 

 

머신러닝에서 여러 개의 종류(or 클래스) 중 하나를 구별해 내는 문제를 분류(Classification)라고 하며 2개 클래스 중 하나를 고르는 문제를 이진 분류라고 합니다. 

 

머신러닝 용어 

  • 특성 : 데이터를 표현하는 하나의 성질 (ex :  길이, 무게)
  • 훈련 : 데이터에서 규칙을 찾는 과정
  • 모델 : 알고리즘이 구현된 객체(or 알고리즘 자체)
  • 정확도 : 정확한 답을 몇개 맞혔는지를 백분율로 나타낸 값 (ex, 사이킷런에서는 0~1 사이)

 

scikit-learn 

  • KNeighborsClassifier() 는 k-최근접 이웃 분류 모델을 만드는 사이킷런 클래스로 기본값은 5
  • fit() : 사이킷런 모델을 훈련할 때 사용하는 메소드
  • predict() : 사이킷런 모델을 훈련하고 예측할 때 사용하는 메소드
  • score() : 훈련된 사이킷런 모델의 성능을 측정

 

Chapter 2. 데이터 다루기

 

머신러닝 알고리즘은 지도 학습과 비지도 학습으로 나눌 수 있습니다. 지도 학습 알고리즘은 훈련하기 위한 데이터와 정답이 필요하며, 비지도 학습은 타킷 없이 입력 데이터만 사용합니다. 

 

머신러닝의 정확한 평가를 위해서는 테스트 세트와 훈련 세트가 따로 준비되어야 하며, 평가에 사용하는 데이터를 테스트 세트, 훈련에 사용하는 데이터를 훈련 세트라고 부릅니다. 

 

훈련하는 데이터와 테스트 하는 데이터에는 데이터가 골고루 섞여 있어야 합니다. 일반적으로 골고루 섞여 있지 않으면 한쪽으로 치우치는 샘플링 편향(sampling bias)가 발생합니다. 

 

훈련세트는 모델을 훈련할 때 사용하는 데이터로 보통 훈련 세트가 클수록 좋기 때문에 테스트 세트를 제외한 모든 데이터를 사용합니다. 

 

테스트세트는 전체 데이터에서 20~30%를 테스트 세트로 사용하는 경우가 많으며 전체 데이터 아주 큰 경우에는 1%만 덜어내도 충분할 수 있습니다. 

 

데이터 전처리는 머신러닝 모델에 훈련 데이터를 주입하기 전에 가공하는 단계를 말하며 때로는 데이터 전처리에 많은 시간이 소요된다. 

 

표준점수는 훈련 세트의 스케일을 바꾸는 대표적인 방법 중 하나로 표준점수를 얻으려면 특성의 평균을 빼고 표준편차로 나눕니다. 반드시 훈련 세트의 평균과 표준편차로 테스트 세트를 바꿔야 합니다. 

 

브로드캐스팅은 크기가 다른 넘파이 배열에서 자동으로 사칙 연산을 모든 행이나 열로 확장하여 수행하는 기능입니다. 

 

Chapter 3. 회귀 알고리즘과 모델 규제

 

지도 학습 알고리즘은 크게 분류와 회귀로 나뉘어지고, 분류는 샘플을 몇 개의 클래스 중 하나로 분류하는 문제입니다. 회귀는 클래스 중 하나로 분류하는 것이 아니라 임의의 어떤 숫자를 예측하는 문제입니다. 

 

두 변수 사이의 상관관계를 분석하는 방법 : 회귀(regression)

 

k-최근접 이웃 회귀 :  k-최근접 이웃 알고리즘을 사용해 회귀 문제를 풀며, 가장 가까운 이웃 샘플을 찾고 이 샘플들의 타킷값을 평균하여 예측으로 삼습니다. 

 

결정계수 : 대표적인 회귀 문제의 성능 측정도로 1에 가까울수록 좋고, 0에 가까울수록 성능이 나쁜 모델입니다. 

 

과대적합 vs 과소적합

 

과대적합 : 모델의 훈련 세트 성능이 테스트 세트 성능보다 훨씬 높을 때 일어납니다. 모델이 훈련 세트에 너무 집착하여 데이터에 내재된 거시적인 패턴을 감지하지 못합니다. 

과소적합 : 훈련 세트와 테스트 세트 성능이 모두 동일하게 낮거나 테스트 세트 성능이 오히려 더 높을 때 일어납니다. 이런 경우 더 복잡한 모델을 사용해 훈련 세트에 잘 맞는 모델을 만들어야 합니다. 

 

선형회귀 

 

널리 사용되는 대표적인 회귀 알고리즘으로 비교적 간단하고 성능이 뛰어납니다. 특성이 하나인 경우 어떤 직선을 학습하는 알고리즘입니다. (ex, LinearRegression) 

 

모델 파라미터는 선형 회귀가 찾은 가중치처럼 머신러닝 모델이 특성에서 학습한 파라미터를 의미합니다. 

 

다중회귀

 

여러 개의 특성을 사용하는 회귀모델입니다. 특성이 많으면 선형 모델은 강력한 성능을 발휘합니다.

 

특성공학 : 주어진 특성을 조합하여 새로운 특성을 만드는 일련의 작업 과정

릿지 : 규제가 있는 선형 회귀 모델 중 하나이며 선형 모델의 계수를 작게 만들어 과대적합을 완화

라쏘 : 또 다른 규제가 있는 선형 회귀 모델입니다. 릿지와 달리 계수 값을 아예 0으로 만들수 있습니다.

하이퍼파라미터 : 머신러닝 알고리즘이 학습하지 않는 파라미터, 이 파라미터는 사람이 사전에 지정해야 합니다. 

 

Chapter 4. 다양한 분류 알고리즘

 

로지스틱 회귀

 

로직스틱 회귀는 이름은 회귀이지만 분류 모델입니다. 선형 회귀와 달리 시그모이드 함수나 소프트맥스 함수를 사용하여 클래스 확률을 출력할 수 있습니다. 

 

다중분류는 타킷 클래스가 2개 이상인 분류 문제입니다. 로지스틱 회귀는 다중 분류를 위해 소프트맥스 함수를 사용하여 클래스를 예측합니다. 

 

시그모이드 함수는 선형 방정식의 출력을 0과 1시아의 값으로 압축하며 이진 분류를 위해 사용합니다. 

 

소프트맥스는 다중 분류에서 여러 선형 방적식의 출력 결과를 정규화하여 합이 1이 되도록 만듭니다. 

 

확률적 경사 하강법

 

확률적 경사 하강법은 훈련 세트에서 샘플 하나씩 꺼내 손실 함수의 경사를 따라 최적의 모델을 찾는 알고리즘입니다. 샘플을 하나씩 사용하지 않고 여러 개를 사용하면 미니배치 경사 하강법이 됩니다. 한번에 전체 샘플을 사용하면 배치 경사 하강법이 됩니다.

 

손실함수는 확률적 경사 하강법이 최적화할 대상입니다. 대부분의 문제에 잘 맞는 손실 함수가 이미 정의되어 있습니다. 이진 분류에는 로지스틱 회귀 손실 함수를 사용합니다. 다중 분류에는  크로스엔트로피 손실 함수를 사용합니다. 회귀 문제에는 평균 제곱 오차 손실 함수를 사용합니다.

 

에포크(epoch)는 확률적 경사 하강법에서 전체 샘플을 모두 사용하는 한번 반복을 의미합니다. 일반적으로 경사 하강법 알고리즘은 수십에서 수백 번의 에포크를 반복합니다. 

 

 

Chapter 5. 트리 알고리즘

 

결정트리는 예/아니오에 대한 질문을 이어나가면서 정답을 찾아 학습하는 알고리즘으로 비교적 예측 과정을 이해하기 쉽고 성능도 뛰어납니다. 

 

불순도는 결정트리가 최적의 질문을 찾기 위한 기준으로 사이킷런은 지니 불순도와 엔트로피 불순도를 제공합니다. 

 

정보이득은 부모 노드와 자식 노드의 불순도 차이입니다. 결정 트리 알고리즘은 정보 이득이 최대화되도록 학습합니다. 

 

결정트리는 제한 없이 성장하면 훈련 세트에 과대적합되기 쉽습니다. 가지치기는 결정트리의 성장을 제한하는 방법으로 사이킷런의 결정트리 알고리즘은 여러가지 가지치기 매개변수를 제공합니다. 

 

특성중요도는 결정트리에 사용된 특성이 불소도를 감소하는데 기여한 정도를 나타내는 값으로 특성 중요도를 계산할 수 있는 것이 결정트리의 큰 장점입니다. 

 

검증 세트는 하이퍼파라미터 튜닝을 위해 모델을 평가 할 때, 테스트 세트를 사용하지 않기 위해 훈련 세트에서 다시 떼어 낸 데이터 세트입니다.

 

교차 검증은 훈련 세트를 여러 폴드로 나눈 다음 한 폴드가 검증 세트의 역할을 하고 나머지 폴드에서는 모델을 훈련합니다. 교차 검증은 이런 식으로 모든 폴드에 대해 검증 점수를 얻어 평균하는 방법입니다.

 

그리드 서치는 하이퍼파라미터 탐색을 자동화해주는 도구입니다. 탐색할 매개변수를 나열하면 교차 검증을 수행하여 가장 좋은 검증 점수의 매개변수 조합을 선택합니다. 마지막으로 이 매개변수 조합으로 최종 모델을 훈련합니다.

 

랜덤 서치는 연속된 매개변수 값을 탐색할 때 유용합니다. 탐색할 값을 직접 나열하는 것이 아니고 탐색 값을 샘플링할 수 있는 확률 분포 객체를 전달합니다. 지정된 횟수만큼 샘플링하여 교차 검증을 수행하기 때문에 시스템 자원이 허락하는 만큼 탐색량을 조절할 수 있습니다. 

 

앙상블 학습은 정형 데이터에서 가장 뛰어난 성능을 내는 머신러닝 알고리즘 중 하나입니다.

 

랜덤포레스트 : 대표 앙상블 학습 알고리즘으로 부트스트랩 샘플을 사용하고 랜덤하게 일부 특성을 선택하여 트리를 만드는 것이 특징입니다.

 

엑스트라 트리 : 결정 트리의 노드를 랜덤하게 노드를 분할해 과대적합을 감소시킵니다. 

 

그레디언트 부스팅 : 이전 트리의 손실을 보완하는 식으로 얕은 결정 트리를 연속하여 추가하여 손실함수를 최소화하는 앙상블 방법입니다. 훈련 속도가 조금 느리지만 더 좋은 성능을 기대할 수 있습니다. 

 

히스토그램 기반 그레디언트 부스팅 : 훈련 데이터를 256개 정수 구간으로 나누어 빠르고 높은 성능을 매우 인기가 높습니다. 

 

Chapter 6. 비지도 학습

 

비지도 학습은 머신러닝의 한 종류로 훈련 데이터에 타킷이 없습니다. 타킷이 없기 때문에 외부의 도움없이 스스로 유용한 무언가를 학습해야 합니다. 대표적인 비지도 학습 방법은 군집, 차원 축소 등입니다.

 

히스토그램은 구간별로 값이 발생한 빈도를 그래프로 표시한 것입니다. 보통 x축이 값의 구간(계급)이고 y축은 발생 빈도(도수)입니다.

 

군집은 비슷한 샘플끼리 하나의 그룹으로 모으는 대표적인 비지도 학습 작업으로 군집 알고리즘으로 모은 샘플 그룹을 클러스터라고 부릅니다.

 

k-평균 알고리즘은 처음에 랜덤하게 클러스터 중심을 정하고 클러스터를 만듭니다. 그 다음 클러스터의 중심을 이동하고 다시 클러스터를 만드는 식으로 반복해서 최적의 클러스터를 구성하는 알고리즘입니다.

 

차원 추고는 원본 데이터의 특성을 적은 수의 새로운 특성으로 변환하는 비지도 학습의 한 종류입니다. 차원 축소는 저장공간을 줄이고 시각화하기 쉽습니다. 또한 다른 알고리즘의 성능을 높일 수 도 있습니다. 

 

주성분 분석(PCA)는 차원 축소 알고리즘의 하나로 데이터에서 가장 분산이 큰 방향을 찾는 방법입니다. 이런 방향을 주성분이라고 부릅니다. 원본 데이터를 주성분에 투영하여 새로운 특성을 만들 수 있습니다. 일반적으로 주성분은 원본 데이터에 있는 특성 개수보다 작습니다. 

 

Chapter 7. 딥러닝을 시작합니다

 

인공신경망은 생물학적 뉴런에서 영감을 받아 만든 머신러닝 알고리즘이다. 이름이 신경망이지만 실제 우리 뇌를 모델링한 것은 아닙니다. 인공신경만은 다름 이름으로 딥러닝이라고 부릅니다.

 

텐서플로는 구글이 만든 딥러닝 라이브러리로 매우 인기가 높으며 CPU와 GPU를 사용해 인공 신경망 모델을 효율적으로 훈련하며 모델 구축과 서비스에 필요한 다양한 도구를 제공합니다. 텐서플로2.0부터 신경망 기 모델을

빠르게 구성할 수 있는 케라스를 핵심 API로 채택하여 간단한 모델에서 복잡한 모델까지 손쉽게 만들수 있습니다.

 

밀집층은 가장 간단한 인공신경망의 층입니다. 인공신경망에는 여러 종류의 층이 있습니다. 밀집층에서는 뉴런들이 모두 연결되어 있기 때문에 완전 연결 층이라고 부릅니다. 특별히 출력층에 밀집층을 사용할 때는 

분류하려는 클래스와 동일한 개수의 뉴런을 사용합니다. 

 

원-핫 인코딩은 정수값을 배열에서 해당 정수 위치의 원소만 1이고 나머진 모두 0으로 변환합니다,. 이런 변환이 필요한 이유는 다중 분류에서 출력층에서 만든 확률과 크로스 엔트로피 손실을 계산하기 위해서 입니다.

 

심층 신경망은 2개 이상의 층을 포함한 신경망입니다. 종종 다층 인공신경망, 심층신경망, 딥러닝을 같은 의미로 사용합니다.

 

렐루 함수는 이미지 분류 모델의 은닉층에 많이 사용하는 활성화 함수입니다. 시그모이드 함수는 층이 많을수록 활성화 함수의 양쪽 끝에서 변화가 작기 때문에 학습이 어려워집니다. 렐루 함수는 이런 문제가 없으며 계산도 간단합니다.

 

옵티마이저는 신경망의 가중치와 절편을 학습하기 위한 알고리즘으로 케라스에는 다양한 경사 하강법 알고리즘이 구현되어 있습니다. 대표적으로 SGD, 네스테로포 모멘텀, RMSprop, Adam 등이 있습니다.

 

드롭아웃은 은닉층에 있는 뉴런의 출력을 랜덤하게 꺼서 과대적합을 막는 기법입니다. 드롭아웃은 훈련 중에 적용되며 평가나 예측에서는 적용하지 않습니다. 텐서플로는 이를 자동으로 처리합니다.

 

콜백은 케라스 모델을 훈련하는 도중에 어떤 작업을 수행할 수 있도록 도와주는 도구입니다. 대표적으로 최상의 모델을 자동으로 저장해 주거나 검증 점수가 더 이상 향상되지 않으면 일찍 종료할수 있습니다. 

 

조기종료는 검증 점수가 더 이상 감소하지 않고 상승하여 과대적합이 일어나면 훈련을 계속 진행하지 않고 멈추는 기법입니다. 

 

Chapter8. 이미지를 위한 인공 신경망

 

합성곱은 밀집층과 비슷하게 입력과 가중치를 곱하고 절편을 더하는 선형 계산입니다. 하지만 밀집층과 달리 각 합성곱은 입력 전체가 아니라 일부만 사용하여 선형 계산을 수행합니다.

 

합성곱 층의 필터는 밀집층의 뉴런에 해당하며 필터의 가중치와 절편을 종종 커널이라고 부릅니다. 자주 사용되는 커널의 크기는 (3,3) 또는 (5,5)입니다. 커널의 깊이는 입력의 깊이와 같습니다.

 

특성 맵은 합성공 층이나 풀링 층의 출력 배열을 의미합니다. 필터 하나가 하나의 특성 맵을 만듭니다. 합성곱 층에서 5개의 특성 맵이 만들어 집니다.

 

패딩은 합성곱 층의 입력 주위에 추가한 0으로 채워진 픽셀입니다. 패딩을 사용하지 않는 것을 밸리드 패딩이라고 합니다. 합성곱 층의 출력 크기를 입력과 동일하게 만들기 위해 입력에 패딩을 추가하는 것을 세임 패딩입니다.

 

스트라이드는 합성곱 층에서 필터가 입력 위를 이동하는 크기입니다. 일반적으로 스크라이드는 1픽셀을 사용합니다.

 

풀링은 가중치가 없고 특성 맵의 가로세로 크기를 줄이는 역할을 수행합니다. 대표적으로 최대 풀링과 평균 풀링이 있으며 (2,2) 풀링으로 입력을 절반으로 줄입니다.

 

 

가중치 시각화는 합성곱 층의 가중치를 이미지로 출력하는 것을 말합니다. 합성곱 신경망는 주로 이미지를 다루기 때문에 가중치가 시각적인 패턴을 학습하는 지 알아볼 수 있습니다.

특성맵 시각화는 합성곱 층의 활성화 출력을 이미지로 그리는 것을 말합니다. 가중치 시각화와 함께 비교하여 각 필터가 이미지 어느 부분을 활성화시키는 지 확인할 수 있습니다.

 

Chapter 9. 텍스르르 위한 인공 신경망

 

순차 데이터는 텍스트나 시계열 데이터와 같이 순서에 의미가 있는 데이터입니다. 대표적인 순차 데이터로는 글, 대화, 일자별 날씨 등 예로 들수 있습니다.

 

순환 신경망은 순차 데이터에 잘 맞는 인공 신경망의 한 종류입니다. 순차 데이터를 처리하기 위해 고안된 순환층을 1개이상 사용한 신경망을 순환 신경망이라고 합니다. 

 

망뭉치는 자연어 처리에서 사용하는 텍스트 데이터의 모음, 즉 훈련데이터셋을 뜻합니다.

토큰은 텍스트에서 공백으로 구분되는 문자열을 말하며, 종종 소문자로 변환하고 구둣점은 삭제합니다. 

원-핫 인코딩은 어떤 클래스에 해당하는 원소만 1이고, 나머진 0인 벡터입니다. 정수로 변환된 토큰을 원-핫 인코딩으로 변환하려면 어휘 사전 크기의 벡터가 만들어집니다.

단어 임베딩은 정수로 변환된 토큰을 비교적 작은 크기의 실수 밀집 벡터로 변환합니다. 이런 밀집 벡터는 단어 사이의 관계를 표현할 수 있기 때문에 자연어 처리에서 좋은 성능을 발휘합니다.

 

LSTM 셀은 타입스텝이 긴 데이터를 효과적으로 학습하기 위해 고안된 순환층입니다. 입력게이트, 삭제게이트, 출력게이트 역할을 하는 작은 셀이 포함되어 있습니다.

LSTM 셀은 은닉상태 외에 셀 상태를 출력합니다. 셀 상태는 다음 층으로 전달되지 않으며 현재 셀에서만 순환됩니다. 

GRU 셀은 LSTM 셀의 간소화 버전으로 LSTM 셀 못지 않은 성능을 냅니다 

 

 

총평

 

혼자서 머신러닝와 딥러닝을 공부하는 것은 생각보다 쉽지 않습니다. 그래서 이 책을 통해 기본기를 다지고 싶다면 충분히 가능할 거 같습니다. 책 내용안에는 다양한 예제와 예시가 있어 공부하는게 무엇보다 쉽게 진행할 수 있습니다. 무엇보다도 머신러닝과 딥러닝을 실습을 위해선 장비 스펙이 중요한데 여기에서는 구글 코랩을 활용하여 실습을 진행이 가능하기 때문입니다.

아무쪼록 머신러닝과 딥러닝 입문서로 최적화 되어 있으니 혼자서도 공부가 가능할거라 생각됩니다. 많은 서적에서 전문적인 예시와 수식을 활용해서 가이드를 해주지만 전공자가 아니라면 이해하기 어렵고 금방 쉽게 지쳐서 포기하게 될것입니다. 마지막으로 혼공 용어노트가 별첨으로 있으니 용어가 어려울시 참고하시면 도움이 됩니다. 

 

   

 

참고사이트

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

혼자 공부하는 머신러닝+딥러닝으로

직접 손코딩으로 인공지능을 공부하고 싶다면

한빛미디어 혼공단 시리즈로 하자.

한빛미디어의 혼공단에 3번(SQL, Python, 컴퓨터구조와 운영체제)을

참여하면서

알게된 혼자공부하는 시리즈

이 책은 독학할 수 있도록 쉬운 설명과 예제로 이루어진 책이다.

물론 어려운 부분도 있지만

그 부분은 검색을 하거나 혼공단 페이스북 그룹에서 해결할 수 있어

한 권, 한 권 끝낼 수 있었다.

네 번째 나에게 온

혼자공부하는 머신러닝+딥러닝은

일단 580쪽에 해당하는 두꺼운 책이다.

압도적인 두께에 순간 놀라기도 했다.

물론

이 한 권으로 모두 인공지능을 이해할 수는 없지만

기초 개념부터 실무 활용의 기본은 해결할 수 있다.

이후 관심 있다면

집중해서 공부하면 좋을 것 같다.

인공지능하면 이론상으로 머신러닝, 딥러닝등 용어는 많이 들어보았을 것이다.

또한 인공지능에 관한 책들도 시중에는 넘쳐나고 있지만

이론서만 있거나 또는 첫 단원부터 수학적으로 어렵게 풀이되어

인공지능의 접근이 쉽지 않았다.

한빛미디어의 혼공단 시리즈를 공부하면서

진짜 '혼자공부하는 ~'이 잘 맞는 책이다.

머신러닝과 딥러닝은 언어에 대한 기본 지식이 없다면

어려울 수 있어 파이썬에 대한 기본 학습을 먼저 한 다음

 

이 책을 학습해야 이해를 높을 수 있다.

 

 

인공지능과 머신러닝, 딥러닝의 간단한 설명과 함께

첫 머신러닝의 예제는 캐글에서 제공하는 '생선 분류 문제'로 시작되고 있다.

 

예제로 사용된 그림은 저자가 직접 그렸다는데 귀욤귀욤!!

 

머신러닝.png

개념도 그림으로 쉽게 이해할 수 있도록 책에서는 소개되고 있다.

  처음 수학 때문에 어려웠다면 망설이지 않아도 될 것 같다.

 

2.png

 

 

 

직접 코랩을 이용해 손코딩을 할 수 있도록

 

코드 실습도 웹 브라우저로 설치부터 사용법이 소개되어 있다.

 

처음에는 독학으로 어려울 수 있으나

차근차근 단원별로 공부하다 보면

기초적 내용부터 인공지능의 실무까지 익힐 수 있다.

책으로 이해하기 어렵다면

 

유튜브도 제공하고 있다.

 

 

또한 페이스북 그룹에서 '혼공단' http://www.facebook.com/groups/hongong에 가입하면

어려운 부분을 집단지성으로 해결할 수 있으며

혼동단 모집에 참여하여

미션을 수행하다 보면

두꺼운 책이지만

 

 

 

 

한 권을 끝낼 수 있다

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

 

 

 

도서명 : 혼자 공부하는 머신러닝+딥러닝

출판사 : 한빛미디어

 

지은이 : 박해선 지음

 

 

독서 기간 : 2023-04-10 ~ 2022-04-22

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

 

 

 

 

 

 

 

 

혼공시리즈 책을 기존에 접하면서 굉장히 좋다고 느꼈기에, 해당 도서를 신청해서 독서해보지 않을 수 없었다.

 

 

 

머신러닝과 딥러닝을 혼자 공부할 때 엄청난 어려움들이 있었고 그렇게 어려움이 있던 분야의 공부를 혼공 시리즈는 어떻게 풀어냈을지 궁금하여 채택하게 되었다.

 

 

 

먼저, 목차부터 확인해보면 아래와 같다.

 

 

 

Chapter 01 나의 첫 머신러닝 ▶ 이 생선의 이름은 무엇인가요?

__ 01-1 인공지능과 머신러닝, 딥러닝 ▶ 인공지능과 머신러닝, 딥러닝은 무엇일까요?

__ 01-2 코랩과 주피터 노트북 ▶ 코랩과 주피터 노트북으로 손코딩 준비하기

__ 01-3 마켓과 머신러닝 ▶ 마켓을 예로 들어 머신러닝을 설명합니다.

 

Chapter 02 데이터 다루기 ▶ 수상한 생선을 조심하라!

__ 02-1 훈련 세트와 테스트 세트 ▶ 모델을 훈련 시키는 훈련 세트와 검증하는 테스트 세트로 나누어 학습하기

__ 02-2 데이터 전처리 ▶ 정교한 결과 도출을 위한 데이터 전처리 알아보기

 

 

Chapter 03 회귀 알고리즘과 모델 규제 ▶ 농어의 무게를 예측하라!

__ 03-1 k-최근접 이웃 회귀 ▶ 회귀 문제를 이해하고 k-최근접 이웃 알고리즘으로 풀어 보기

__ 03-2 선형 회귀 ▶ 사이킷런으로 선형 회귀 모델 만들어 보기

__ 03-3 특성 공학과 규제 ▶ 특성 공학과 규제 알아보기

 

Chapter 04 다양한 분류 알고리즘 ▶ 럭키백의 확률을 계산하라!

__ 04-1 로지스틱 회귀 ▶ 로지스틱 회귀 알고리즘을 배우고 이진 분류 문제에서 클래스 확률 예측하기

__ 04-2 확률적 경사 하강법 ▶ 경사 하강법 알고리즘을 이해하고 대량의 데이터에서 분류 모델을 훈련하기

 

Chapter 05 트리 알고리즘 ▶ 화이트 와인을 찾아라!

__ 05-1 결정 트리 ▶ 결정 트리 알고리즘을 사용해 새로운 분류 문제 다루기

__ 05-2 교차 검증과 그리드 서치 ▶ 검증 세트가 필요한 이유를 이해하고 교차 검증해 보기

__ 05-3 트리의 앙상블 ▶ 앙상블 학습을 알고 실습해 보기

 

Chapter 06 비지도 학습 ▶ 비슷한 과일끼리 모으자!

__ 06-1 군집 알고리즘 ▶ 흑백 이미지 분류 방법과 비지도 학습, 군집 알고리즘 이해하기

__ 06-2 k-평균 ▶ k-평균 알고리즘 작동 방식을 이해하고 비지도 학습 모델 만들기

__ 06-3 주성분 분석 ▶ 차원을 알고 차원 축소 알고리즘 PC 모델 만들기

 

Chapter 07 딥러닝을 시작합니다 ▶ 패션 럭키백을 판매합니다!

__ 07-1 인공 신경망 ▶ 텐서플로로 간단한 인공 신경망 모델 만들기

__ 07-2 심층 신경망 ▶ 인공 신경망에 층을 추가하여 심층 신경망 만들어 보기

__ 07-3 신경망 모델 훈련 ▶ 인공 신경망 모델 훈련의 모범 사례 학습하기

 

Chapter 08 이미지를 위한 인공 신경망 ▶ 패션 럭키백의 정확도를 높입니다!

__ 08-1 합성곱 신경망의 구성 요소 ▶ 합성곱 신경망의 개념과 동작 원리를 배우고 간단한 실습하기

__ 08-2 합성곱 신경망을 사용한 이미지 분류 ▶ 케라스 API로 합성곱 신경망 모델 만들기

__ 08-3 합성곱 신경망의 시각화 ▶ 신경망이 이미지에서 학습하는 게 무엇인지 이해하기

 

Chapter 09 텍스트를 위한 인공 신경망 ▶ 한빛 마켓의 댓글을 분석하라!

__ 09-1 순차 데이터와 순환 신경망 ▶ 순차 데이터의 특징과 개념 이해하기

__ 09-2 순환 신경망으로 IMDB 리뷰 분류하기 ▶ 텐서플로 순환 신경망으로 영화 리뷰 분류하기

__ 09-3 LSTM과 GRU 셀 ▶ 순환 신경망의 중요 기술을 사용해 모델 만들어 보기

 

 

 

 

 

 

목차들을 보면 알 수 있듯이 머신러닝 부터 딥러닝까지의 모든 과정을 설명해준다. 머신러닝은 크게 지도학습과 비지도학습을 나누어 설명한다.

 

 

 

직접 독서해보며 느낀 것은 혼공시리즈는 예시를 정말 잘 들어주는 것 같다. 가장 처음 나오는 머신러닝 파트에서 생선을 분류하는 모델을 만드는 과정에서 상황을 생선 분류 모델을 직접 회사에서 구현하는 컨셉으로 예시를 들어주며 설명해준다.

 

 

 

해당 부분 때문에 과적합이 어떤 문제를 초래해서 어떻게 해결해야 하는 지 등 시나리오에 맞춰 설명이 이루어지는 식이다. 이렇게 설명들이 진행되니 혼자 공부하기 좋은 부분이 많다고 생각된다.

 

 

 

딥러닝 부분에서는 이미지, 텍스트가 나온다. 가장 기초적인 cnn, rnn 에 대한 설명들을 기반으로 딥러닝 모델을 직접 구현할 수 있고 이해할 수 있는 부분들까지 설명이 되어있다.

 

 

 

 

다른 도서들과 마찬가지로 코랩의 GPU를 사용해 실습을 진행해갔다. 혼공시리즈는 역시나 혼자 공부할 때 부족한 개념들을 예시를 들어주며 잘 설명하는 것을 확인했다.

 

 

 

PCA나, 경사하강법 같은 개념들도 처음엔 어렵게 느껴져 이해하는데 오래걸렸던 주제들인데, 해당 도서를 보고 처음에 내가 이 책으로 공부를 시작했다면 조금은 쉽게 이해했을텐데 라는 아쉬움이 남는 생각이 들었다.

 

 

 

이 도서 또한 머신러닝, 딥러닝을 처음 접하고자하는 분들에게 아주 적합한 책이 될 것 같다.

 

  1. - 간략하지만 전반적인 흐름을 이해하기 쉽도록 요약된 설명

    • 인공지능, 텐서플로 등 다양한 개념들에 대해 설명이 되어 있다. 길지 않기에 읽는데에 전혀 부담이 없고 전체적인 흐름을 이해하기에 적합해서 좋았다.
  2. - 예시를 기반으로 한 자세한 설명

    • 구체적인 예시와 그에 따라 필요한 조건과 결과에 대해 자세히 설명되어 있다. 많은 개념들, 패키지, 함수가 등장할 수 밖에 없는 주제에 대해 그러한 것들을 사용하는 목적과 결과에 대해 아주 상세하게 알려주어서 큰 도움이 되었다.
  3. - 구체적인 학습 로드맵 제시

    • 처음부터 마지막까지 모든 단원을 읽다 보면 어느 단원은 이해가 잘 안되었는데 이게 그 다음에 영향을 주는 것이 아닌가에 대해 염려했던 적이 있다. 이 책에서는 특정 단원에서 어떠한 것을 제시하니 이것에 관심이 있을 경우 건너뛰어도 될 부분과 꼭 숙지하면 좋을 단원과 개념에 대해서도 책의 초반부에서 자세히 알려주어 주었다.
  4. - 파이썬 문법의 설명

    • 51쪽에서처럼 책 내부에서 사용되는 파이썬의 문법에 대해서는 간략하게 설명이 되어 있다. 책의 내용을 이해하기에 충분할 정도여서 책을 보다가 모르는 부분이 나와도 굳이 따로 찾아보지 않아도 되어 좋았다. 파이썬 개념 외에도 ‘여기서 잠깐’ 코너에서는 다양한 개념에 대해 부가적으로 알려준다.
  5. - 다양한 자료에 대해 쉽게 입력할 수 있도록 bit.ly 주소 제공

    • 코딩을 하다가 syntax error가 발생하는 것처럼 입력하는 데이터의 값이 조금만 달라져도 결과값이 다르거나 에러가 발생한다. 이러한 과정의 디버깅을 위해 필요한 시간은 책에서 전달하는 개념의 이해와 별개의 시간이기도 하다. 그래서 이 책에서는 이러한 상황을 미연에 방지하고자 미리 다양한 데이터에 대해 준비되어 있고, 그 주소를 바로 가져와서 사용하면 되어서 정말 편리했다.
  6. - 한 단원에서 다룬 전체 코드에 대해 정리

    • 한 단원에서 다룬 전체 소스 코드에 대해 주석과 함께 정리되어 있다. 이 역시 bit.ly 주소가 제공되어 있는데 학습한 내용을 한 두페이지 이내에서 매 단원마다 볼 수 있어서 좋았다.
  7. - 자세한 그림

    • 특정 상황에서 특정 구조는 어떻게 되어 있다고 자세한 그림으로 알려준다. 텍스트로만 보는 것보다 그것을 그림으로 풀어냈을 때 이해하기에 훨씬 쉬운데 이 역시 구체적인 자료로 전달되어서 이해에 많은 도움이 되었다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다

머신러닝과 딥러닝에 대해 처음 접하시는 분들께서 입문서로 보실 수 있는 책이다. 어려운 수학적 지식이나 복잡한 알고리즘에 대한 이해가 없더라도 파이썬에 대한 기본 지식 정도만 있다면 책에 나오는 코드를 쉽게 이해하고 따라 할 수 있었다. 매 단위마다 별개의 예제가 등장하지 않고, 처음에 등장하는 생선 분류 처리 예제가 책 전체에 걸쳐 사용된다. 이 생선 분류 처리 예제가 책 전체를 관통하며, Chapter별 주제들이 결합며 머신러닝과 딥러닝에 대한 주요 내용들에 대한 설명과 이해를 도와 준다. 또한, 실습을 위해 복잡하게 컴퓨터에 별도 Tool을 설치 할 필요가 없이, 인터넷만 연결된다면 구글 코랩(Colab)을 통해서 무료로 쉽게 코드를 작성하고 실행, 결과까지 확인 할 수 있었다. 구글 코랩 주소 : https://colab.research.google.com/?hl=ko 책 내용은 크게 머신러닝편(1 ~ 6장)과 딥러닝편(7 ~ 9장)으로 나눌 수 있다. 순차적으로 내용을 공부해 나가도 되며, 딥러닝을 먼서 배우고 싶다면 1 ~ 4장을 통해 기초지식을 접한 후 7장으로 넘어가면 된다. 특히나 책에서도 강조 하지만, 7장으로 넘어가기전, 4장 다양한분류 알고리즘 내용은 조금 더 세밀하게 봐야 한다. (1 ~ 4장을 접한 후 7장으로 넘어가서 봤는데, 순차적으로 읽어 보면서 차근차근 나아가는 것도 괜찮은 방법으로 느껴졌다.) 혼자 공부하는 머신러닝 + 딥러닝 이 책은 이 머신러닝과 딥러닝에 대한 재미와 흥미를 갖게 하는 입문서와 다음 단계로 갈 수 있는 디딤돌 역할을 할 수 있는 책으로 충분한 책인 것 같다 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."



어려운 머신러닝 전필 과목 뿌시기

 

 

안녕하세요

오늘은 서평 리뷰 겸 학교에서 배우는 전공에 대해서 말씀 드리려고요~!

머신러닝 공부하게 된 이유

출처 입력

저희 학과에는 졸업하려면 필수로 들어야하는 전공필수 과목 중에

"머신러닝 및 실습" 과목이 있어요!

 

그런데 1, 2로 나뉘어 있고 둘 다 들어야하는데

제가 편입학하자마자 후다닥 듣자 싶어서 2부터 듣게 된거죠,,

결과는? 처참했습니다ㅠㅠ

 

그리고 휴학 하고 삼성sw주니어 교사연수 운영 스탭을 하면서 머신 러닝의 개론을 맛봤답니다ㅎㅎ

이제는 정말 데이터분석, 머신러닝이 궁금하고 재밌어서

복학한 지금 학기에 재수강을 결정했습니다!!

 

1부터 안 듣고 재수강을 한 이유는

1과목은 2학기에 오픈을 하기도 하고 2과목을 망쳐서 성적이 망해버렸기 때문에

성적을 끌어올리고자 재수강을 결정했답니다!!

각오와 그렇지 못한 상태,,

출처 입력

그래서 재수강을 했는데 나름 개론과 같은 과목을 들었다고 생각해서 재수강을 했는데

여전히 어렵더라고요,, 그래서 어떻게 해야하나 막막했답니다,,

 

일단 chatgpt한테 머신러닝 공부 방법에 대해서 물어봤어요ㅎㅎ

 

 

일단 데이터분석 과정이 포함되더라고요!

그래서 제가 앞으로 데이터분석과 관련된 일을 또 해보고 싶은 게 있어서

이번 기회를 살려서 정말 잘 배워보자!!라는 각오가 생기더라고요!!

그래서 만난 [혼자 공부하는 머신러닝+딥러닝]

 

그래서 책을 찾아보다가

너무 유명한 한빛 미디어의 '혼자 공부하는' 혼공 시리즈에도 머신러닝+딥러닝이 있더라고요!!

 

오늘은 그 책에 대한 리뷰를 해볼까합니다

 


 

책은 보라색 글씨가 눈에 띄네요!!

 

 

 

 


 

 

 

제가 혼공 시리즈를 좋아하는게 바로 저 "용어 노트" 때문이에요!!

IT도서는 특성상 책이 너무 두꺼워요,, 양이 많으니까요!

그래서 그걸 들고다니면서 보기에는 참 쉽지않더라고요

 

 

 

 



 

 

그런데 용어노트를 사용하면 정말 좋아요!

일단 용어노트에는 첫번째로 인덱스가 있어서 어떤 페이지에 가면 어떤 용어의 정보를 볼 수 있다는 걸 정리해줬어요!

그리고 그 페이지에 가면 꼭 알아야하는 정보만 적혀있는 거죠!!

 

 


 

 

여기에 본책으로 공부를 하면서 추가적으로 적어두고 싶은 부분만 제가 메모를 하면 되는 거에요!!

이렇게 포스트잇이나 밑에 있는 공간을 활용해서요!!

 

그러면 저만의 노트가 되는 거고, 저는 이 노트만 들고다니고

만약에 다른 곳에서 머신러닝, 딥러닝에 관한 정보를 얻게 되면 여기에 또 메모를 하고

이러면 정말 이 용어 노트 한 권으로 머신러닝+딥러닝 독파하는 거잖아요!!

 

그래서 노트가 있다는 게 너무 좋더라고요~!

 

 

 

 

 

 


 

 

본책은 이렇게 코드도 나와있어요!

그래서 실제적으로 쓰는 방법을 알 수 있어서 좋았고,

 


 

 

정말 놀랐던 게 "확률적 경사 하강법"에 대한 설명이었어요!

 

이론적으로 막 배웠던 걸 정말 쉽게 설명을 해주시더라고요!!

이 설명 부분에서 이 책에 대한 애정도가 급상승했어요ㅋㅋㅋㅋ

 


 

 

이 책만 잘 보고 나도 저렇게 용어를 내가 이해한 내용을 담아서 설명을 할 수 있다면

공부 정말 끝났다!니까 어떻게 공부해야겠다라는 방향성도 잡을 수 있어서 좋았어요

 


 

 

게다가 회사에서 어떤 상황을 가정해서 실습을 해주더라고요

그게 너무 유용했어요

 

사실 분석이라는 게 어떤 상황에서 필요하니까 그걸 하는 건데

그 상황에 어떤 걸 써야할지를 모르겠더라고요

 

그런데 여기서는 예제를 들어서 그걸 설명해주니까 너무 좋았어요

 

 

 

 

여러분, 머신러닝 너무 재밌고요 이번 학기 정말 열공해서 뿌셔보겠습니다!!

 

 

 

 

.

.

.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."



한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

서평

개인적으로 한빛미디어의 '혼자 공부하는' 시리즈를 좋아한다. 입문자에게 어렵지 않게 설명하는 부분에 있어서 정말 좋아하는 시리즈인 만큼, 어려운 머신러닝+딥러닝을 어떻게 풀어냈을지 궁금하였다.

 

책 앞쪽에도 언급하고 있지만 이 책은 다른 책들과 다른지에 대해서 나온다.

 

수식을 배제하고 그림과 예제를 통해 직관적으로 공부할 수 있으면서 입문자도 끝까지 읽을 수 있으리랴 생각해 이 책을 집필했다.

 

데이터 다루기, 회귀, 분류, 트리 알고리즘과 비지도학습, 이미지 학습 등을 다루고 있다. 예제를 제공하는 방식도 굉장히 좋았다. 코랩을 통해서 예제를 제공하고 있어서 주소를 통해 접속하여 예제를 확인할 수 있었다. 6장 비지도 학습까지 책을 읽다보니 입문자도 쉽게 이해할 수 있도록 책을 정말 잘 만들었구나 라는 생각을 했다. 기존 다른 책들은 라이브러리를 사용하는것도, 데이터도 실무적인 부분을 기반으로 하다보니 어려웠던 적이 있었다. 그렇지만 혼공책은 입문자용인 만큼 예제도 쉽고 그림도 굉장히 쉽게 설명이 되어있는 부분이 마음에 들었다. 인공신경망에 있어서는 LSTM과 GRU 까지 다루고 있다. 다양한 내용들을 쉽게 설명하고 있는 점에서 입문자에게 추천하고 싶은 책이다.

 

혼공머신러닝딥러닝.jpg

 

 

"혼자 공부하는 머신러닝+딥러닝"은 머신러닝과 딥러닝을 처음 접하는 초보자를 위한 인공지능 자습서입니다. 이 책은 초보자도 쉽게 따라 할 수 있는 구성과 풍부한 예제로 이루어져 있어 머신러닝과 딥러닝을 처음 접하는 독자들에게 유용한 책입니다.

이 책은 스토리 형식으로 구성되어 있어 독자들이 흥미를 느끼면서 학습할 수 있도록 합니다. 이 책의 주인공인 "혼공머신"은 머신러닝과 딥러닝에 대한 이해도가 높지 않은 상황에서 이를 학습하면서 성장하는 과정을 보여줍니다. 이를 통해 쉽게 따라 할 수 있는 실습 예제와 함께 머신러닝과 딥러닝의 기초 개념부터 실제 모델링 및 학습, 평가까지 전반적인 과정을 체계적으로 학습할 수 있어서 즐거웠습니다.

이 책은 역시나 인공지능을 다루기 위한 대표적인 언어인 파이썬을 이용한 코드로 머신러닝 및 딥러닝을 다루고 있어서 쉽게 따라 할 수 있습니다. 최근에는 GPT-3, BERT, GAN, GPT-4 등과 같은 기술들이 대두되고 있는데, 이러한 최신 기술은 다루지 않습니다. 다음 버전의 책에서는 관련 내용도 볼 수 있길 기대해 봅니다. 또한 인공지능이 수학적인 이론에 바탕을 둔 만큼 수학적인 이해가 부족한 경우에는 함축적이고 추상적으로 설명한 책의 내용을 이해하기가 어려울지도 모르겠습니다. 하지만 초보자를 위한 책이기 때문에 복잡한 수학적 설명이 적은 것이 더 좋을지도 모르겠다는 생각도 듭니다.

책이 스토리 형식으로 구성되어 있어서 흥미를 느끼면서 학습할 수 있다는 점과 각 장마다 목차가 세세하게 구성되어 있어 쉽게 원하는 내용을 찾을 수 있다는 점에서 구성이 직관적입니다. 머신러닝과 딥러닝의 기초 개념부터 전체적인 프로세스를 다루고 있어, 처음 접하는 초보자에게는 딱 들어맞는 책입니다. 이 책을 보충하는 온라인 강의도 제공되기 때문에 그 장점이 더 강화된다고 생각합니다.

진입 장벽이 높게만 느껴졌던 머신러닝과 딥러닝에 대해서 친근하고 편하게 다가갈 수 있는 멋진 책이었습니다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

혼자 공부하는 머신러닝+딥러닝은 이론을 바탕으로 수식을 배제하고 그림과 예제를 통해 직관적으로 공부할 수 있게 꾸몄고, 머신러닝과 딥러닝에서 곡 알아야 할 알고리즘을 모두 포함하고 있습니다.
컴퓨터 설정부터 차례대로 설명해 줘 누구나 쉽게 입문과정을 따라 할 수 있게 한 것이죠.

인공지능과 머신러닝, 딥러닝에 입문하고자 하는 사람들에게 인공지능 전체를 볼 수 있게 학습하는 책으로 추천하고 싶습니다.
독학으로 딥러닝 실무를 익히기 위한 책을 고르라면 혼자 공부하는 머신러닝+딥러닝을 추천합니다.

혼자 공부하는 머신러닝+딥러닝.jpg

 

혼자 공부하는 머신러닝+딥러닝_2.jpg

 

혼자 공부하는 머신러닝+딥러닝_3.jpg

 

혼자 공부하는 머신러닝+딥러닝_4.jpg

 

혼자 공부하는 머신러닝+딥러닝_5.jpg

 

 

혼자공부하는 머신러닝과 딥러닝 책은 머신러닝과 딥러닝을 처음 접하는 사람에게 적극 추천하고 싶은 책입니다. 이 책은 초보자를 위해 머신러닝과 딥러닝의 기초 개념부터 차근차근 설명하고 있어서, 이전에 전공하지 않은 사람도 쉽게 따라갈 수 있습니다. 또한, 책 안에는 많은 예제와 실습 코드가 포함되어 있어서, 직접 실습하면서 학습할 수 있습니다.

 

책의 구성도 매우 잘 되어 있습니다. 머신러닝과 딥러닝의 기초 개념을 이해한 후, 파이썬을 이용한 머신러닝/딥러닝 라이브러리 설치 방법부터 시작하여, 실제로 데이터를 다루어 보는 방법, 모델의 성능을 평가하는 방법 등을 차근차근 다루고 있습니다.

 

또한, 해당 책은 '실습 위주의 학습'을 강조하고 있어서, 이론적인 내용보다는 실제로 데이터를 가지고 모델을 만들고 성능을 평가하는 과정을 더욱 중요시하고 있습니다. 그렇기 때문에, 이 책으로 공부하면 머신러닝과 딥러닝에 대한 기초 개념뿐만 아니라, 실제로 데이터를 다루어보는 경험도 함께 쌓을 수 있습니다.

 

총평하자면, 혼자공부하는 머신러닝과 딥러닝은 초보자를 위한 입문서로서 매우 추천할 만한 책입니다. 초보자부터 중급자까지 모두가 이 책을 통해 머신러닝과 딥러닝에 대한 기초를 충분히 다지고, 실제로 데이터를 다루어 보는 경험을 쌓을 수 있을 것입니다.

R 이나 SASS 로 데이터 분석을 경험했던 분들 중, 파이썬을 활용해서 같은 내용을 실습하고 싶으신 분들에게 맞춰진 책입니다. 때문에 파이썬 기초가 전혀 없는 분들에게는 버거우실 수 있고, 반면 파이썬 기초를 익힌 뒤, 통계학 기초 정도는 학습을 하신 뒤에 접하길 추천 합니다. 주석이 많고 개념 및 파이썬 함수를 정리한 부록이 정성스럽게 잘 갖춰져 있어서 추천 합니다

안녕하세요. 책을 본 순간 바로 8장을 봤는데요. 코딩 실행은 colab 대신 컴퓨터에 설치되어 있는 pyCharm에서 수행했습니다. 우선 이론을 읽으면서 느낀 점은 너무 설명이 잘 되어있다는 것입니다.

물론 초보자에게는 깊이를 못느끼면서 쉬울 것 같은데, 어느정도 감을 잡은 사람들에게는 글의 설명의 깊이를 느끼면서 읽을 수 있어서 좋았습니다.감사드립니다.

한가지 요청사항은 colab에서는 필요가 없을 수도 있는데training part와 test part(evaluation)를 구분해서 파일을 만들었으면 합니다.

test시에 best-cnn-model.h5 파일을 저장했다가 실행하면 매번 trainging하는데 걸리는 시간을 줄일 수 있을 것 같습니다.

pyCharm에서 돌리면 처음부터 실행이 되어서 시간이 매번 많이 걸리네요. 

그리고 다양한 입력 패턴도 넣을 수 있게 소개해 주십시오.

제가 책을 처음부터 보지 않고 바로 8장을 봐서 그럴수도 있습니다.

pyCharm IDE에서 돌리려고 처음에는 다소 에러가 나서
시간이 걸렸지만 저자님이 오픈톡에서 도와주셔서
해결할 수 있었습니다.
감사합니다.

 

혼공머신 책 시작하자마자 오 이렇게 연결되는구나 하는 느낌이 혼공 9기 미션 완성을 서두르게 했다.  재미있게 박해선 저자님의 유튜브 강의를 들으며,

혼공 책에 나온 문제풀이를 구글 코랩에서 직접 해보며 신이 났다. 그래서 6주 공부를 4일 만에 끝내 버렸다.  https://velog.io/@tcgyver/6주가-휘리릭

이 책은 머신러닝(딥러닝 포함) 배우고자 하는 입문자에게 최선의 책이라고 말하고 싶다.

 

제목처럼 혼자 공부하면서 책의 코드를 직접 입력하고 결과를 확인할 수 있다. 

수식이 있기는 하지만 부담스럽지 않고, 그림으로 전체 흐름을 설명하기에 이해하기가 쉽다.

비유를 들어가며 머신러닝에 한 발짝씩 다가가기에 지루하지 않다.

개인적인 의견이지만, 이 책이 어렵다고 하면 머신러닝은 배우는 것에 대해 심각하게 고민하기를 바란다. ㅎㅎ

 

예제는 물론 저자가 직접 동영상 강의를 제공하고 있으며, 

커뮤니티를 통해 언제든지 질문에 대한 답변을 받을 수 있는 것도 큰 장점이라고 생각한다.

 

책의 구성은 인공지능과 머신러닝의 역사, 데이터 처리, 대표적인 지도 학습 알고리즘(회귀, 분류, 트리), 

비지도 학습, 딥러닝(ANN, CNN, RNN)을 다루고 있다.

먼저 이론을 설명하고 실습으로 결과를 확인한다. 

각 단락의 끝에는 마무리로 키워드 핵심 포인트와 확인 문제가 있다. 확인 문제 푸는 것도 재미가 쏠쏠하다. 

물론 책 마무리에 정답이 있다는 것은 공공연한 비밀

실습 과정에서는 코드 설명과 함께 저자의 경험과 머신 러닝 컨벤션, 코딩 규칙을 설명해 주는 부분이 매우 좋았다.

 

 

파이썬 라이브러리를 기반으로 하고 있으며, 코랩 환경에서 모든 예제는 실행할 수 있다.

이 책을 읽고 예제를 모두 실행하면, 파이썬의 기본 문법과 넘파이, 판다스, 사이킷런, 텐서플로,

케라스에 대해서도 알 수 있게 되는 것은 덤이라고 할까? ^^

 

지금도 그렇지만, 머신 러닝 분야는 향후가 더 기대되는 영역이다.

서점에서도 수많은 책이 존재하지만, 쉽게 다가가기 힘든 것도 사실이다. 

독학으로 공부하다가 실패를 맛본 분들이라면 이 책으로 다시 시작하면서 반드시 돌파구를 마련하게 될 것이라 확신한다.

 

저자도 얘기하지만, 이 책은 시작이다. 그동안의 좌절은 잊어버리고, 새롭게 머신 러닝의 세계로 함께 나갔으면 좋겠다.

 

그런데도 혼자 하기 힘들다면 '혼공학습단'을 신청하여 기수 동기들과 혼공족장님과 같이 하는 것도

좋은 동기 부여가 될 것이다.

 

공부하려는 의지만 있다면 여러분을 방해하는 것은 아무것도 없을 것입니다. 이 책을 다 읽은 것에 만족하지 말고 더 넓은 머신러닝 세계로 나가 보세요. ... 결코 후회하지 않을 것입니다.

개념에 대한 상세한 설명과 유튜브 강의로 머신러닝, 딥러닝에 대하여 쉽게 이해하고 공부할 수 있는 책이었습니다.

"혼자 공부하는 머신러닝 + 딥러닝" 책을 년 초에 구입하고 읽지 못하고 있다가 이번에 혼공학습단 6기가 있어서 신청하고 읽어보고 머신러닝을 학습하게 되었다. 

 

머신러닝, 덥러닝은 우선 학습하기가 어려운것 같다. 어려운 개념과 그리고 수학공식등 학습하기에 어려운 분야라고 생각한다.  

정말 수학공식은 참 어려운것 같다. 

 

 

우선 "혼자 공부하는 머신러닝 + 딥러닝"도 쉽지는 않다고 생각한다. 그러나 다른 책과는 다르게 각 단원의 예제와 그리고 해결 방법 접근방식은 현실적이고 그리고 반복적인 학습을 통해 쉽게 읽혀지는 책이라고 생각한다. ( Youtube 강의의 "지난시간에")

그리고 해당 책과 youtube 강의와 같이 학습을 해보니 그래도 쉽게 학습을 할 수 있었던것 같다. 

 

마지막까지 해당책을 읽게 된 거는 혼공학습단도 큰 기여를 한것 같다. 1주에 1 Chapter~2 Chapter 씩 자기주도학습 범위가 있으니 어떻게든 책과 youtube 영상을 보면서 학습을 할 수 있었고 해당 방법을 통해 쉽지않은 분야의 책을 읽게 된거는 좋은 경험이었던것 같다. 

 

 

이 책의 장점은 
1. 학습 로드맵 : 학습 로드맵을 통해 전체적인 학습 방향 및 내용을 확인가능 
2. 쉬운 예제 : 회사 업무와 같은 접근방식 과 해결방법을 도출
3. 마무리, 확인문제  : 최종 학습내용 , 주제정리 가능 
4. youtube 강의 : 반복학습, 중요점 체크가능 
5. 혼공단(혼공학습단) : 학습동기 부여 

 

이라고 생각한다. 해당 장점은 다른 책에서는 없는 면인데 이런 장점으로 인해  "혼자 공부하는 머신러닝 + 딥러닝" 책 한권을 마지막까지 읽게 된것이라고 생각한다. 

 

​다른 사람도 공부하기 어렵다면 youtube 강의와 혼공학습단을 통해 책을 읽어보면서 공부를 하기를 추천해본다. 다른사람을 통해 자극도 되고 마지막까지 읽을수 있는 자극이 된다고 생각한다. 

 

​머신러닝 학습하기에 어렵다면 우선 이 책  "혼자 공부하는 머신러닝+ 딥러닝" 을 추천해 본다.  

 

입문자용 시리즈로 최근 각광을 받고 있는 혼공자 시리즈에서 드디어 머신러닝+딥러닝 부문이 출간되었다.

혼자 공부하는 책이니 만큼 어려운 수식도 없고 실습 위주로 어렵기만 하게 느껴지던 머신러닝과 딥러닝에 발을 들일 수 있도록 해준다.

기본 개념들은 실습을 통해서 어떤 것인지 감을 잡히도록 구성하고 있다. 원론적인 수식도 중요한 부분이지만 그것이 입문 허들을 높이는 것 또한 사실이다. 그러나 일단 뛰어들 수 있도록 하는것이 중요하다. 그러면 여러 가지들을 하나씩 생성해서 결국 나무가 되기 때문이다.

이 책은 그런 면에서 좋은 입문서이다. 프로그래밍 언어를 배울 때도 고레벨의 언어 사용법부터 배우지 그 언어가 바이트코드로 만들어지고 또 그 바이트코드가 어떤게 동작하고 컴퓨터구조는 이렇고 저렇고 이런걸 다 배우지 않는 것처럼... 다 알면 더 좋은 프로그래머가 될 수 있지만 시작부터 그럴수는 없는 법이다.

이렇게 기본 내용에 대해 확인할 수 있는 문제도 있다. 이렇게 문제가 있어야 좀 더 긴장(?)을 하게 되고 무심코 넘어갔던 내용에 대해 다시 한 번 상기하고 집중하는 과정을 거칠 수 있다. 모든 공부의 시작은 사실 암기라고 생각하기 때문에 이런 부분도 마음에 들었다.

풀코드도 이렇게 존재한다. 이게 어렵다고 느껴지는 사람도 있을 수 있겠지만 이건 정말 필수기 때문에 파이썬의 기본은 알아야 한다.

부록으로 별도의 용어집을 제공한다. 어떤 도메인에 뛰어들 때 용어는 매우 중요하다. 이게 암기가 필요한 이유기도 하다. 잘 정리된 용어집은 초보자들에게 매우 유용하다고 생각한다.

실제 예제 중심으로 머신러닝에 입문해보고자 하는 파이썬을 조금 아는 사람들은 이 책으로 입문하기에 좋다!

요즘 내가 좋아하는 책 시리즈가 있는데, 바로 혼자 공부하는 시리즈이다.

지금 일하는 것도 때마침 딥러닝이 들어가 있어서 필요했었는데,

혼자서 공부하는 머신러닝 + 딥러닝 책이 출간되어서 바로 읽기 시작했다.

일단 혼자서 공부할 수 있도록 책이 구성되어 있기도 하고, 요즘 트렌드인 머신러닝, 딥러닝이 주제이기 때문에 요즘같은 시기에 딱 맞는 책이 아닌가 싶다.

 

사실 머신러닝, 딥러닝 책을 몇권 보았는데, 어렵다..

초보가 입문하기에는 너무 어려운 공식들과 이론이 펼쳐져 있어서,

사실 보다가 포기...(요즘은 수포자가 아니라 닝포기ㅋㅋ)

 

다행히 이번책은 그렇게 시작되지 않았다.

일단 파이썬 프로그래밍만 알고 있어도 된다는 문구가 다행이라는 느낌이 크게 든다.

 

책의 일정을 표기해두고, 

개념도 함께 정리되어 있다.

 

20210105_222227.jpg

 

 

20210105_222257.jpg

 

 

스토리텔링으로 이해하기 쉽게 되어있고, 기억하기 쉽게 쓰여져 있다.

프로그래밍을 어렵게 셋팅을 하고 컴퓨터로 하는 것이 아니라, 

바로 따라할 수 있는 손코딩을 하라고 나와있다.

공부를 하는데 있어서 손코딩만한게 없다.

무조건 손으로 치면서 오류를 잡아내는 것이 아니라,

생각을 하면서 작성 하기 때문에 기억도 많이 되고, 

코랩 주소에 접속해서 코드로 바로 볼 수 있다.1609944422228.jpg

 

그리고 무료 동영상 강의와 혼공러들의 스터디 공간에서 함께 질의 응답을 하고, 배울 수 있다.

특히 온라인에서 함께 공부한다는 것은 혼자 공부를 하다가 지치는 것이 아니라, 

목표를 가지고 할 수 있다는 것이 크다.

현재 혼공모집을 하고 있으니 공부를 생각하고 있다면 좋은 기회가 아닐까 싶다.

 



해당 포스트는 한빛미디어에서 서적을 제공받아 작성했습니다.

 


혼자 공부하는 머신러닝 + 딥러닝 표지

이번 한빛 리뷰단 서적은

혼자 공부하는 머신러닝+딥러닝

이 당첨되었어요

 

머신러닝 분야는 예에에에에전에

나중에는 관련 전문가들과 협업하는게

일상이 될지도 모른다는 생각에

혼자서 독파하려고 노력해본 적이 있어요

ㅎㅎㅎ

아무래도 선수학습이 필요한 강의를 들어버린지라

용어부터 생소해서 얼마안가 포기했었어요

이번에는 어떨지...

기대반 걱정반으로 책을 펴 보았습니다

 

chapter1 에서는 머신러닝이란 무엇인지에 대한 간단한 설명과

다루기위한 툴, 간단한 설명을

chapter2 에서는 데이터 분류와 전처리

chapter3 에서는 회귀 알고리즘을

chapter4 에서는 분류 알고리즘

chapter5 에서는 트리 알고리즘

chapter6 비지도 학습을

chapter7 에서는 딥러닝의 신경망에 대한 내용을 설명하고

chapter8 은 합성곱 신경망을 이용한 이미지 분류

chapter9 에서는 순환 신경망을 이용해 텍스트 분류를 설명하고 있습니다.

 

단원마다 내용설명 후 전체 코딩과 핵심 키워드를 짚어주고 핵심을 되짚을 수 있는 문제로 리마인딩을 시켜줘

내용을 이해하는 데 도움이 많이 되었습니다.

 

무엇보다 어렵게 생각할 수 있는 머신러닝을

예시와 간단한 코딩을 잘 곁들여 이해를 쉽게 해줘 도움이 되었습니다.

 

그리고 추가로 (2021년 1월 4일) 현재 유튜브로

추가 강의를 진행 중이어서 듣고 보면서 하니 더 잘 보게되는 것 같습니다.

 

이 책과 코랩, 유튜브 강의를 잘 조합하면 빠른 시간에 머신러닝 기초를 쌓는 데 도움이 되어

정말 추천하고 싶네요 ㅎㅎ

 

 





한빛미디어에서 출간되는 [혼자공부하는...]시리즈의 새 책이 출간되었다. 바로 [혼자 공부하는 머신러닝+딥러닝]이다. 인공지능의 새로운 부흥기를 맞이하여 너도나도 머신러닝, 딥러닝을 떠들고 있는 시대를 살아가고 있다. 수많은 알고리즘과 분석모델, 관련 라이브러리들이 공개되어 있다.

 

20201224_222400.jpg

 

 

이 책의 장점은 누구나 손쉽게 공부할 수 있도록 부담없는 두께로 구성되어 있고, 저자가 직접 강의한 내용을 유튜브를 통하여 무료로 수강할 수 있다는게 최대의 장점이라 생각된다. 총 9개의 챕터로 이루어져 있어서...단계를 하나하나 밟아가다보면 손쉽게 개념을 이해하기 쉽도록 학습로드맵을 제공하고 각 강의마다 지난 시간 강의의 주요내용을 다시한번 간략하게 정리해 주는게 좋았다.

 

20201224_222549.jpg

 

 

각 단락 후미에는 키워드로 끝내는 핵심포인트와 확인문제를 만들어서 스스로 이해도를 평가할 수 있다는 것도 좋았다. https://festa.io/에 접속하여 Zoom 실시간 강의에도 무료로 참여할 수 있으니 관심있는 분들은 참고하시기 바란다. 초보자가 부담없이 머신러닝과 딥러닝에 개념과 실습을 동시에 수행할 수 있어서 너무 좋았고 저자가 강의하는 진도를 천천히 따라가다보면 어디에 가서 빠진다는 소리는 듣지 않을 듯하다. 다만, 파이썬 기초문법은 알아야 한다는 건 참고하시길....

 



 

#혼자공부하는머신러닝딥러닝 #박해선 #한빛미디어 #책스타그램 #북스타그램 #서평 #독서 #독서스타그램 #책스타그램 #신간 #북리뷰 #책리뷰 #책리뷰 #추천

 

 

KakaoTalk_20210103_143040248.jpg

인공지능 공부가 정말 처음일때

어려운 수식에 지쳤을 때

쉬운 그림과 실전 예제로 공부하고 싶을 때

부하는 머신러닝 + 딥러닝 (박해선 지음)

또다시 혼자 공부하는 시리즈가 나타났다!!

입문자도 끝까지 읽을 수 있는 직관적인 머신러닝, 딥러닝 입문서

[혼공머신]7단계 길잡이

2KakaoTalk_20210103_143039829.jpg

1. 핵심키워드 : 절에서 중점적으로 볼 내용을 확인

2. 시작하기 전에 : 절에서 배울 주제 및 주요 개념

3. 말풍선 : 꼭 기억해두어야 할 내용

4. 손코딩 : 코드입력하고 실행

5. 문제해결과정 : 실제 프로젝트에서 문제를 해결할 때 어떤 사고 과정을 거치는지 짐작할 수 있다.

6. 핵심 포인트/패키지와 함수

7. 확인문제

학습 로드맵

2KakaoTalk_20210103_143039372.jpg

나의 첫 머신러닝

데이터 다루기

회귀 알고리즘과 모델 규제

다양한 분류 알고리즘

트리 알고리즘

비지도 학습

딥러닝을 시작합니다

이미지를 위한 인공신경망

텍스트를 위한 인공신경망

각 장과 절마다 이해하기 쉬운 예시와 실습예제로 이루어져 있어서 이해하기 쉽게 구성 되어 있습니다. 비전공자라도 누구나 머신러닝과 딥러닝을 쉽게 이해할 수 있습니다. 그래도 파이썬 개발 경험이 있다면 더 쉽게 다가 설것입니다.

혼공시리즈처럼 나누어 공부할 수 있게 되어 있으며 유튜브에 장별 설명을 계속 올려주시고 계셔서 진도에 맞혀서 같이 공부할 수 있습니다.

https://www.youtube.com/playlist?list=PLVsNizTWUw7HpqmdphX9hgyWl15nobgQX

 

머신러닝, 딥러닝 공부도 역시 혼공시리즈 혼공머신으로 아자 아자 화이팅

 

 

 

 

책 제목 : 혼자 공부하는 머신러닝 + 딥러닝 

저자 : 박해선 

출판년도 : 2020.12.21 

 

 

이 책은 머신러닝, 딥러닝 관련 내용이 재미 있어 몇권을 책을 보긴 했는데 

다 좋은책이었고 전반적으로 만족스러운 책들이었다. 


이번에는 요즘 유명한 시리즈인 혼자 공부하는 시리즈의 책을 보게 되었다. 


혼공시리즈는 꽤나 많이 있는데 나도 몇권 읽은적이 있다. 


혼자 공부하는 파이썬은 내가 처음 파이썬을 공부할 때 꽤나 도움이 되었다. 


이번 책 또한 머신러닝을 공부하는데 많은 도움이 되리라 생각해서 읽게 되었다.

 

책의 구성

이 책은 머신러닝, 딥러닝 입문자가 혼자서 공부하기 위한 책이다.

 

각 챕터는 7단계의 스탭을 가지는데 현재 챕터가 어느 내용을 담고 있는지 "핵심 키워드"를 제공한다.

 

그리고 "시작하기 전에"라는 스탭에서는 해당 챕터에서 배울 주제 및 주요 개념을 짚어준다.

이렇게 사전에 어느내용을 학습할 것인지 미리 핵심을 알려주기 때문에 챕터를 읽기 전에 명확하게 정리가 된다.

 


"말풍선" 부분을 통해 지나치기 쉬운내용이나 중요한 내용을 짚어주고 "손코딩"부분을

 

통해 실습의 중요성을 강조해 주며 "문제해결 과정"을 통해 실제 프로젝트시 어떤 프로세스를

 

거치는지 체험 할 수 있게 해 준다.

 

 

 

마지막으로 "확인 문제"를 통해 학습한 내용을 복습 할 수 있도록 구성되어 있다.

 

책의 초반부에 보면 학습 로드맵이 미리 나와있다.

 

이 학습로드맵을 통해 어떤식으로 학습이 진행되는지 미리 체크해 볼 수 있다.


책의 내용은 인공지능과 머신러닝, 딥러닝에 대한 설명으로 시작한다.

 

개념에 대한 설명은 간단하게 다루는데 인공지능이란? 머신러닝인란? 딥러닝이란? 처럼

 

각 학문에 대해 간단하게 설명한다.

 


개념설명 후에는 실질적으로 테스트할 개발환경 구축을 한다.

 

여기에서 사용하는건 파이썬 코드를 실행하기 위해 구글 코렙을 사용한다.

 


시작으로 가장 간단한 머신러닝 알고리즘 중 하나인 k-최근접 이웃을 사용하여

 

2개의 종류를 분류하는 머신러닝 모델을 훈련한다.

 

이 챕터는 그림이 많고 개념설명이 잘 되어 있어 머신러닝을 본격적으로 배우기 전에  맛보기로 좋다.

 


그 후는 본격적으로 데이터에 대해 다룬다.

 

머신러닝 알고리즘에 입력할 데이터를 준비하는 방법이나 데이터의

 

형태가 알고리즘에 미치는 영향을 배운다. 

 

 

챕터 3에서는 지도 학습 알고리즘의 한 종류인 회귀 알고리즘에 대해 다루며

 

다양한 선형 회귀 알고리즘의 장단점에 대해 배운다.

 


챕터 4에서는 챕터3에 이어 알고리즘에 대해 다루는데, 분류 알고리즘에 대해 다룬다.

 


챕터 5장에서는 트리 알고리즘에 대해 다루고 알고리즘

 

성능 최대화를 위한 하이퍼파라미터 튜닝을 실습하고 여러 트리를 합쳐 일반화 성능을 

 

높일 수 있는 앙상블 모델을 배운다.

 


챕터 6에서는 비지도 학습과 군집알고리즘, 차원축소 알고리즘에 대해 배운다. 

 

7장부터는 딥러닝을 본격적으로 다루는데 딥러닝에서 빠지지 않는 인공 신경망을 시작으로

 

이미지를 위한 인공 신경망, 텍스트를 위한 인공 신경망을 학습한다. 

 

 

 

 

책을 읽고나서...

 

책 자체는 머신러닝, 딥러닝 입문서이지만 파이썬 입문서는 아니다.

 

책의 진도를 원활하게 따라가기 위해서는 파이썬을 먼저 어느정도 아는것이 필요하다.

 

머신러닝이라는 학문 자체가 허들이 있는 편이기 때문에 입문서라고 해도

 

처음부터 끝까지 다 읽기가 쉽지 않다.

 

머신러닝의 주 내용은 머신러닝에 사용되는 수식들과 알고리즘이 있고 이를 

 

직접 구현해보거나 라이브러리들을 활용하여 모델을 구현해 보는 것이다.

 

이 책에서는 혼자 공부하는 이를 위한 책 답게 많은 그림과 예제를 통해

 

이해를 돕는다.

 

그리고 책의 마지막에 혼공 용어노트를 제공하여 어려운 용어들을 쉽게 찾아볼 수

 

있게 만들어 두어 편리했다.

 

어렵고 복잡한 내용을 최대한 배제하고 쉽게 풀이하는것을 목표로 만든 책이라는 

 

생각이 든다.

 

인공지능, 딥러닝 분야에서 아주 좋은 책이 나왔다. 한빛미디어 출판사의 '혼자 공부하는' 시리즈 중 가장 최근에 출간된 '혼자 공부하는 머신러닝+딥러닝'이라는 책이다. '혼자 공부하는' 시리즈는 예전에 '혼자 공부하는 자바'란 책으로 공부해본 바 있어 매우 익숙하다. 책 제목처럼 정말 혼자 공부할 수 있도록, 즉 독학도 가능하도록 구성한 책이다. 

 

 

요즘 초보자나 입문자를 위해서 인공지능, 딥러닝 관련 학습서들이 많이 시장에 많이 나오고 있는데 이 책은 그런 분류의 독자들을 타겟으로 하는 책 중 가장 내용과 설명이 쉽고 인공지능과 관련하여 상대적으로 폭 넓은 부분을 다루고 있다. 그렇다보니 나는 개인적으로 이 책을 읽으면서 한번 읽더라도 책을 다른 곳에 내버려두지 말고 틈날때 마다 보라고 권하고 싶다. 언제? 이제 입문 수준에서 조금 나아갔는데 다른 책에서 용어나 설명이 어려워서 이해가 안갈 때 말이다. 마치 참고서처럼 어딘가 막히는 곳에서 가이드가 되어줄 책이다. 

 

 

한빛미디어의 책들이 과하지 않은 적정한 수준의 컬러판으로 나오고 있어서 흑백판의 학습서에 질려버린 분들에게는 추천할 만하다. 그리고 그냥 단순히 개념을 소개하고 코딩을 따라하는 것이 아니라 학습자가 흥미를 잃지 않도록 '한빛 마트'라는 가상의 가게에서 일어나는 일들을 인공지능으로 구현해본다는 재미있는 시나리오로 책이 진행된다. 

 

 

딥러닝에서 걱정되는 부분 중 하나는 모델을 돌릴 때 GPU와 같은 하드웨어가 굉장히 중요하다고 하는데 그런 정도의 고성능의 컴퓨터가 없어서 제대로 실습을 할 수 있을까 하는 부분이다. 걱정마시라. 이를 위해 구글의 코랩이라는 플랫폼으로 가상의 자원을 빌려 코딩을 수행해볼 수 있다. 책 극초반부에 잘 소개를 하고 있으니 입문자분들도 금방 익숙해질 것이라고 생각한다. 

 

 

당연한 것이지만 이 책은 학교에서 공부하듯 읽는 책이 아니다. 직접 구현해보기 위해 책에 나온 코드 부분을 직접 실습해보아야 한다. 해당 코드를 복사해서 바로 돌려볼 수 있는 곳도 저자가 안내하고 있으니 너무 코드가 길 때는 이해만 하고 넘어가고 복사된 코드를 붙여넣어 신경망, 딥러닝 모델을 돌려볼 수 있다. 

 

 

책을 읽다보니 저자가 쉽게 설명하기 위해 정말 심혈을 기울였다는 느낌이 들었다. 나도 다른 인공지능 서적을 공부할 때 넘기는 한쪽 한쪽이 너무나 어려운 과제였다. 이 책을 만나는 분들은 그러한 어려움을 도와주고 보충해줄 수 있는 도서가 나타났으니 큰 도움이 될 것이라 생각한다.

 

 

대학에서 데이터마이닝 수업을 들을 때 내가 잘 이해가 가지 않는 용어에 대해 교수님께 물어본 기억이 있다. 교수님은 그냥 대충 얼버무리며 넘어가려고 하셨다. 좀 많이 실망스러웠다. 그러나 그때 궁금했던 것을 이 책을 통해 많이 해소할 수 있었다.

 

 

'한빛 마트'라는 가상의 마트가 있다는 재미있는 시나리오로  인공지능 문제를 풀어나간다.

 

 

어려울 수 있는 용어는 매 장 끝마다 정리할 수 있도록 도와주고 있다.

 

 

위에서 언급한 바와 같이 생선 종류를 분류한다는 이야기로 인공지능 문제를 해결하는 것이다.

 

인공지능을 공부하는데에 어려운 점이 뭐가 있을까? 수학? 수학도 파고 들면 무척 어렵다. 그리고 단기간에 쉽게 해결할 수 있는 부분이 아니기도 하다. 그렇다고 공부는 안할 수 없다. 그 다음으로 어려운 것은 바로 인공지능, 딥러닝, 그리고 고급 통계와 관련된 '전문 용어'가 아닐까 싶다. 그냥 듣기만 해도 어렵다는 느낌이 팍팍 올 수 있다. 그래서 조금 놀랐던게 본 책에서는 책 마지막 장에 부록 형식으로 용어 사전(혼공 노트)을 제공해준다!

 

특별히 기억하기 어려웠던 용어가 있다면 언제 어디서든 복습할 수 있도록 용어를 요약한 노트가 있다는게 무척 마음에 들었다. ​

 

한빛미디어 유튜브 채널에 가면 저자가 최근에 올린 영상들이 있다. 그래도 잘 이해가 안가고 설명이 듣고 싶다면 한빛미디어 유튜브 채널에 올라온 혼자 공부하는 머신러닝+딥러닝 강의를 들으면 큰 도움이 될 것 같다. 책을 사면 매우 높은 퀄리티의 강의까지 제공하니 얼마나 가성비 높은 학습서인가!

 

 

다운로드 (2).png

 

 

 

혼자 공부하는 머신러닝 + 딥러닝 책을 읽어보았다. 요즘 대세의 기술이 머신러닝, 딥러닝 기술인데 상당한 기술의 발전으로 인해 수요가 많아졌고 공급이 늘어나는 추세이다. 인공지능의 연구는 사실상 엄청 오래된 기술이고, 기술로 활용해 이전 부터 체스에서 여러번 기술시도를 하였다. 머신러닝을 사회적으로 각인 시키는 계기가 알파고를 통해 가능성을 많이 열어 주었고 기술 자체로는 러닝커브가 심한 것은 누구나 알고 있다. 많은 학회의 논술과 기업의 참여로 인하여 하루에도 몇개씩 쏟아지는 논문이 많고 기술을 활용도는 아직은 초기 단계이나 사람의 얼굴 인식이나, AI 면접관, 음성인식 기술이 점차 발전함에 따라 세상은 점점 변화하는 같다. 이러한 기술에 한발짝 다가 서고싶어 이책을 읽어 보았고, 이책은 정말 기초부터 설명을 책이며, 기존 핸즈온 책들을 보면 그림이 많이 없고 딱딱한 책들이 많았다면 이책은 이해하기 쉽게 그림도 있고 가장 장점인 유투브 강의가 있다는 것이 가장 좋았다. 머신러닝 + 딥러닝을 하기위해 기초를 닭고 용어와 흐름을 이해하고 싶다면 이책으로 시작해 봤으면 좋겠다. 이번 계기로 좀더 공부를 있는 원동력을 책이다.

대부분 모든 기술에 AI가 접목되어서 조금 공부해보고 싶다는 생각이 들어서 전에 AI를 살짝? 공부해본 경험이 있었다. 그때 공부할 때는 뭐부터 공부해야 할지 몰라서 애매하게 공부를 해서 잘 몰랐다.(이 책이 빨리 출시돼었으면 좋았을 듯..) 하지만 혼공머신을 접하고 처음 볼 때 이해하기 좋은 로드맵이 짜여있고 머신러닝 + 딥러닝을 모두 경험해 볼 수 있다는 점에서 매우 흥미가 생긴 서적이었다. 이 책을 통해 잘 모르던 AI에 대해서 공부하고 추후 AI 개인 프로젝트를 진행하며 역량을 성장시켜나가고 싶다고 생각했습니다. AI를 처음 접하시는 개발자 분들께 매우 추천하는 서적입니다!



혼공머신.jpg

 

 

혼자 공부하는 시리즈 들어보았다.

다만 이걸 진짜 나 혼자 공부할 수 있어? 의심 가득해서 사길 주저하고 있었는데 이번에 운이 좋게도 혼공 시리즈를 읽을 기회를 얻었다.

혼자 공부하는 머신러닝 + 딥러닝! 줄여서 혼공머신 ! 내 최초의 혼공시리즈 책이다.

 

나의 첫 혼공책의 일단 읽은 지 2일 째 후기를 쓰자면

괜찮은데? 할만 한데?

이런 마음을 들게 한다.

열정 신입 혼공머신이 되어 문제를 해결하는 과정을 거쳐가면서 머신러닝의 기초적인 부분을 쌓을 수 있게 된다.(혼공머신의 넘치는 열정으로 도미와 방어부터 다양한 생선을 팔고 럭키백 이벤트를 하며....)

머신러닝을 공부하면서 자주나오는데 fit()은 왜 쓴다고? score()는? 이런 상태로 깨작 거리던 머신러닝이었는데 지금은 아, 그래그래 데이터 훈련 시킨다구? 아 맞아 정확도를 확인 해봐야지! 혼공머신과 함께 마음 속 하이파이브를 하게되는 것 같다.(아니면 나만 하이파이브 한 거 아니지, 혼공머신?)

 

'혼자 공부하는' 이라는 말이 어울리도록 책의 설명을 알기 쉽게 해두었다. 하지만 역시 수학 개념 공부는 좀 다시 해야 겠다라는 생각을 하게하는 그런 게 있다.

 

이 책의 실습환경은 사용자의 컴퓨터의 성능이 어떻든 구글의 자원을 사용한다. 인터넷의 제약이 있긴 하지만 그것을 감안하면 왠만한 것은 다 해볼 수 있는 환경이라 상당히 괜찮다 생각하는 부분이다.

 



20201220_232125.jpg

 

예전 알파고 vs 이세돌 이후로 인공지능에 대한 관심이 상당히 많아졌다. 하지만 인공지능이 정확히 무엇인지, 어떻게 배워서 써먹을지에 대해서는 아무도 알려주지 않는다. 그런 분들을 위하여 나온 책이 바로 혼공머신! 혼공머신은 단순히 AI에 대해서만 설명하는 책이 아닌, 머신러닝, 딥러닝 등과 차이점이 무엇인지에 대해 이야기해주는 책이다. 인공지능의 역사에 대해서, 그리고 머신 러닝과 딥러닝, 인공 신경망 등 다양한 용어들에 대해 천천히 알려주고 있다.

 

이 책은 그렇다고 맨땅에서 시작하는 것을 권하지 않는다. 인공지능의 원리나 알고리즘에 대해서는 알려주지만, 이를 만들기 위한 기본적인 파이썬 문법에 대해서 숙지할 수 있도록 글쓴이는 권하고 있다. 그리고 맷플롯립, 넘파이, 텐서플로, 사이킷런 등 다양한 프로그램을 쓰는 만큼 노트북의 성능이 어느정도 받쳐줄 것을 추천하고 있다.

 

책은 나의 첫 머신러닝, 데이터 다루기, 회귀 알고리즘과 모델 규제, 다양한 분류 알고리즘, 트리 알고리즘, 비지도 학습, 딥러닝을 시작합니다, 이미지를 위한 인공 신경망, 텍스트를 위한 인공 신경망 등 총 아홉가지 챕터로 되어있다. 각 챕터별로 그림과 더불어 예제가 충실히 되어있지만, 아직 나처럼 인공지능에 대한 이해가 부족한 사람들에게는 어려운 책일 수 있다. 그렇기 때문에 글쓴이가 제공하는 유튜브 강의 등을 참고하시면 훨씬 좋은 결과를 얻을 것이라 생각된다.

 <혼자 공부하는 머신러닝+딥러닝>, 박해선 지음, 한빛미디어, 2020

 

timesnap-1608433541095.jpg

 

 

 

기업에서 중장기 변화를 예측할 때 보통 연평균 성장률(compoundannual growth rate, CAGR)을 사용한다. 최근 3개년이나 5개년 연평균 성장률을 적용해 앞으로의 실적을 예측한다. 주어진 데이터의 한계로 이를 사용할 수밖에 없겠지만, 대체로 연평균성장률을적용한 미래예측은 잘 맞지 않는다.

 

 

최근 정보통신 기술의 발달로 인해 빅데이터, 인공지능이 빠르게일상에 접목되고 있어, 혹시라도 기업의 중장기 변화를 예측하는 데 있어 머신러닝, 딥러닝을 접목할 수 있지 않을까 싶었다. 프로그래밍에 대해서는 아는바가 없어 실제 구현 가능한지 감이 잡히지 않았다.

 

 

머신러닝, 딥러닝 프로그램에 대한 용어나 원리 등이라도 이해해볼요량으로 책을 찾았지만, 함수와 코드 위주로 설명된 책들은 C언어를알지 못하면 이해하기 쉽지 않았다. <혼자 공부하는 머신러닝+딥러닝>인공지능 공부가 정말 처음일 때, 어려운 수식에 지쳤을 때, 쉬운 그림과 실전 예제로 공부하고 싶을때라는 표지의 문구가 끌렸다. 이번엔 이해할 수 있을 것이란근거 없는 자신감이 생겼다.

 

 

쉽게 이해할 수 있는 예제와 비유를 사용했습니다.
심지어 이 분야와 무관하더라도 파이썬만 알고 있다면
머신러닝과 딥러닝을 학습할 수 있도록 꾸몄습니다.(6)

 

 

<혼공머신>은파이썬, 사이킷런 등 라이브러리를 설치하지 않고 네트워크에 연결된 컴퓨터와 구글 코렙을 통해 실습하도록 안내하고 있다. 구글 코렙에서 작성한 노트북은구글 드라이브에도 저장이 되니, 인터넷만 연결되면 보유 컴퓨터의 성능과 상관 없이 머신러닝, 딥러닝 프로그램 개발이 가능하다.

 

 

머신러닝과 딥러닝 관련 용어들과 작동 원리를 설명하고, 직접프로그래밍 실습을 할 수 있도록 구성되어 있어, 비교적 쉽게 이해할 수 있다. 생선 가게에서 도미를 분류하는 단순한 방법으로 출발해, 주어진 길이정보로 무게를 예측하고, 내용물을 알 수 없는 럭키백의 확률을 계산하는 복잡한 방법까지 프로그래밍할수 있도록 알고리즘과 함수들을 세세히 짚어준다.

 

 

머신러닝은 K-최근접 이웃 회귀와 선형 회귀 등 회귀 알고리즘과로지스틱 회귀, 확률적 경사 하강법 등 분류 알고리즘은 물론, 트리알고리즘과 군집 알고리즘의 순서로 단계를 높여 간다. 그리고 딥러닝은 이미지와 텍스트를 위한 인공 신경망으로구분해 개념을 설명하고 실습할 수 있도록 하고 있다.

 

timesnap-1608433566314.jpg

timesnap-1608433626934.jpg

 

 

 

키보드에 손을 올려놓고 책의 코드를 직접 입력하면서 읽는 책입니다.()
귀찮다거나 어렵다고 생각해 미루지 마세요.
컴퓨터 앞에서 실습하면서 공부하면
어느새 글자로는 쉽게 이해할 수 없었던 개념을
너무나 당연하게 몸으로 느낄 수 있을 것입니다.(7)

 

 

불과 몇 년 전만 해도 머신러닝, 딥러닝 프로그래밍을 하려면C언어를 다룰 줄 알아야 한다고 했었다. 머신러닝, 딥러닝을 위한 서버를 구축하거나 복잡한 머신러닝 구동을 위해 컴퓨터 성능도 좋아야 했다. 지금은 인터넷만 연결된다면 하드웨어의 제약 없이 구글의 자원을 이용해 누구나 쉽게 머신러닝, 딥러닝 프로그래밍이 가능하게 되었으니 세상은 내가 생각하는 것보다 훨씬 빠르게, 편하게 편하고 있는 것 같다.

 

 

여전히 기업의 중장기 변화 예측에 대한 솔루션을 찾은 것은 아니지만 다양한 기업 정보가 담긴 빅데이터를확보할 수 있다면 불가능하지 않을 것 같다.

 

 

* 해당 도서는 출판사로부터 무상으로 제공받았으며, 제 주관에 따라 솔직하게 작성했습니다.

 

신러닝이나 딥러닝을 보통 배우거나 이해하기 어려운 분야이다. 하지만 이렇게 배우기 어려운 분야도 어떤 예제와 설명이냐에 따라 내용이 쉽게 와 닿기도 한다. 그동안 봤던 책이 너무 어려웠다면 이 책으로 그간의 어려움을 해소할 수 있지 않을까 싶다.

게다가 저자 분은 유명 머신러닝, 딥러닝 책을 여러 권 번역과 출판하신 분이다. 우리집에도 저자 분의 머신러닝, 딥러닝 책이 몇 권이 있을 정도로 이 분야에서 연구나 일을하는 사람이라면 저자 분의 책이 몇 권씩 있을거 같다. 그만큼 믿고 볼 수 있는 저자 분의 책이기도 하다.

그래서 이 책은 초보자를 위한 책이기도 하지만 이미 머신러닝이나 딥러닝 코드를 돌려봤지만 아직도 뭔가 부족하다고 느껴지는 사람들에게 전체적인 내용을 정리해 볼 수 있는 책이기도 하다.

한빛의 믿고 보는 "혼공" 시리즈 중에 하나기도 하다.

책 두께는 600 페이지가 조금 안 되는 정도고 두께도 어느정도 있다. 전면 컬러이고 그래프 이미지가 컬러라 좀 더 보기에 좋다.

또, 핵심만 뽑아서 정리한 용어노트는 가볍게 들고 다닐 수 있을 정도의 분량으로 전체적인 내용을 정리하기에 좋다. 완전 핵심만 골라서 잘 정리가 되어 있어서 한눈에 들어온다.

또 적절한 비유와 설명도 너무나도 알찬 책이다.

핸즈온머신러닝과 이 책은 함께 봐도 너무 좋을것 같은데 이 책은 적절한 비유와 자세한 설명을 통해 머신러닝을 쉽게 이해하는데 도움이 되고 핸즈온머신러닝을 통해 좀 더 깊게 머신러닝과 딥러닝을 학습해 볼 수 있을거 같다.

그동안 텐서플로를 사용하면서 궁금했던 내용들에 대한 궁금증이 많이 해소되었다. 또 이 책을 보고 핸즈온머신러닝을 읽으니 이해가 되지 않았던 부분에 대한 블랙박스를 열게 된 느낌이다.

아무튼 강추에 강추를 해도 모자랄 훌륭한 책이다 

부록/예제소스
자료명 등록일 다운로드
DOWNLOAD 확인문제 해답 2022-02-28 다운로드
DOWNLOAD 예제소스 2022-02-28 다운로드
결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

도서판매처

리뷰쓰기

닫기
* 도서명 :
혼자 공부하는 머신러닝+딥러닝
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
혼자 공부하는 머신러닝+딥러닝
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
혼자 공부하는 머신러닝+딥러닝
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실