메뉴 바로가기 검색 및 카테고리 바로가기

한빛미디어

만들면서 배우는 파이토치 딥러닝

12가지 모델로 알아보는 딥러닝 응용법

한빛미디어

번역서

판매중

  • 저자 : 오가와 유타로
  • 번역 : 박광수(아크몬드)
  • 출간 : 2021-08-05
  • 페이지 : 544 쪽
  • ISBN : 9791162244609
  • 물류코드 :10460
초급 초중급 중급 중고급 고급
5점 (8명)
좋아요 : 1

딥러닝을 진정으로 가치 있게 활용하는 방법!

 

딥러닝은 입출력 데이터와 손실함수만 잘 정의한다면 다양한 분야의 과제를 해결할 수 있다. 딥러닝 응용 방법으로 전이학습과 파인튜닝을 활용한 화상(이미지) 분류, 물체 감지, 시맨틱 분할, 자세 추정, GAN을 활용한 화상 생성 및 이상 탐지, 텍스트 데이터 감정 분석, 동영상 데이터 클래스 분류를 다뤘다. 직무 특성에 따른 도메인 지식과 딥러닝 구현 능력을 갖춘 인재로 성장하여 활약하는 데 이 책이 도움이 될 것이다.

 

 

★ 각 장의 개요 

 

_1장. 화상 분류와 전이학습(VGG)

학습된 VGG 모델을 활용해 소량의 데이터로 딥러닝 모델을 구축할 수 있는 전이학습과 파인튜닝을 알아봅니다. 또한 이 책에서는 AWS의 클라우드 GPU 머신을 사용하여 딥러닝을 설명합니다.

 

_2장. 물체 인식(SSD)

물체 감지는 딥러닝 응용 방법 중에서도 특히 복잡한 기술입니다. SSD 모델을 활용해 물체 감지의 흐름을 설명합니다.

 

_3장. 시맨틱 분할(PSPNet)

픽셀 수준에서 물체를 분류하는 시맨틱 분할을 학습하면서 딥러닝 모델 PSPNet을 설명합니다. 어떻게 픽셀 수준에서 물체를 분류할 수 있는지와 함께 네트워크 구조, 순전파함수, 손실함수도 알아봅니다. 

 

_4장. 자세 추정(OpenPose)

자세 추정은 화상에 포함된 여러 인물을 탐지하여 인체 각 부위의 위치를 식별하고 부위를 연결하는 선(링크)을 구하는 기술입니다. OpenPose가 어떻게 사람의 각 부위를 탐지하고 부위를 서로 연결하는지 구현하며 그 구조를 확인합니다. 모델의 네트워크 구조 확인 방법으로 텐서보드X 사용법을 설명합니다.

 

_5장. GAN을 활용한 화상 생성(DCGAN, Self-Attention GAN)

Self-Attention은 자연어 처리(NLP)에 활용되는 Transformer와 BERT의 열쇠가 되지만 이해하기 어렵기 때문에 우선은 화상에서 Self-Attention을 구현하고 이해하는 것을 목표로 합니다.

 

_6장. GAN을 활용한 이상 감지(AnoGAN, Efficient GAN)

이상 화상 검출은 의료 현장에서 질환 및 건강 상태를 판별하거나 제조업에서 이상이 있는 부품을 검출할 경우 등에 사용합니다. 이상 화상이 정상 화상보다 매우 적을 때는 AnoGAN을, 이상 탐지에 걸리는 시간을 해결하기 위해서는 EfficientGAN을 응용할 수 있습니다. 

 

_7장. 자연어 처리를 활용한 감정 분석(Transformer)

텍스트 데이터를 취급하는 자연어 처리를 살펴보고 딥러닝 모델 Transformer를 활용해 텍스트 데이터 내용을 긍정과 부정으로 감정합니다. word2vec과 fasttext를 활용해 단어를 벡터 표현으로 수치화하고 단어에 Attention을 걸어 추론 결과를 시각화해봅니다. 

 

_8장. 자연어 처리를 활용한 감정 분석(BERT)

감정 분석 모델을 구축, 학습하고 추론해 문맥에 따라 단어 벡터가 어떻게 변화하는지 알아보고 Self-Attention으로 시각화해봅니다. 

 

_9장. 동영상 분류(3DCNN, ECO)

화상 분류와 동영상 분류의 차이에 주목하면서 어떻게 동영상을 딥러닝에서 다루고 구현하는지 설명합니다.

저자

오가와 유타로

SIer의 기술본부 개발기술부 소속. 딥러닝을 비롯한 머신러닝 관련 기술의 연구 개발 및 기술 지원을 담당한다. 아카시 공업고등전문학교, 도쿄대학 공학부를 거쳐 도쿄대학 대학원, 짐보/고타니 실험실에서 뇌 기능 측정 및 계산 신경과학을 연구했으며 2016년에 박사 학위를 취득했다. 도쿄대학 특임 연구원을 거쳐 2017년 4월부터 현재 직무에 종사 중이다. 저서로 『PyTorch를 활용한 강화학습/심층강화학습 실전 입문』, 『つくりながら學ぶ! Pythonによる因果分析』 등이 있다.

역자

박광수(아크몬드)

‘아크몬드’라는 필명으로 더 잘 알려진 블로거. 2004년부터 지금까지 최신 윈도우 정보를 꾸준히 나누고 있다. 2007년부터 2019년까지 마이크로소프트 MVP(Windows 부문)를 수상했다. 윈도우 11 등 마이크로소프트의 최신 기술에 열광한다. 현재 일본에서 서버 개발자로 활동하며 딥러닝에 많은 관심을 두고 있다. 번역서로 『처음 배우는 딥러닝 수학』, 『파이썬으로 배우는 머신러닝의 교과서』, 『파이썬으로 배우는 딥러닝 교과서』(이상 한빛미디어) 등이 있다.

 

CHAPTER 1 화상 분류와 전이학습(VGG)

1.1 학습된 VGG 모델을 사용하는 방법

1.2 파이토치를 활용한 딥러닝 구현 흐름

1.3 전이학습 구현

1.4 아마존 AWS의 클라우드 GPU 머신을 사용하는 방법

1.5 파인튜닝 구현

 

CHAPTER 2 물체 감지(SSD)

2.1 물체 감지란

2.2 데이터셋 구현

2.3 데이터 로더 구현

2.4 네트워크 모델 구현

2.5 순전파 함수 구현

2.6 손실함수 구현

2.7 학습 및 검증 실시

2.8 추론 실시

 

CHAPTER3 시맨틱 분할(PSPNet)

3.1 시맨틱 분할이란

3.2 데이터셋과 데이터 로더 구현

3.3 PSPNet 네트워크 구성 및 구현

3.4 Feature 모듈 설명 및 구현(ResNet)

3.5 Pyramid Pooling 모듈 설명 및 구현

3.6 Decoder, AuxLoss 모듈 설명 및 구현

3.7 파인튜닝을 활용한 학습 및 검증 실시

3.8 시맨틱 분할 추론

 

CHAPTER 4 자세 추정(OpenPose)

4.1 자세 추정 및 오픈포즈 개요

4.2 데이터셋과 데이터 로더 구현

4.3 오픈포즈 네트워크 구성 및 구현

4.4 Feature 및 Stage 모듈 설명 및 구현

4.5 텐서보드X를 사용한 네트워크의 시각화 기법

4.6 오픈포즈 학습

4.7 오픈포즈 추론

 

CHAPTER 5 GAN을 활용한 화상 생성(DCGAN, Self-Attention GAN)

5.1 GAN을 활용한 화상 생성 메커니즘과 DCGAN 구현

5.2 DCGAN의 손실함수, 학습, 생성

5.3 Self-Attention GAN의 개요

5.4 Self-Attention GAN의 학습, 생성

 

CHAPTER 6 GAN을 활용한 이상 화상 탐지(AnoGAN, Efficient GAN)

6.1 GAN을 활용한 이상 화상 탐지 메커니즘

6.2 AnoGAN 구현 및 이상 탐지 실시

6.3 Efficient GAN의 개요

6.4 Efficient GAN 구현 및 이상 탐지 실시

 

CHAPTER 7 자연어 처리에 의한 감정 분석(Transformer)

7.1 형태소 분석 구현(Janome, MeCab+NEologd)

7.2 torchtext를 활용한 데이터셋, 데이터 로더 구현

7.3 단어의 벡터 표현 방식(word2vec, fasttext)

7.4 word2vec, fasttext에서 학습된 모델(일본어)을 사용하는 방법

7.5 IMDb의 데이터 로더 구현

7.6 Transformer 구현(분류 작업용)

7.7 Transformer의 학습/추론, 판단 근거의 시각화 구현

 

CHAPTER 8 자연어 처리를 활용한 감정 분석(BERT)

8.1 BERT 메커니즘

8.2 BERT 구현

8.3 BERT를 활용한 벡터 표현 비교(bank: 은행과 bank: 강변)

8.4 BERT의 학습 및 추론, 판단 근거의 시각화 구현

 

CHAPTER 9 동영상 분류(3DCNN, ECO)

9.1 동영상 데이터에 대한 딥러닝과 ECO 개요

9.2 2D Net 모듈(Inception-v2) 구현

9.3 3D Net 모듈(3DCNN) 구현

9.4 Kinetics 동영상 데이터셋을 데이터 로더로 구현

9.5 ECO 모델 구현 및 동영상 분류의 추론 실시

이미지/동영상 분류에서 OpenPose, GAN, BERT까지

최신 딥러닝 모델 구현의 핵심이 한 권에!

 

비즈니스 현장에서 딥러닝을 응용한 경험을 쌓고 싶다면, 합성곱 신경망을 이용한 화상(이미지) 분류 등과 같이 기본적인 딥러닝 기법을 배운 후 다음 단계로 넘어가고 싶다면 추천합니다. 입문서에서는 알기 어려웠던 전이학습과 파인튜닝을 활용한 화상 분류, 물체 감지, 시맨틱 분할, 자세 추정, GAN을 활용한 화상 생성 및 이상 탐지, 텍스트 데이터 감정 분석, 동영상 데이터 클래스 분류를 12가지 모델로 구현하며 배울 수 있습니다. 

딥러닝은 ‘영업×딥러닝’, ‘제조×딥러닝’, ‘의료×딥러닝’ 등과 같이 다른 분야와 함께 활용할 때 비로소 진정한 가치를 발휘합니다. 도메인 지식과 딥러닝 구현 능력이 결합된 인재로 성장하여 현장에서 활약하는 데 이 책이 도움 될 것입니다. 

  • 만들면서 배우는 파이토치 딥러닝

    따라해보면서 배우자!

     

     

     

    1.jpg

     

    2.jpg

     

    3.jpg

     

     

     

    이 책에서는 딥러닝의 응용 방법으로 전이학습/파인튜닝을 활용한 화상 분류, 물체 감지, 시맨틱 분할,

    자세 추정, GAN을 활용한 화상 생성 및 이상 탐지, 텍스트 데이터의 감정 분석 그리고 동영상 데이터의 클래스

    분류를 다뤘습니다. 딥러닝은 입출력 데이터와 손실함수만 잘 정의한다면 다양한 분야의 과제를 해결할 수 있는

    기술입니다. 이 책을 통해 딥러닝 기술의 응용 가능성을 조금이라도 느낄 수 있기를 바랍니다.

     

    - 만들면서 배우는 파이토치 딥러닝 中 -

     

     

    중상급자를 위한 도서! 딥러닝 파이토치! 많이 어려울 것으로 보입니다 ^^;;

    자 시작하겠습니다!

     

    입문서에서는 알기 힘들었던 전이학습이나 파인튜닝 등을 다루고 있기 때문에

    기본적인 머신러닝을 배운 후 다음 단계로 파이토치를 선택한 경우 권장합니다.

     

     

     

     

    DAY 1, 2, 3

     

    화상 분류와 전이학습(VGG)

     

    챕터 1 ~ 4

     

     

    + 물체감지, 시맨틱 분할, 자세추정

     

     

     

    4.jpg

     

    5.jpg

     

    6.jpg

     

     

     

    파이토치! 리뷰 시작하겠습니다 :)

     

     

    1장 화상 분류와 전이학습에서는 학습된 전이학습 모델을 사용하는 방법부터 파인튜닝을 구현하는 부분까지 배웁니다.

    ImageNet 데이터셋에서 학습된 모델을 로드하고 전이학습에 대해 이해하는 영역이며, 모델을 읽어오고 전처리 클래스 작성까지 기초적인 부분에 대하여 나옵니다. 데이터작성, 학습 검증, 아마존 AWS 클라우드 GPU 머신 활용, 파인튜닝까지 빼먹을 곳이 없는 가장 기본이면서 정석인 챕터라고 할 수 있습니다. 아직까진 그래도 할만하네요 ^^;;

     

    2장은 물체 감지 챕터입니다. 물체 감지 작업의 입력과 출력부터 VOC 데이터셋, 모델을 구현하고 학습된 SSD 모델을 사용하여 화상의 물체 감지를 실시하는 추론까지 수행합니다. 여기서부터 벌써 어려워지기 시작했습니다, 정말 정독하셔야됩니다! 집중하셔야됩니다!

    그래도 재미있고 시간은 빠르게 흐르는군요 :)

     

     

    3장은 시맨틱 분할 챕터입니다. 시맨틱 분할이 무엇인지 알아보고 색상 팔레트 형식의 화상 데이터를 이해하며 PSPNet 시맨틱 분할의 4단계 흐름까지 진행합니다. 데이터셋을 로드하고 데이터셋을 작성해보며 흐름을 이해하는 부분은 매우 중요합니다. Feature 모듈 설명 및 구현 부분이 어려워 몇번을 읽어본지 모르겠습니다. 아무래도 2주가 아닌 2개월은 정독해서 봐야 될 것 같습니다. 꾸역꾸역 시맨틱 분할 추론 구현 부분까지 진행이 완료되면 3챕터가 마무리 됩니다. PSPNet 알고리즘, 네트워크 구조, 순전파 함수, 손실함수 등 중요한 내용이 매우 많습니다. 전부 구현하는 코드를 따라해보고 이해하면서 넘어가시길 바랍니다.

    4장은 자세 추정 챕터에서는 화상 처리의 자세 추정을 살펴보면서 딥러닝 모델인 오픈포즈에 대하여 다룹니다. 자세 추정ㄹ이 무엇을 입출력하는 기법인지 이해하는 것부터 시작해 오픈포즈를 활용한 자세 추정의 3단계 흐름까지 다양하고 재미있는 모션 인식 챕터입니다.

     

    딥러닝의 대표 패키지 텐서플로의 시각화 라이브러리인 텐서보드에 대해서도 나오고 다른 챕터보다는 재미있게 학습했던 것 같습니다.

     

     

     

     

    DAY 4, 5, 6

     

    GAN을 활용한 화상 생성, 이상 화상 탐지

     

    챕터 5 ~ 7

     

     

    + 자연어 처리에 의한 감정 분석

     

     

     

    7.jpg

     

    8.jpg

     

    9.jpg

     

     

     

    5장까지 오는데 정말 많은 시간이 걸렸습니다! 쭉 ~ 한번 봐야지 라고 생각했던 서적인데! 음.. 역시 중상급 서적은 다르군요 ^^;;

    5장은 GAN에 대해서 다룹니다. 생성 기술인 GAN은 서적을 한번 보긴 했었는데, 다시 보니 감회가 새롭습니다. 어려운 내용이 정말 많은 챕터입니다. DCGAN 및 Self-Attention GAN을 활용한 화상 생성을 구현하고 Self-Attention, 점별 합성곱, 스펙트럴 정규화 같이 어려운 단어와 내용이 정말 많이 나오는 챕터이므로 몇번이나 봐야 될 것 같습니다. 다시 봐도 똑같이 어렵네요 ^^;;

     

    6장은 이어서 GAN을 활용한 이상 화상 탐지 챕터입니다. 수학적인 내용도 많아서 정말 이해하기도 쉽지 않은 챕터네요! 6챕터에서는 AnoGAN, Efficient GAN을 활용한 화상의 이상 탐지 구현에 대하여 다룹니다.

    Efficient GAN을 활용한 이상 탐지는 코드 구현을 재미있게 학습할 수 있지만, 그만큼 학습시키는 과정이 굉장히 어렵고 까다롭습니다.

     

    5, 6챕터는 3번 이상 봐야 될 것 같습니다, 확실히 어려워지고 있습니다!

     

    7장은 자연어 처리를 다룹니다. 빡센 챕터! 자연어 처리에 임해 Janome, MeCab+NEologd를 이용한 단어 분할, torchtext를 통한 데이터 로더 작성의 흐름, word2vec, fasttext를 활용한 단어 벡터 표현, Transfomer 모델과 IMDb 분류, 마지막으로 Attention 시각화를 설명하고 구현해봅니다. 반드시 소스코드를 따라해보고 정독하고 2~3번은 더 봐야 조금 더 이해가 쉬울 것 같습니다.

    이제 대망의 8, 9 챕터만 남았습니다! 곧 추석이네요 :)

     

     

     

     

    DAY 7, 8, 9

     

    자연어 처리를 활용한 감정 분석

     

    챕터 8 ~ 9

     

     

    + 동영상 분류

     

     

    10.jpg

     

    11.jpg

     

     

     

    8챕터는 Transfomer에서 한층 더 진화된 자연어 처리 모델인 BERT를 설명하고 구현하여 다시 IMDb의 감정 분석을 진행합니다.

    BERT의 단어 분할과 vocabulary를 사용하여 torchtext로 IMDb용 데이터 로더를 작성하고, BERT의 감정 분석 모델 구축, 학습 및 추론, Self-Attention을 시각화 해봅니다. 그렇게 8장 자연어 처리를 활용한 감정 분석이 마무리 됩니다.

    후 이제 대망의 9챕터! 동영상 분류네요 :)

     

    9챕터는 직접 만든 데이터셋에서 학습은 실시하지 않지만 학습된 모델을 파인튜닝하는 것으로 직접 만든 동영상 데이터셋도 분류할 수 있게 친절하게 설명하고 있습니다. ECO 모델 구축, 학습된 모델의 로드, Kinetics-400의 검증 데이터 추론을 설명하고 구현해봅니다.

    동영상 데이터를 클래스로 분류하면서 딥러닝 모델인 ECO를 구현하는 9챕터는 그래도 재미있게 진행했습니다.

    학습 및 파인튜닝이 지금까지 해온 방법과 동일하기 때문에 따로 도영상 데이터셋에 대한 학습 및 파인튜닝은 하지 않습니다.

     

    그렇게 9챕터를 정독하고 마무리 하였습니다.

     

     

     

     

    DAY 10

     

    후기

     

    다양한 분야에 활용할 때 진정한 가치를 발휘한다!

     

     

    딥러닝을 진정으로 가치 있게 활용하는 방법!

     

     

     

    12.jpg

     

     

     

     

    후기 : 다양한 분야의 과제를 딥러닝으로 해결하자.

     

     

    머신러닝와 딥러닝이 널리 보급된 오늘날 간단한 화상 분류나 물체 감지 등의 작업은 직접 구현하지 않더라도

    클라우드 서비스 등으로 손쉽게 해결할 수 있습니다.

     

    딥러닝 기술과 기업 고유의 도메인 지식이 모두 있는 엔지니어는 딥러닝 응용 방법을 직접 구현하여

    문해결할 수 있는 과제가 많을 것입니다.

     

    머린서닝과 딥러닝은 '단독'으로 이뤄진 총 같은 무기나 도구가 아닌 'xx딥러닝'이라는 형태일 때 비로소

    진정한 가치를 발휘합니다.

     

    - 만들면서 배우는 파이토치 딥러닝 中 -

     

     

    리뷰를 마치며!

     

  • PYTORCH DEEP LEARNING

    만들면서 배우는 파이토치 딥러닝

    12가지 모델로 알아보는 딥러닝 응용법


    저자 오가와 유타로 / 옮긴이 박광수 / 한빛미디어

     

    이 책의 특징은 딥러닝의 응용방법으로 전이학습/파인튜닝을 활용한 화상분류물체감지시멘틱 분할자세추정, GAN늘 활용한 화상생성 및 이상탐지 테스트 데이터의 감정분석 그리고 동영상 데이터의 클래스 분류를 다뤘다.

     

    딥러닝은 입출력 데이터 손실 함수만 잘 정의한다면 다양한 분야의 과제를 해결할 수 있는 기술이다.

    요즘 산업 전분야에서 고민하던 문제해결을 위해 활발하게 선호하는 기술 중 하나이다.

    저자는 딥러닝 기술과 기업 고유의 도메인 지식이 모두 있는 엔지니어는 딥러닝 응용방법을 직접 구현하여 해결할 수 있는 과제가 많을 것이다라고 말하고 있다.

     

    이 책은 딥러닝의 다양한 응용법을 설명하고 구현했지만심층강화학습은 다루지 않았다심층강화학습은 딥러닝 뿐아니라 강화학습 지식도 필요하다.

    참고로 저자의 PYTORCH를 활용한 강화학습/심층 강화학습 실전 입문에서 심층강화학습을 설명하고 구현했다.

     

    이 책에서 다루는 내용과 딥러닝 모델

    1장 화상분류와 전이학습(VGG, Visual Geometry Group)

    2장 물체인식(SDD, Single Shot MultiBox Detector)

    3장 시맨틱 분할(PSPNet, Pyramid Scene Parsing Network)

    4장 자세추정(Open Pose)

    5장 GAN을 활용한 화상생성(DCGAN, Deep Convolution Generative Adversarial. Self-Attention GAN)

    6장 GAN을 활용한 이상감지(AnoGAN, Efficient GAN)

    7장 자연어 처리를 활용한 감정 분석(Transformer)

    8장 자연어 처리를 활용한 감정 분석(BERT, Bidirectional Encoder Representations from Transformers)

    9장 동영상 분류(3DCNN, ECO)

     

    머신러닝딥러닝은 단독으로 이뤄진 총 같은 무기나 도구가 아닌 ‘OO X 딥러닝이라는 형태일 때 비로소 진정한 가치를 발휘한다.

    OO에는 기업과 산업 그리고 직무특성에 따른 도메인 지식과 과제가 해당된다도메인 지식 X 딥러닝 구현 능력을 가진 인재가 성장하여 기업에서 활약할 수 있도록 이 책이 도움이 되었으면 한다는

     

    저자의 말에 전적으로 공감한다.

     

    각자의 위치에서 OO 문제해결을 위해

    고민하는 분들이라면 일독을 권한다.

    쉽지 않지만,

    직접 구현할 수 없더라도 읽고 개념을 정립하고,

    협업할 수 있는 방안을 찾아 문제해결에 도움이 되었으면 좋겠다.

     

     

    "한빛미디어 <나는 리뷰어다활동을 위해서 책을 제공받아 작성된 서평입니다."

     

     

    #만들면서 #배우는 #파이토치 #딥러닝 #12가지 #모델로 #알아보는 #딥러닝_응용법 #PYTORCH #DEEP_LEARNING #한빛미디어 #VGG #SDD #PSPNet #Open_Pose #DCGAN #AnoGAN #Efficient_GAN #Transformer #BERT #3DCNN #ECO

     

  • 최근 핫한 딥러닝 트렌드를 꼽자면 역시 파이토치라고 생각을 한다. 한동안은 텐서플로가 우세하게 나타났지만, 어느샌가 파이토치의 간결함과 직관성이 인정을 받기 시작해서 하나둘씩 찾는 사람들이 많이 늘어나는 상황이다. 이런 흐름을 반영이라도 하듯 텐서플로우 위주의 도서들이 점차 파이토치의 분량이 늘어나는 것을 확인할 수 있는데, 이번에 읽은 책도 그 일환으로 비춰지고 있다.

     

     

    이 책은 파이토치를 활용해 딥러닝의 핵심기술이라고 볼 수 있는 컴퓨터 비전과 자연어처리와 관련된 여러 모델들을 파이토치로 구현하는 법을 알려주는 책이다. VGG,PSPNet, GAN, BERT 등 각 분야에 관심있다면 잘 알법한 기본적이면서 필수적인 모델들을 어떻게 파이토치로 구현하는지를 친절하게 알려주고 있다.

     

     

    아무래도 모델을 사용하는 것에 중점을 맞추다보니 내용 전개는 모델에 대한 간단한 설명과 모델에 필요한 파트들을 파이토치로 어떻게 구현하는지가 주를 이룬다. 다른 기본지식없이 모델 설명으로 들어가다보니 인공지능에 대한 이해가 어느정도 있고, 이론 지식이 있거나 텐서플로우로 구현할 줄 아는 실력있는 사람에게 더 적합한 책이란 생각이 든다. 즉, 초보가 보기에는 내용이 어려워서 불편하다는 의미이다.

     

     

    한가지 아쉬운 부분이 있다면 자연어 처리 부분이라고 생각한다. 저자가 일본인이다 보니 예제로 보여주는 자연어처리 구문의 예제가 일본어로 나오는게 개인적으로 좀 아쉬웠다. 물론 자연어 처리 모델이라는 것 자체가 어떤 언어이든 맞춰질 수 있는 부분이고, 이 책이 번역된 부분이다 보니 한국어가 아닌 다른 예제일 것이라 생각은 했지만, 일본어가 예제로 나온 탓에 불편한 부분이 다소 있기는 했던 것은 아쉬웠다. 혹여 이 책을 구할 사람이라면 자연어 처리와 관련된 부분은 일본어 예제가 꽤 있다는 것은 고려하면 좋을 듯 하다.

     

     

    저런 언어적인 문제가 있다 하더라도 책 자체에 들어있는 내용은 괜찮은 편이다. 모델에 대한 이해도 최대한 쉽게 설명을 잘 되어있고, 코드에 대한 예제나 설명도 괜찮다고 생각한다. 다소 난이도가 있다는 부분이 있다고 하더라도 파이토치로 모델을 구현한다는 것에 대한 부분은 깔끔히 잘정리되어있다고 생각한다. 다만 앞서 얘기했듯 어느정도의 배경지식이 필요하고, 바로 모델로 접근하기 때문에 컴퓨터 비전 또는 자연어 처리에 대한 베이스가 있는 상태에서 이 책을 보면 좋을 듯 하다.

     

  • 인공지능에 대한 관심이 늘면서, 서점의 IT 섹션에 가면 딥러닝, 머신러닝, 인공지능 책들이 많이 전시되어 있다. 나도 가끔 퇴근하면서, 요새 나오는 인공지능 전문서적들의 트랜드가 어떤지에 대해서 살펴보곤한다. 많은 책들은 본 것은 아니지만, 시중에서 많이 살펴보는 책들은 아무래도 다음과 같은 경향을 가지고 있지 않나 싶다.

    • 머신러닝의 기초부터 심층 신경망의 이론적인 부분을 다루고, 이에 대한 예시를 간단하게 다룬 책
    • 심층 신경망을 구현할 수 있는 프레임워크인 텐서플로나 파이토치의 사용법에 대해서 다루고, 이를 바탕으로 실제로 구현해보는 책
    • 캐글같은 데이터 대회의 문제 프로젝트를 기반으로 문제를 해결할 수 있는 기법에 대해서 다룬 책

    사실 위의 내용을 모두 다루기에는 책의 분량은 한정되어 있다.(여담으로 유명한 책 중 하나인 핸즈온 머신러닝 책도 분량이 대략 950페이지 정도이다..) 또 책의 두께가 두꺼워지면 아무래도 책장의 장식품이 될 가능성이 매우 높다. 개인적인 경험으로는...

     아무튼 이런 이유로 아무래도 난이도별, 혹은 이를 가지고 현업에 적용하고자 하는 실무자별로 책의 구분이 초/중/고급 등으로 나눠질텐데, 이번에 소개할 책은 나름 최근에 소개된 이론에 대한 구현을 소개한 전형적인 "고급"책이다.

     

     

    이 책은 앞에서 소개했던 것처럼, 보통 파이토치 책들의 서두에 나오는 기본 문법이나 동작 원리에 대한 설명없이 첫장부터 VGG를 이용한 transfer learning을 다루고, 이에 대한 이론적인 설명이 나온다. 그래서 어느 정도 파이토치의 사용에 익숙하고, 이론적인 배경이 있는 현업 실무자가 읽으면 좋을 거 같다. 또다른 적절한 독자층을 찾자면, 많이 나오는 논문들의 배경을 설명하고, 이를 파이토치로 구현하는 방법을 살펴보고 싶은 사람이라면 이 책이 딱 그 목적을 충족시킨다. 이 책은 저자가 논문에 대한 본인의 이해를 바탕으로 코드로 구현할때 참고했던 점에 대해서 설명되어 있다. 사실 논문을 직접 읽는 것도 좋지만, 논문에 수없이 나와있는 수식과 불친절한 해석은 막상 원리를 코드로 구현하기 막막할텐데, 이 책에서는 그런 수식에 대한 설명보다는 이를 잘 설명할 수 있는 예시를 기반으로 설명되어 있기 때문에 조금 더 읽는 입장에서는 이해하기가 수월했다. 참고로 이 책에서는 다음과 같은 내용들을 다루고 있다.

    • VGGNet과 이를 활용한 Transfer learning
    • Single Shot Detector (SSD)을 통한 Object Detection
    • Pyramid Scene Parsing Network (PSPNet)을 통한 Semantic Segmentation
    • OpenPose Network을 통한 자세 추정
    • DCGAN, Self Attention GAN
    • AnoGan, Efficient GAN을 활용한 Anomaly Detection
    • Transformer
    • Bidirectional Encoder Representations from Transformers (BERT)
    • 3DCNN, ECO 등을 활용한 동영상 분류

    이밖에도 이론적인 내용 외로, 이를 데이터로 활용하기 위한 전처리 기법이나 텐서보드 활용법, 책에서 다루는 신경망을 AWS로 학습시킬때의 방법들은 내용 외적으로 실무에서 적용해보고자 하는 사람에게는 도움이 될만한 부분이 담겨져있다. 참고로 이 책에서 다루는 대부분의 신경망들은 왠만한 개인 PC에서 돌리기엔 조금 버거운 형태로 구성되어 있다. 그래서 AWS나 GCP, Azure같은 클라우드 인스턴스에서 가속기 지원을 받은 상태에서 학습시켜야 원하는 결과를 얻을 수 있다. 

    다만 아쉬운 부분이 있다면, 책의 내용이 12개의 모델을 통해서 딥러닝 관련 내용을 다뤘다고는 하지만 실제로는 거의 대부분의 내용이 영상처리 모델에 내용을 다루고 있다는 점(물론 언어모델인 Transformer나 BERT에 대한 내용도 다른 주제에 비교할 수 있을 만큼 잘 설명되어 있다.), 특히 Transformer를 설명하는 부분에서는 원서 그대로 일어에 대한 예시가 소개되어 있는 부분은 영어나 한글이 많이 사용하는 실무에서는 조금 보기 어려운 점이 있지 않나 싶은 생각이 있다. 물론 한글에 대한 모델이나 일어에 대한 모델이나 언어를 학습하는 모델 측면에서는 비슷한 개념이겠지만...

    개인 입장에서는 딱 내 목적에 부합한 책이었다. 항상 집에 와서도 고민하는 내용은 내가 너무 쉬운 내용만 가지고 회사에서 일하는 것은 아닐까? 혹은 나도 조금 더 최신 기술에 대한 내용도 살펴보면서 구현도 해봐야 하는 것은 아닌가 하는 걱정을 항상 가진다. 그런데 시간은 항상 없고, 그렇다고 논문을 딱 보면 "이를 어떻게 구현할까?" 하는 막막함까지 든다. 그래서 항상 설명을 예시와 함께 설명해주고, 이를 코드로 적용할 수 있는 기법에 대한 내용이 다뤄진 책을 갈망했었는데, 이번 기회에 그 내용들을 접하게 되어서 좋았다. 아마 나와 비슷한 생각을 했던 사람이라면 이 책을 딱 봤을 때, 그런 논문에만 언급된 모델들을 실제로 구현해볼 경험을 얻을 수 있을 것이다.

    참고: 원서 소스 코드 (Jupyter Notebook으로 되어 있어서 보기 편할 것이다.)

     

    GitHub - YutaroOgawa/pytorch_advanced: 書籍「つくりながら学ぶ! PyTorchによる発展ディープラーニング」

    書籍「つくりながら学ぶ! PyTorchによる発展ディープラーニング」の実装コードを配置したリポジトリです - GitHub - YutaroOgawa/pytorch_advanced: 書籍「つくりながら学ぶ! PyTorchによる発展ディープラ

    github.com

     



    출처: https://talkingaboutme.tistory.com/entry/Book-pytorch-advanced [자신에 대한 고찰]

  • " 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성한 서평입니다 "

    이 책은 딥러닝 입문자가 아니라 중고급자를 위한 딥러닝 실전 적용 책이라 할 수 있습니다.

    기본적인 딥러닝 지식들은 건너뛰고 바로 딥러닝 알고리즘을 활용하는 방법을 배우기 때문에

    기초적인 딥러닝 지식은 다른 책을 통하여 미리 습득하고 오길 권장합니다.

     

     

    이 책에서 다루는 12가지 모델은 다음과 같습니다.

     

    화상 분류와 전이학습(VGG)

    물체 인식(SDD)

    시맨틱 분할(PSPNet)

    자세 추정(OpenPose)

    GAN을 활용한 화상생성(DCGAN, Self-Attention GAN)

    GAN을 활용한 이상 감지(AnoGAN, Efficient GAN)

    자연어 처리를 활용한 감정분석(Transformer)

    자연어 처리를 활용한 감정분석(BERT)

    동영상 분류(3DCNN, ECO)

     

    제일 좋은 점은 책 집필 시점(21년 8월)에서 가장 최고 성능의 모델을 선별하여 다루고 있기 때문에 

    성능에 대한 고민을 덜게 되고,

    책만 잘 따라서 코딩을 하고 이해하면 직접 구현을 하는 데 문제가 없도록 설명도 친절합니다.

    또한 해당 알고리즘 구현을 위한 기본적인 이해를 돕는 알고리즘에 대한 설명과 도식화가 잘 되어 있기 때문에 따로 알고리즘 논문을 찾아보지 않고 이 책만 보면 알고리즘 자체를 이해할 수 있게 됩니다.

     

    그리고 자연어 처리면 자연어 처리만, 이미지 혹은 영상처리면 이미지, 영상처리만, 이렇게 분야별로 특화된 도서들은 많았지만 이렇게 다양한 딥러닝 분야의 알고리즘을 한데 모아서 전반적으로 적용방법을 익힐 수 있다는 것이 이 책의 좋은 점인 것 같습니다.

     

    아직 책을 따라가면서 하나하나 해보고 있는 중이지만, 책을 보면서 직접 파이토치로 구현해보고 데이터셋을 불러와서 적용해보는 과정들이 굉장히 재미있습니다.

     

    딥러닝 알고리즘은 하나의 수단이고, 이 수단을 활용할 업무, 즉 도메인이 메인인만큼

    어떤 도메인에 어떠한 딥러닝 알고리즘을 적용해볼지 앞으로 행복한 아이디어 고민을 해봐야 겠습니다.

  •  

    저자: 오가와 유타로

     

     

    #책소개

     

    딥러닝을 진정으로 가치있게 활용하는 방법!

    딥러닝은 입출력 데이터와 손실함수만 잘 정의한다면 다양한 분야의 과제를 해결할 수 있다. 딥러닝 응용 방법으로 전이학습과 파인튜닝을 활용한 화상(이미지) 분류, 물체 감지, 시맨틱 분할, 자세 추정, GAN을 활용한 화상 생성 및 이상 탐지, 텍스트 데이터 감정 분석, 동영상 데이터 클래스 분류를 다뤘다. 직무 특성에 따른 도메인 지식과 딥러닝 구현 능력을 갖춘 인재로 성장하여 활약하는 데 이 책이 도움이 될 것이다.

     

    라고 교보문고가 소개하더이다.

     


     

     

    # 이 책의 특징

     

     

     

    1. 필요한 그림과 충실한 개념 설명

    거의 모든 한빛미디어의 책이 이러한 특징을 가지고 있다.

    정말이다. 이번에 자연어처리를 하면서 배우는 과정에 적합한 책이다.

     

    2. 적절한 예시

    예시가 많은 것은 사실이다.

    하지만 아쉬운 것이 있다면... 주석을 조금 더 독자친화적으로 달아주었으면 하는 아쉬움이 있다.

    물론 모두를 이해시키기 위해한 것이겠지만 처음 하는 사람에게는 감이 덜 온다.ㅠ

     

    3. 프레임워크에 대한 자세한 설명

    솔직히 텐서플로우, 파이토치 비슷하지만 자세히 설명한 책을 그렇게 많지 않은 것 같은데

    이 책은 책도 두껍고 꽤나 자세한 편이라고 생각한다.

    이제 이것을 이용해서 프로젝트 하나하는 것만 남았다.

     

     

     


     

    #후기

     

    지금 머신러닝을 포기한 듯 싶지만.. 사실 포기하지 않았다.

    자연어 처리로 욕설을 거르고 싶은 욕심이 있다.

    이 책이 나를 도와줄 책이라고 생각한다.

    현 시점에서는 욕을 직접하지 않는다.바로 필터링 되기 때문이다.하지만 씨 같은 것을 ^^ㅣ 로 바꾸어서 욕을 하는 등..창의력 대장이다.어떻게 할 지 천천히 이 책을 보면서 생각해보겠다.




  • 이 책을 통해 딥러닝 기술의 응용법을 구현하며 학습해볼 수 있다.

    딥러닝 구현 패키지는 파이토치를 이용하고 있으며, 아나콘다와 주피터 노트북, AWS를 이용해서 실습을 해볼 수 있다.

    화상 분류와 전이학습(VGG), 물체 감지(SSD), 시맨틱 분할(PSPNet), 자세 추정(OpenPose), GAN을 활용한 화상 생성(DCGAN, Self-Attention GAN), GAN을 활용한 이상 화상 탐지(AnoGAN, Efficient GAN), 자연어 처리에 의한 감정 분석(Transformer), 자연어 처리를 활용한 감정 분석(BERT), 동영상 분류(3DCNN, ECO)와 같은 다양한 방법으로 딥러닝을 활용하는 내용을 담고 있다.

    아예 딥러닝을 처음 시작하는 사람들보다는, 기초적인 딥러닝을 구현한 경험이 있는 사람이 이 책을 읽으면 좋을 것 같다. 다양한 예제로 실습해보면서 딥러닝 응용에 대한 갈피를 잡을 수 있을 것이라 생각이 든다.

     

    * 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

  • 파이토치는 파이썬을 위한 오픈소스 머신러닝 라이브러리이다.

     

    본 책 '만들면서 배우는 파이토치 딥러닝-12가지 모델로 알아보는 딥러닝 활용법' 이라는 제목에서 알 수 있듯이 이 책은 파이토치를  통해 딥러닝 모델을 시행하고 있는데 내용상 중급자 이상에 해당하는 내용이므로 이 책을 보기전 초중급 정도의 실력은 이미 갖추고 있어야 하지 않을까 생각한다.

     

    책 본문에서는 1장 화상분류와 전이학습(VGG), 2장 물체인식, 3장 시맨틱 분할, 4장 자세수정, 5장 GAN을 활용한 화상생성, 6장 GAN을 활용한 이상 감지, 7장 자연어 처리를 활용한 감정분석, 8장 자연어 처리를 활용한 감정분석, 9장 동영상 분류등으로 이뤄져 있으며 특히 물체감지, 시맨틱 분할등은 이 책이 다른 책과 달리 좀더 상세하고 쉽게 씌여져 있어 보인다.

     

    이 책에서 잘되어 보이는 부분은 책 초반에 프로그램 설치와 관련 친절하게 각 화면 마다 쉽게 입력하면서 프로세스를 진행하도록 친절하게 설명되어 있는점과 본문마다 프로그래밍 코드에 대해 설명하고 있는 점이다.

     

    저자 오가와 유타로는 동경대 공학부를 거쳐 동경대 대학원에서 뇌 신경과학을 연구하고 비교적 최근인 2016년 박사학위를 취득하고 현재 직무에 종사하고 있어 상대적으로 저작물에 대한 신뢰도가 높아보이기도 한다.

     

    저자는 이제 단독으로 학문적으로 딥러닝이 다뤄지기 보다는 실용적으로 실무에 적용하는 단계로 이를 접근해 나가야 더 많이 이 분야에 발전이 기대된다고 언급하고 있는데 앞으로 업무를 수행한다던가 연구과제를 수행함에 있어 이러한 실사구시적 관점에서 본 내용을 활용하면 더 많은 진전이 있으리라 사료된다.

     

    "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

부록/예제소스
자료명 등록일 다운로드
DOWNLOAD 예제소스 2021-08-04 다운로드
결제하기
• 문화비 소득공제 가능

배송료 안내

  • 책, 아이템 등 상품을 1만원 이상 구매시 무료배송
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

도서판매처

리뷰쓰기

닫기
* 도서명 :
만들면서 배우는 파이토치 딥러닝
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
만들면서 배우는 파이토치 딥러닝
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
만들면서 배우는 파이토치 딥러닝
구입처*
구입일*
부가기호*
부가기호 안내

* 인터넷 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 한빛 웹사이트에서 구입한 도서는 자동 인증됩니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실