메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

파이토치로 배우는 자연어 처리

딥러닝을 이용한 자연어 처리 애플리케이션 구축

한빛미디어

번역서

판매중

  • 저자 : 델립 라오 , 브라이언 맥머핸
  • 번역 : 박해선
  • 출간 : 2021-06-01
  • 페이지 : 296 쪽
  • ISBN : 9791162244333
  • 물류코드 :10433
초급 초중급 중급 중고급 고급
5점 (2명)
좋아요 : 0

쉽고 빠르게 익히는 자연어 처리 입문 가이드북

 

자연어 처리(NLP)는 인공지능이 지닌 무한한 능력을 이용해 애플 시리, 아마존 알렉사, 구글 번역 등과 같은 제품을 탄생시켰다. 복잡하고 어렵게만 여겨지던 자연어 처리는 파이썬 기반 딥러닝 라이브러리인 파이토치를 통해 딥러닝을 처음 접하는 개발자 및 데이터 과학자도 손쉽게 구현할 수 있게 되었다.

 

이 책은 자연어 처리 및 딥러닝 알고리즘 학습에 필요한 내용을 다룬다. 또한 파이토치를 사용해 자연어 처리 과정에서 직면할 수 있는 문제와 다양한 텍스트를 표현하는 애플리케이션을 구축하는 방법을 보여준다. 딥러닝 및 자연어 처리 기초부터 난도 시퀀스 모델링까지 쉽고 빠르게 익혀보세요. 

 

저자

델립 라오

프란시스코에 기반을 두고 머신러닝과 자연어 처리 연구에 특화된 컨설팅을 제공하는 회사인 주스트웨어Joostware의 창립자이다. 또한 뉴스 미디어의 팩트 체크 문제를 해결하고자 해커와A I 연구자들이 함께 만든 페이크 뉴스 챌린지Fake News Challenge의 공동 창립자다. 델립은 이전에 트위터와 아마존(알렉사Alexa )에서 NLP 연구와 제품 개발을 했다.

저자

브라이언 맥머핸

웰스 파고Wells Fargo의 연구 과학자로 주로 자연어 처리를 연구한다. 이전에는 주스트웨어에서 자연어 처리를 연구했다.

역자

박해선

ML GDEMachine Learning Google Developer Expert. 기계공학을 전공했지만 졸업 후엔 줄곧 코드를 읽고 쓰는 일을 했다. 텐서 플로우 블로그(tensorflow.blog)를 운영하고 있고, 머신러닝과 딥러닝 책을 집필하고 번역하면서 소프트웨어와 과학의 경계를 흥미롭게 탐험하고 있다.

 

『혼자 공부하는 머신러닝+딥러닝』(한빛미디어, 2020), 『Do it! 딥러닝 입문』(이지스퍼블리싱, 2019)을 집필했다.

 

『머신 러닝 교과서 3판』(길벗, 2021), 『딥러닝 일러스트레이티드』(시그마프레스, 2021), 『GAN

인 액션』(한빛미디어, 2020), 『핸즈온 머신러닝 2판』(한빛미디어, 2020), 『미술관에 GAN 딥러닝

실전 프로젝트』(한빛미디어, 2019), 『파이썬을 활용한 머신러닝 쿡북』(한빛미디어, 2019), 『머신

러닝 교과서』(길벗, 2019), 『(개정판)파이썬 라이브러리를 활용한 머신러닝』(한빛미디어, 2019),

『케라스 창시자에게 배우는 딥러닝』(길벗, 2018), 『핸즈온 머신러닝』(한빛미디어, 2018), 『파이썬 라이브러리를 활용한 머신러닝』(한빛미디어, 2017), 『텐서플로 첫걸음』(한빛미디어, 2016)을 우리말로 옮겼다.

 

1장_소개

1.1 지도 학습

1.2 샘플과 타깃의 인코딩

1.3 계산 그래프

1.4 파이토치 기초

1.5 연습문제

1.6 요약

1.7 참고 문헌

 

2장_NLP 기술 빠르게 훑어보기

2.1 말뭉치, 토큰, 타입

2.2 유니그램, 바이그램, 트라이그램, …, n-그램

2.3 표제어와 어간

2.4 문장과 문서 분류하기

2.5 단어 분류하기: 품사 태깅

2.6 청크 나누기와 개체명 인식

2.7 문장 구조

2.8 단어 의미와 의미론

2.9 요약

2.10 참고 문헌

 

3장_신경망의 기본 구성 요소

3.1 퍼셉트론: 가장 간단한 신경망

3.2 활성화 함수

3.3 손실 함수

3.4 지도 학습 훈련 알아보기

3.5 부가적인 훈련 개념

3.6 예제: 레스토랑 리뷰 감성 분류하기

3.7 요약

3.8 참고 문헌

 

4장_자연어 처리를 위한 피드 포워드 신경망

4.1 다층 퍼셉트론

4.2 예제: MLP로 성씨 분류하기

4.3 합성곱 신경망

4.4 예제: CNN으로 성씨 분류하기

4.5 CNN에 관한 추가 내용

4.6 요약

4.7 참고 문헌

 

5장_단어와 타입 임베딩

5.1 임베딩을 배우는 이유

5.2 예제: CBOW 임베딩 학습하기

5.3 예제: 문서 분류에 사전 훈련된 임베딩을 사용한 전이 학습

5.4 요약

5.5 참고 문헌

 

6장_자연어 처리를 위한 시퀀스 모델링 - 초급

6.1 순환 신경망 소개

6.2 예제: 문자 RNN으로 성씨 국적 분류하기

6.3 요약

6.4 참고 문헌

 

7장_자연어 처리를 위한 시퀀스 모델링 - 중급

7.1 엘만 RNN의 문제점

7.2 엘만 RNN의 문제 해결책: 게이팅

7.3 예제: 문자 RNN으로 성씨 생성하기

7.4 시퀀스 모델 훈련 노하우

7.5 참조 문헌

 

8장_자연어 처리를 위한 시퀀스 모델링 - 고급

8.1 시퀀스-투-시퀀스 모델, 인코더-디코더 모델, 조건부 생성

8.2 강력한 시퀀스 모델링: 양방향 순환 모델

8.3 강력한 시퀀스 모델링: 어텐션

8.4 시퀀스 생성 모델 평가

8.5 예제: 신경망 기계 번역

8.6 요약

 

9장_고전 모델, 최신 모델, 더 배울 것들

9.1 지금까지 배운 내용

9.2 전통적인 NLP 주제

9.3 최신 NLP 모델

9.4 NLP 시스템을 위한 디자인 패턴

9.5 더 배울 것들

9.6 참고 문헌

수식 없이 예제를 통해 배우는 자연어 처리 & 딥러닝

 

자연어 처리와 딥러닝은 급격히 성장하고 있는 분야입니다. 특히 머신러닝, 딥러닝은 지적인 과학이라기보다 경험적인 학문입니다. 이 책은 자연어 처리(NLP)와 딥러닝을 처음 접하는 독자를 위해 두 분야에서 중요하면서 기본이 되는 내용을 주로 다룹니다. 복잡한 수식과 이론보다는 구현에 중점을 두어 딥러닝과 자연어 처리를 학습할 수 있으며, 모든 예제는 구글 코랩에서 파이토치를 기반으로 실습할 수 있습니다. 실습 예제는 딥러닝과 자연어 처리를 학습하고 이해하는 데 꼭 필요한 내용을 위주로 구성되었습니다. 책을 통해 독자가 기초적인 토대를 다지고 이 분야의 가능성을 엿볼 수 있기를 바랍니다. 각 장의 친절한 엔드 투 엔드 예제가 여러분을 이런 경험으로 안내할 것입니다.

 

주요 내용

  • 계산 그래프 및 지도 학습 이해하기
  • 신경망을 구축하는 기본적인 방법 
  • 자연어 처리의 기본 개념 학습하기
  • 자연어 처리를 위한 피드-포워드 신경망
  • 임베딩을 사용해 단어, 문장, 문서 및 기타 기능 나타내기
  • 자연어 처리를 위한 시퀀스 데이터 모델링 - 초급, 중급, 고급
  • 시퀀스 예측 및 시퀀스-투-시퀀스 모델 확장
  • 카카오브레인에서 만든 자연어 처리 라이브러리 뽀로로(pororo) 살펴보기(한국어판 부록)

  • 이번 6월은 자연어 처리 서적에 대하여 리뷰할 수 있는 기회를 받을 수 있었습니다.

    대학원 수업을 처음 수강하면서 자연어 처리라는 분야를 배워볼 수 있었습니다.

     

    처음에는 비정형 데이터를 사용하여 분석을 진행한다는 것이 보이는 것처럼 쉽지는 않았습니다.

    이번에 제공받은 파이토치로 배우는 자연어 처리 책은 오라일리책 답게,

     

    그림과 코드예제가 잘 나와있어서 초보자도 직관적으로 이해하기 쉽다는 것을 느꼈습니다.

    그리고 무엇보다도 참고문헌 파트를 통하여 개념을 인용한 논문들을 찾아볼 수 있었으며, 연습 문제를 통하여서 개념을 한 번 더 집고 넘어갈 수 있는 시간이 있어서 좋았습니다.

    마지막으로 언어학적인 개념까지 설명을 해주어서 컴퓨터 공학적 부분만이 아닌 메커니즘과 아이디어, 이론을 함께 공부하기 좋은 책입니다.

    마지막으로 좋은 책 제공과 기회를 주신 한빛미디어 담당자 분들께 감사 드립니다. 7월에도 내용이 탄탄한 도서를 읽고 빨리 리뷰를 남기고 싶습니다.

    "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

  • 파이토치는 파이썬을 위한 오픈소스 머신러닝 라이브러리이다.

     

    본 책 '파이토치로 배우는 자연어 처리'  제목에서 알 수 있듯이 이 책은 파이토치, 자연어 프로세싱(NPL)을 다루고 있는데 최근 각광을 받고 있는 애플 시리, 구글 어시스턴트, 아마존 알렉사, 삼성 빅스비 등 인공 비서 서비스는 모두 자연어 처리 애플리케이션 제품이다. 

     

    이 책은 입문적 성격을 띄고 있다 해도 완전 초급자를 위한 책은 아니고 파이썬, 데이터과학, 통계, 데이터 마이닝의 선수 지식을 배경으로 자연어 처리 학습을 위한 초중급 이상 개발자를 위한 책으로 보인다.

     

    책의 내용을 개략적으로 살펴보면 총 9장으로 구성되었으며 1, 2장은 파이토치와 NLP에 대한 개관 3~5장은 신경망 모형, 단어 임베딩 6~9장은 초-중-고급의 자연어 시퀀스 모델링을 다루고 있다.

     

    이 책에서 잘되어 보이는 부분은 머신러닝 구동을 위해 통계학, 데이터 과학 전공서적을 굳이 찾아보지 않아도 어느정도 설명을 해두어 시간을 절약하게 했다는 점이다.

     

    물론 초급자의 경우 읽다보면 모르는 부분이 발생하고 검색, 전공서적을 구입하게 될 수도 있는데 그래도 책을 읽다보면 저자들이 최대한 풀어 설명하려고 애쓴 흔적이 보이며 저자 델립 라오는 아마존 알렉사 개발에 참여했다는 저자 소개가 이 책의 신뢰도를 높여 보인다.

     

    그리고 책을 읽다보면 영어영문학등 제언어학에 대한 이해가 부족한 경우 자연어 처리에 관해 깊고 미세한 학습하는데 부족한 점을 느끼게 된다. 개인적으로 이 책을 읽어 보면서 음운론, 의미론, 형태론, 화용론, 구문론에 대한 학습을 하고 싶다는 생각이 들었다.

     

    항상 느끼지만 앞으로의 공부는 커리큘럼이라는 주어진 틀안에서의 공부보다는 닥치거나 닥치게 될 상황에 대해 학습하는것이 주가 되어야 하는게 아닌가 싶다. 모르는 부분이 있어도 자신을 속이기 보다 빈 곳을 채워 나가는 노력이 필요할 것 같다.

     

    <이 리뷰는 한빛미디어 도서협찬을 받아 작성하였습니다>

결제하기
• 문화비 소득공제 가능

배송료 안내

  • 책, 아이템 등 상품을 1만원 이상 구매시 무료배송
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

도서판매처

리뷰쓰기

닫기
* 도서명 :
파이토치로 배우는 자연어 처리
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
파이토치로 배우는 자연어 처리
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
파이토치로 배우는 자연어 처리
구입처*
구입일*
부가기호*
부가기호 안내

* 인터넷 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 한빛 웹사이트에서 구입한 도서는 자동 인증됩니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실