메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기
정가 31,200원
판매가
31,200원
총 결제 금액 31,200원
dropdown arrow
  • 소장/대여 옵션 선택
  • 소장
  • 365일
    30% 할인
  • 180일
    40% 할인
  • 90일
    50% 할인
  • 30일
    60% 할인

전자책은 웹뷰어와 한빛+ 앱에서
열람할 수 있으며, PDF 다운로드는 지원되지 않습니다.

대여 가능

전자책

종이책

트랜스포머 아키텍처로 배우는 AI 에이전트 with 랭체인 & 랭그래프

RAG부터 파인튜닝, 양자화, MCP까지

  • 저자장철원
  • 출간2026-05-25
  • 페이지480 쪽
  • eISBN9791175796652
  • 물류코드51665
  • 난이도
    초급 초중급 중급 중고급 고급
4.4점 (7명)

단순한 활용을 넘어 원리부터 구축까지,
AI 에이전트 개발을 위한 모든 지식

 

지능형 AI 에이전트의 시대, 이 책은 LLM 블랙박스 속 원리를 체계적으로 분석합니다. 현대 인공지능의 뼈대인 트랜스포머 아키텍처를 원리부터 상세히 분석하여, 모델이 어떻게 문맥을 이해하고 정교한 답변을 생성하는지 명확히 설명합니다. 셀프 어텐션과 강화학습의 이론적 토대부터 랭체인과 랭그래프를 활용한 실전 에이전트 구축까지의 전 과정을 한 권에 담았습니다. 특히 이론 학습에 그치지 않고 Streamlit을 이용한 서비스 배포, RAG, 그리고 외부 시스템과의 표준화된 연결을 돕는 최신 MCP 기술까지 폭넓게 다룹니다. 단순히 응용 코드를 따라 하는 수준을 넘어, 모델 구조를 정확히 이해함으로써 나만의 차별화된 AI 솔루션을 설계하고 기술 트렌드의 변화 속에서 스스로 판단할 수 있는 능력을 길러보세요.

 

주요 내용
●    자연어 처리의 기본 개념과 기초 수학, 강화학습의 핵심 원리
●    RNN, LSTM, seq2seq, 어텐션 구조
●    트랜스포머 내부의 인코더와 디코더 아키텍처 구조
●    Ollama, 트랜스포머, Llama_cpp, 랭체인, 랭그래프를 활용한 AI 에이전트 실습
●    Full fine-tuning, PEFT, Adapter, LoRA, QLoRA, 양자화로 이어지는 로컬 LLM과 모델 재학습 방법
●    ChromaDB 기반 RAG, 대화형 RAG, Iterative RAG, Adaptive RAG를 통한 검색 증강 생성 실습
●    A2A와 MCP로 이해하는 멀티 에이전트 및 외부 도구 연동
●    Streamlit으로 대화 기억, 랭그래프, RAG를 결합한 AI 에이전트 서비스 구현
 

 

장철원 저자

장철원

충북대학교에서 통계학을 전공하고 고려대학교에서 통계학 석사 학위를 받은 후 플로리다 주립대학교 통계학 박사과정에 진학했다. 어렸을 때부터 게임을 좋아하여 크래프톤 데이터 분석실에서 머신러닝을 활용한 이탈률 예측, 고객 분류 업무 등을 담당했다. 특히 배틀그라운드 핵 탐지 관련 업무를 하면서 IT 보안에 흥미를 느끼게 되었다. 이후 NHN 클라우드 사업본부 IT 보안실에서 머신러닝을 활용한 매크로 자동 탐지 시스템을 개발하고 특허를 등록했다. 삼성전자, KB국민은행, LG에너지솔루션 등 여러 기업에서 IT 관련 강의를 했으며, 현재도 다양한 교육 활동을 진행하고 있다. 꾸준히 IT 도서를 집필하고 소프트웨어를 개발한다. 또한 지식을 공유하는 데 보람을 느껴 블로그, 카페, 유튜브를 운영하며 많은 이들과 활발히 소통하고 있다.

CHAPTER 1 실습 환경 구축하기
_1.1 비주얼 스튜디오 설치
_1.2 미니콘다를 활용한 가상 환경 구축
_1.3 CPU 환경 - 파이썬 라이브러리 설치
_1.4 GPU 환경 - 파이썬 라이브러리 설치

 

CHAPTER 2 자연어 처리 기초
_2.1 자연어 처리의 개념
__2.1.1 자연어 처리의 발전
__2.1.2 word2vec
__2.1.3 토큰화
__2.1.4 임베딩
__2.1.5 청킹
_2.2 기초 수학
__2.2.1 스칼라, 벡터, 행렬
__2.2.2 내적
__2.2.3 외적
__2.2.4 편미분
__2.2.5 그래디언트 디센트

 

CHAPTER 3 강화학습 기초
_3.1 강화학습의 개념
__3.1.1 강화학습의 정의
__3.1.2 강화학습의 구성 요소
_3.2 상태가 변하지 않을 경우의 보상 추정
__3.2.1 다중 슬롯 머신 문제
__3.2.2 행동에 따른 가치 추정 방법
__3.2.3 점진적 업데이트 방식
_3.3 마르코프 결정 프로세스
__3.3.1 마르코프 결정 프로세스의 정의
__3.3.2 누적 보상
__3.3.3 정책과 가치 함수
_3.4 몬테카를로 방법
__3.4.1 몬테카를로 방법의 개념
__3.4.2 몬테카를로 방법을 활용한 상태 가치 예측
__3.4.3 상태 가치 예측 실습
_3.5 시간차 학습
__3.5.1 TD(0)의 개념
__3.5.2 TD(0) 실습
__3.5.3 Sarsa의 개념
__3.5.4 Sarsa 실습
__3.5.5 Q-learning의 개념
__3.5.6 Q-learning 실습
__3.5.7 Q-learning을 활용한 자연어 처리 강화학습

 

CHAPTER 4 시퀀스 모델
_4.1 순환 신경망의 개념
__4.1.1 순환 신경망 기초
__4.1.2 손실 함수의 그래디언트
_4.2 LSTM
__4.2.1 LSTM의 개념
__4.2.2 LSTM 구조
__4.2.3 양방향 LSTM
__4.2.4 넘파이를 활용한 LSTM 실습
_4.3 seq2seq
__4.3.1 seq2seq의 개념
__4.3.2 빔 서치

 

CHAPTER 5 어텐션
_5.1 어텐션의 기본 원리
__5.1.1 어텐션의 정의
__5.1.2 어텐션의 구조
__5.1.3 Query, Key, Value
_5.2 셀프 어텐션
__5.2.1 셀프 어텐션의 개념
__5.2.2 입력 벡터 기준으로 보는 셀프 어텐션 구조
__5.2.3 입력 행렬 기준으로 보는 셀프 어텐션 구조
_5.3 멀티 헤드 어텐션
__5.3.1 멀티 헤드 어텐션의 개념
__5.3.2 멀티 헤드 어텐션의 구조
_5.4 크로스 어텐션
__5.4.1 크로스 어텐션의 개념
__5.4.2 크로스 어텐션의 구조

 

CHAPTER 6 트랜스포머
_6.1 트랜스포머의 개념
_6.2 포지셔널 인코딩
__6.2.1 포지셔널 인코딩의 개념
__6.2.2 포지셔널 인코딩의 구조
_6.3 트랜스포머 아키텍처
__6.3.1 전체 구조
__6.3.2 트랜스포머의 인코더
__6.3.3 트랜스포머의 디코더
_6.4 트랜스포머를 활용한 학습 및 추론
__6.4.1 트랜스포머를 활용한 학습
__6.4.2 트랜스포머를 활용한 추론

 

CHAPTER 7 LLM의 발전
_7.1 LLM의 개념
__7.1.1 LLM의 유형
__7.1.2 LLM 기술 발전 연대기
_7.2 강화학습을 적용한 LLM
__7.2.1 기존 언어 모델의 문제점
__7.2.2 사용자 피드백을 활용한 강화학습
__7.2.3 PPO 알고리즘의 등장
__7.2.4 강화학습에 적용된 PPO 알고리즘
__7.2.5 few-shot, one-shot, zero-shot 학습 방법
__7.2.6 InstructGPT
__7.2.7 유익하고 안전한 언어 모델
_7.3 LLM의 종류
__7.3.1 GPT
__7.3.2 LLaMA
__7.3.3 BERT

 

CHAPTER 8 LLM 에이전트 개발 도구
_8.1 Ollama
__8.1.1 Ollama 소개
__8.1.2 Ollama 기본 실습
_8.2 트랜스포머 라이브러리
__8.2.1 허깅페이스 소개
__8.2.2 트랜스포머 라이브러리 소개
__8.2.3 트랜스포머 라이브러리의 두 가지 활용 방법
__8.2.4 Low Level API 기본 실습
__8.2.5 High Level API 기본 실습
__8.2.6 Low Level API & High Level API 혼합 방식
_8.3 Llama_cpp 라이브러리
__8.3.1 Llama_cpp 라이브러리 소개
__8.3.2 GGUF 모델 다운로드
__8.3.3 Llama_cpp 라이브러리 기본 실습
_8.4 랭체인 라이브러리
__8.4.1 랭체인 라이브러리 소개
__8.4.2 LangChain Expression Language(LCEL)
__8.4.3 랭체인 + 트랜스포머 기본 실습
__8.4.4 랭체인 + Ollama 실습
__8.4.5 Ollama를 활용한 REST API 방식
__8.4.6 메모리 기능을 활용한 대화형 에이전트
_8.5 랭그래프 라이브러리
__8.5.1 랭그래프 라이브러리 소개
__8.5.2 랭그래프 구성 요소
__8.5.3 랭그래프 기본 실습
__8.5.4 랭그래프 + 랭체인 + 트랜스포머 실습
__8.5.5 랭그래프 + 랭체인 + Ollama 실습

 

CHAPTER 9 파인튜닝과 로컬 LLM
_9.1 Full fine-tuning
__9.1.1 Full fine-tuning의 개념
__9.1.2 기본 분류 실습
__9.1.3 Full fine-tuning 실습
__9.1.4 Full fine-tuning된 모델을 불러온 후 추가 학습
__9.1.5 Full fine-tuning된 모델을 불러온 후 예측
_9.2 PEFT
__9.2.1 PEFT의 필요성
__9.2.2 PEFT의 공통 개념
__9.2.3 PEFT의 종류
_9.3 Adapter
__9.3.1 Adapter의 개념
__9.3.2 Adapter의 내부 구조
__9.3.3 Adapter의 종류
_9.4 AdapterFusion
__9.4.1 AdapterFusion의 개념
__9.4.2 AdapterFusion의 내부 구조
_9.5 LoRA
__9.5.1 LoRA의 개념
__9.5.2 LoRA의 내부 구조
__9.5.3 LoRA 실습
__9.5.4 LoRA를 활용해 학습된 모델을 불러온 후 예측
_9.6 QLoRA
__9.6.1 양자화의 개념
__9.6.2 QLoRA의 개념
__9.6.3 QLoRA 실습
__9.6.4 QLoRA를 활용해 학습된 모델을 불러온 후 예측

 

CHAPTER 10 RAG
_10.1 RAG의 개념
__10.1.1 RAG의 등장 배경
__10.1.2 RAG의 특징
_10.2 RAG 아키텍처
__10.2.1 RAG 전체 구조
__10.2.2 RAG-Sequence 모델
__10.2.3 RAG-Token 모델
__10.2.4 Retriever
__10.2.5 Generator
_10.3 벡터 DB 기초
__10.3.1 벡터 DB의 개념
__10.3.2 벡터 DB의 종류
__10.3.3 임베딩 실습
__10.3.4 ChromaDB 실습
__10.3.5 CSV to ChromaDB 실습
__10.3.6 청킹 실습
_10.4 RAG 기초 실습
__10.4.1 트랜스포머 사용을 위한 ChromaDB 구축
__10.4.2 트랜스포머를 활용한 RAG 실습
_10.5 RAG 응용 실습
__10.5.1 랭체인 사용을 위한 ChromaDB 구축
__10.5.2 트랜스포머, 랭체인을 활용한 무기억성 RAG 실습
__10.5.3 트랜스포머, 랭체인을 활용한 대화형 RAG 실습
__10.5.4 트랜스포머, 랭체인, 랭그래프를 활용한 RAG 실습
__10.5.5 Llama_cpp, 랭체인, 랭그래프를 활용한 RAG 실습
__10.5.6 Ollama, 랭체인, 랭그래프를 활용한 RAG 실습
_10.6 Iterative RAG
__10.6.1 Iterative RAG의 개념
__10.6.2 Iterative RAG 실습
_10.7 Adaptive RAG
__10.7.1 Adaptive RAG의 개념
__10.7.2 Adaptive RAG 실습

 

CHAPTER 11 멀티 에이전트
_11.1 멀티 에이전트의 개념
__11.1.1 싱글 에이전트와 멀티 에이전트
__11.1.2 A2A
_11.2 MCP
__11.2.1 MCP의 개념
__11.2.2 MCP 실습

 

CHAPTER 12 Streamlit으로 나만의 AI 에이전트 만들기
_12.1 Streamlit 기초
__12.1.1 Streamlit 소개
__12.1.2 VS Code 설치 및 파이썬 가상 환경 연동
_12.2 Streamlit을 활용한 AI 에이전트 개발
__12.2.1 누구나 쉽게 만드는 전래동화 AI 에이전트
__12.2.2 대화 내용을 기억하는 채팅 에이전트
__12.2.3 랭그래프 기반 AI 에이전트
__12.2.4 RAG 기반 AI 에이전트
 

도구를 넘어 구조를 읽는 힘 
트랜스포머 아키텍처부터 운영 가능한 AI 에이전트까지
AI 에이전트 개발 도구는 쉬워졌지만, 원하는 동작을 안정적으로 설계하고 문제를 스스로 진단하려면 도구 사용법만으로는 부족합니다. 이 책은 단순한 API 활용서가 아니라, AI 에이전트에서 LLM과 트랜스포머가 어떻게 문맥을 이해하고 답을 생성하는지부터 설명합니다. 트랜스포머 동작을 이해하기 위한 자연어 처리 기초, 핵심 수학 개념, 강화학습, RNN, LSTM, seq2seq, 어텐션을 거쳐 트랜스포머 구조로 올라가는 촘촘한 학습 흐름을 통해, 독자는 최신 도구의 추상화 뒤에 있는 원리를 자연스럽게 이해할 수 있습니다.  
실습 역시 단순한 예제 실행에서 끝나지 않습니다. 파인튜닝은 Full fine-tuning부터 LoRA, QLoRA, 양자화까지 모델 크기와 목적에 따른 선택 기준을 제시하고, RAG는 기초 파이프라인부터 대화형, Iterative, Adaptive RAG로 확장하면서 실무에서 피할 수 없는 RAG 평가의 어려움까지 짚습니다. 다음으로 싱글 에이전트의 한계를 분석한 뒤 A2A 기반 멀티 에이전트를 설계하고, 에이전트 간 통신을 표준화하는 MCP 프로토콜도 구현해봅니다. 마지막으로 앞서 배운 모든 요소를 Streamlit 웹 서비스로 통합해 배포까지 진행합니다. 이 책을 통해 단순히 예제를 재현하는 데서 끝나지 않고, 자신만의 요구사항에 맞게 에이전트를 설계하고 확장하는 기준을 세울 수 있습니다. 

대상 독자
●    AI 에이전트를 단순히 사용해보는 수준을 넘어, 내부 원리까지 이해하며 개발하고 싶은 개발자
●    AI 에이전트 내부의 LLM과 트랜스포머 아키텍처를 체계적으로 배우고 싶은 주니어 엔지니어
●    랭체인, 랭그래프, RAG를 실무 서비스 구조로 연결하는 지식이 필요한 실무 엔지니어
●    A2A, MCP, 멀티 에이전트, Streamlit 배포까지 포함해 PoC를 운영 가능한 AI 서비스로 발전시키고 싶은 개발자
 

"한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다."

 

제목이 꽤 긴 편입니다. 다만, 목차를 따라가 보면 저자의 분명한 집필 방향을 알 수 있었습니다. 자연어 처리의 기본 개념에서 시작해 어텐션, 트랜스포머, LLM, 랭체인, 랭그래프, RAG, 로컬 LLM, 멀티 에이전트까지 이어지는 흐름입니다

 

1장에서는 실습 환경 구성을 먼저 안내합니다. 비주얼 스튜디오 설치, 미니콘다 기반 가상 환경 구성, CPU와 GPU 환경에 따른 파이썬 라이브러리 설치가 포함되어 있습니다.

 

2장에서 배경 이해에 도움이 될 수 있는 자연어 처리가 무엇이고, 어떤 수학적인 근거를 바탕으로 동작하는 지를 잘 배치하고 있습니다.

 

기본 원리 설명은 이해에 도움이 되지만, 수학적인 원리와 같은 부분은 꼭 왜 이해 안되지 하시면서 붙잡지 않으셔도 됩니다. 저자의 전체적인 의도인 AI 에이전트가 이렇게 돌아간다라는 큰 흐름 안에서 한 번 훑어보는 정도로만 권장합니다.

왜냐하면 이미 아시는 분들은 이미 아실만한 개념일테고 수학적인 것을 들이파고자 이 책을 선택하신 것은 아니실테니까요, 혹시 이쪽에 좀 더 자세한 공부를 원하신다면 처음 배우는 딥러닝 수학 이나 AI를 위한 필수 수학 과 같은 책들을 먼저 보시기를 추천합니다.

 

3장에서는 강화학습을 다룹니다. 보상, 상태, 행동, 정책, 가치 함수 같은 개념을 바탕으로 모델이 선택을 개선해 가는 과정을 설명합니다. 다중 슬롯 머신 문제, 마르코프 결정 프로세스, 몬테카를로 방법, TD(0), Sarsa, Q-learning까지 이어집니다.

 

4장에서는 시퀀스 모델을 다룹니다. RNN, LSTM, 양방향 LSTM, seq2seq, 빔 서치가 포함되어 있습니다. 이 부분은 뒤에 나오는 어텐션과 트랜스포머를 이해하기 위한 전 단계로 볼 수 있습니다.

 

이 정도까지는 어깨 너머로 한 귀로 들어오던 내용이라 크게 어려움이 없었습니다.

하지만 본격적인 내용이 시작되는 5장의 어텐션과 6장의 트랜스포머 쪽을 보시게 되면 이 쪽에 익숙하지 않으신 분들은 반복해서 읽고, 다른 내용들도 찾아보고 하시면 도움이 되실 것 같습니다.

 

본문의 어텐션 스코어와 컨텍스트 관련된 도표 트랜스포머 전체 구조

 

 

개략적으로 알고 싶으시면 본문의 아래 표를 참조하시고 관심이 있는 쪽에 해당하는 부분만 좀 더 자세히 파악하시면 될 것 같습니다.

 

LLM 발전 연대기

 

 

이론은 잘 모르겠고, 난 실습부터 하고 싶다 하시는 분들은 8장부터 보시면 됩니다. Ollama 를 통해 트랜스포머를 사용해볼 수 있는 내용들을 소개하고 있고, 9장에서는 LLM을 나만의 데이터로 추가 학습을 시키는 파인튜닝을 설명하고 있고, 10장에서는 외부 지식을 데이터베이스화 해서 이를 LLM이 검색해서 활용할 수 있게 하는 RAG의 개념과 실제 테스트할 수 있는 내용들에 대해서 소개하고 있습니다.

11장과 12장은 각각 간략히 멀티에이전트, MCP, Streamlit 을 통한 에이전트 발행(?) 기능을 안내하고 있습니다.

 

개인적으로 Ollama 는 설치해서 어떻게 동작하는지 등을 살펴보았지만, 사용 환경의 한계(구형 그래픽 카드, 자원 제약 등등)로 만족할만한 테스트는 못 해봤습니다. 좀 더 넉넉한 예산이 있었으면 좋겠지만, 1백만원대 후반에서 2백만원이면 구축할 수 있었던 환경이 3백만원 이상을 줘야 시작을 할 수 있는 상황이 계속 되는지라 엄두는 못냈습니다.

 

ollama 실행 날씨를 물었더니 엉뚱한 날짜로 검색하는 ollama 아직은 상당히 불안한(HW 스펙 부족 때문인지 ㅜㅜ) ollama 동작 출력

 

 

이 책은 AI 에이전트를 다루기 위해 필요한 배경 개념을 앞에서 정리하고, 뒤쪽에서 실제 도구와 실습으로 연결하는 구성을 가지고 있습니다. 빠르게 결과물부터 만들고 싶은 분에게는 앞부분이 조금 길게 느껴질 수 있습니다. 반대로 LLM, 트랜스포머, RAG, 로컬 LLM, 랭체인, 랭그래프가 어떤 순서로 연결되는지 보고 싶은 분에게는 전체 흐름을 잡는 데 도움이 될 책이라고 생각합니다.

"한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬받아 작성된 서평입니다."

 

제목에 '랭체인 & 랭그래프'가 큼지막하게 박혀 있어서 가벼운 실습서를 기대하고 펼쳤다가, 1장부터 한 대 맞는 느낌을 받았다. 이 책은 도구 사용법을 빠르게 훑는 책이 아니다. 오히려 절반 이상을 자연어 처리와 딥러닝의 기초 이론에 쏟는다. 토큰화·임베딩에서 시작해 강화학습, RNN, LSTM, seq2seq, 어텐션을 거쳐 트랜스포머까지 차곡차곡 쌓아 올린 다음에야 비로소 랭체인과 랭그래프가 등장한다.

요즘 AI 책들은 대체로 기본 개념은 슬쩍 건너뛰고 "이렇게 쓰면 됩니다" 하는 사용법·활용법 위주로 흘러간다. 빠르게 결과물을 내기엔 좋지만, 정작 안쪽에서 무슨 일이 벌어지는지는 끝내 모르고 지나가게 된다.

그런 흐름 속에서 이 책은 꽤 보기 드문 선택을 한다. 딥러닝의 기초부터 트랜스포머 아키텍처까지, 필수 기본 개념을 하나하나 빼놓지 않고 짚고 넘어간다. 이런 책이 점점 귀해지는 시대라, 그 점만으로도 반가웠다.

 

? 책의 흐름 — 기초 체력부터 실전 배포까지

이 책은 크게 세 덩어리로 읽힌다.

① 기본 개념 (2~4장)

자연어 처리 기초(토큰화, 임베딩, word2vec, 청킹)와 강화학습(다중 슬롯머신, 마르코프 결정 프로세스, 몬테카를로, Q-learning), 그리고 시퀀스 모델(RNN, LSTM, seq2seq, 빔 서치). 트랜스포머라는 산을 오르기 위한 베이스캠프 구간이다.

② 핵심 구조 (5~7장)

어텐션(셀프/멀티 헤드/크로스 어텐션, Query·Key·Value)과 트랜스포머(포지셔널 인코딩, 인코더·디코더), 그리고 LLM의 발전사(RLHF, PPO, InstructGPT, few/one/zero-shot, GPT·LLaMA·BERT). 이 책의 심장부.

③ 실전 활용 (8~12장)

Ollama, 허깅페이스 트랜스포머, Llama.cpp, 랭체인, 랭그래프 같은 개발 도구부터 파인튜닝(Full fine-tuning, PEFT, Adapter, LoRA, QLoRA, 양자화), RAG(ChromaDB, 대화형/Iterative/Adaptive RAG), 멀티 에이전트(A2A, MCP), 그리고 Streamlit으로 실제 서비스를 배포하는 데까지.

원리부터 차근차근 가고 싶다면 1장부터, 도구 실습이 급하다면 8장부터 펼쳐도 흐름이 끊기지 않게 구성돼 있다.

 

? 좋았던 점

1. 요즘 보기 드물게, 기본 개념부터 차근차근 짚는다

이게 이 책의 가장 큰 미덕이라고 생각한다. 요즘 나오는 AI 책들은 기본 원리는 "아시죠?" 하고 넘어간 뒤 곧장 라이브러리 사용법과 활용 예제로 직행하는 경우가 많다.

빠르긴 한데, 막상 에러가 나거나 모델이 엉뚱한 답을 내놓으면 손 쓸 도리가 없다. 결국 도구를 블랙박스로 쓰고 있었던 셈이다. 반면 이 책은 스칼라·벡터·내적·편미분·그래디언트 디센트 같은 기초 수학부터, 강화학습의 가치 함수, 순환 신경망의 동작 원리, 셀프 어텐션의 계산 과정까지 필수 개념을 하나하나 펼쳐서 설명한다.

빠른 결과보다 단단한 토대를 택한 구성이고, 이런 책이 점점 줄어드는 요즘이라 더 값지게 느껴졌다.

 

2. "트랜스포머가 왜 혁신이었나"를 흐름으로 이해시킨다

대부분의 LLM 책이 트랜스포머부터 시작하는 것과 달리, 이 책은 RNN의 한계 → LSTM의 보완 → seq2seq의 고정 길이 병목 → 어텐션의 등장 → 트랜스포머라는 진화의 맥락을 그대로 따라가게 만든다. 각각이 따로 노는 기술처럼 외우는 게 아니라, "이 기술이 어떤 문제를 풀려고 나왔는지"를 알게 되니 그 기술이 어디서 한계를 드러내는지도 자연스럽게 보인다. Query·Key·Value를 입력 벡터 기준과 입력 행렬 기준, 두 시각으로 풀어주는 부분도 인상적이었다.

 

3. 그림과 도식이 많다

토큰화, 임베딩, 트랜스포머 내부 처리처럼 말로만 하면 추상적인 개념을 도식으로 풀어주려는 시도가 곳곳에 보인다. 모델 내부 구조는 글자만으로는 멀게 느껴지는데, 그림이 함께 있으니 흐름을 붙잡기가 한결 수월하다.

 

4. 이론과 실습이 따로 놀지 않는다

3장의 Q-learning을 곧바로 "다음 단어 예측" 강화학습 실습으로 이어붙이거나, 허깅페이스 토크나이저의 input_ids·attention_mask를 직접 찍어보게 하는 식이다. 개념 → 코드의 연결고리가 촘촘하다.

 

5. 폭이 넓다 — 한 권짜리 지도

랭체인·랭그래프·RAG·LoRA·QLoRA·양자화·A2A·MCP·Streamlit까지, 요즘 여기저기서 들리는 키워드들이 트랜스포머라는 기반 위에서 어떻게 연결되는지 한 권으로 조망할 수 있다.

흩어진 지식의 뼈대를 잡고 싶은 사람에게는 백과사전 같은 든든함이 있다.

 

? 아쉬웠던 점

수식이 정말, 정말 만만치 않다.

편미분, 그래디언트, 소프트맥스, 손실 함수, 강화학습 가치 함수, RNN의 그래디언트 계산… 그림으로 최대한 풀고자 하는 흔적은 분명하지만, 그렇다고 수식 자체가 쉬워지는 건 아니었다. 딥러닝과 기초 수학에 대한 감이 없는 상태라면 중간중간 "그렇구나" 하고 넘어가게 되는 구간이 있을 것 같기도 했다.

그래서 이 책은 "AI가 궁금한 완전 초보자"보다는, "도구 뒤의 원리까지 이해하고 싶은 개발자"에게 더 잘 맞는다. 제목만 보고 실무 활용법을 빠르게 얻으려던 독자라면 초중반의 방대한 이론 분량이 다소 지루하게 느껴질 수 있다.

 

? 이런 분께 추천

✅ 랭체인·랭그래프를 단순히 쓰는 수준을 넘어 구조적으로 이해하고 싶은 분

✅ RAG, 파인튜닝, 로컬 LLM, MCP 같은 최신 키워드를 한 권에서 넓게 훑고 싶은 분

✅ 트랜스포머가 LLM과 AI 에이전트까지 어떤 흐름으로 이어지는지 알고 싶은 분

✅ AI 기능을 서비스에 붙이는 걸 넘어, 내부 원리와 한계까지 이해하고 싶은 개발자

 

? 반대로 AI, 딥러닝을 처음 접하는 분이라면 다소 버거울 수 있다.

이 경우 처음부터 완벽히 이해하려 하기보다, 관심 있는 챕터를 먼저 훑고 모르는 부분은 나중에 돌아오는 식으로 접근하는 걸 권한다.

 

? 마무리

요즘 AI 개발은 도구가 너무 빠르게 바뀐다. 유행하던 라이브러리가 금방 다른 것으로 대체되고, 새로운 프로토콜과 프레임워크가 끊임없이 등장한다. 이런 환경에서 사용법만 익히면 그 지식은 금세 낡는다.

이 책의 진짜 가치는 거기에 있다. 트랜스포머, 어텐션, RAG, 에이전트의 구조를 이해해두면, 새 도구가 나와도 "그래서 안쪽에서 뭐가 달라진 거지?"를 스스로 판단할 수 있다. 이 책은 그 판단 기준을 세워주는 책이다.

솔직히 쉬운 책은 아니다. 읽는 데 시간이 걸리고, 수식과 이론을 마주할 각오도 필요하다. 하지만 LLM을 블랙박스처럼 가져다 쓰는 데서 한 걸음 더 나아가고 싶다면, 충분히 도전해볼 만하다. 지금 당장 모든 걸 이해하지 못하더라도, AI 에이전트라는 분야가 얼마나 넓고 깊은 기반 위에 서 있는지 확인하는 것만으로도 의미가 있었다.

※ 한빛 서평단 활동의 일환으로 책을 제공 받았으며, 그것과 별개로 최대한 객관적으로 쓰려고 노력하였습니다.

 

요즘 AI 관련 책을 보면 랭체인, 랭그래프, RAG, MCP 같은 키워드가 정말 자주 보입니다.

솔직히 이런 단어들을 보면 일단 흥미가 생깁니다. AI 에이전트를 직접 만들어볼 수 있다거나, 문서 기반으로 답변하는 RAG를 구현할 수 있다거나, 여러 도구를 연결해 자동화할 수 있다는 이야기는 확실히 매력적입니다.

그래서 이번에 『트랜스포머 아키텍처로 배우는 AI 에이전트 with 랭체인 & 랭그래프』를 살펴보게 되었습니다. 다만 먼저 말해두자면, 이 책은 제가 생각했던 것보다 훨씬 깊이가 있는 책이었습니다. 책을 받은 뒤 충분히 오랜 시간 동안 모든 내용을 따라가 보지는 못했고, 이번 글은 책의 목차와 일부 본문을 살펴보며 느낀 첫인상에 가까운 리뷰입니다.

그럼에도 한 가지는 분명하게 느꼈습니다. 이 책은 단순히 “랭체인으로 챗봇 만들기” 같은 가벼운 실습서가 아닙니다. 오히려 AI 에이전트가 어떤 원리 위에서 움직이는지, 그 기반이 되는 트랜스포머 아키텍처를 어떻게 이해해야 하는지를 꽤 본격적으로 다루는 책에 가깝습니다.


책 제목에는 랭체인과 랭그래프가 들어가지만, 책의 출발점은 훨씬 앞에 있습니다. 자연어 처리의 기본 개념부터 시작해서 토큰화, 임베딩, 기초 수학, 강화학습, RNN, LSTM, seq2seq, 어텐션, 트랜스포머로 이어집니다. 이후에야 Ollama, 허깅페이스 트랜스포머, Llama_cpp, 랭체인, 랭그래프, 파인튜닝, RAG, 멀티 에이전트, MCP, Streamlit 서비스 구현으로 넘어갑니다.

그러니까 이 책은 최신 AI 도구를 바로 사용하는 방법만 알려주는 책이라기보다는, 그 도구들이 어떤 배경에서 나왔고 내부적으로 어떤 구조를 가지고 있는지 설명하려는 책입니다.

이 방향성 자체는 좋았습니다.

요즘은 AI 도구가 워낙 쉽게 느껴집니다. 프롬프트를 입력하면 답이 나오고, API를 호출하면 결과가 돌아오고, 랭체인이나 랭그래프 같은 도구를 쓰면 뭔가 그럴듯한 에이전트를 만들 수 있을 것처럼 보입니다.

하지만 막상 문제가 생기면 이야기가 달라집니다. 왜 답변이 이상한지, 왜 문맥을 제대로 못 잡는지, RAG 검색이 왜 엉뚱하게 되는지, 에이전트 흐름이 왜 꼬이는지 이해하려면 결국 내부 구조를 어느 정도 알아야 합니다.

이 책은 바로 그 지점을 건드립니다.


초반부에서 인상적이었던 부분은 트랜스포머를 설명하기 위해 자연어 처리의 흐름을 차근차근 쌓아간다는 점이었습니다. 단어를 토큰으로 나누고, 그 토큰을 임베딩 벡터로 바꾸고, 문맥을 처리하는 방식이 어떻게 변화해왔는지를 설명합니다.

트랜스포머가 갑자기 하늘에서 떨어진 기술이 아니라, 기존 순차 모델의 한계 속에서 등장했다는 흐름을 잡아주는 방식입니다.

특히 본문을 보면 그림과 도식을 꽤 많이 사용합니다. 토큰화, 임베딩, 트랜스포머 처리 과정처럼 말로만 설명하면 추상적으로 느껴지는 내용을 그림으로 풀어주려는 시도가 보입니다.

이런 부분은 좋았습니다. AI 모델의 내부 구조는 말만으로 설명하면 너무 멀게 느껴지는데, 그림이 함께 있으니 그래도 흐름을 따라가기가 조금 수월했습니다.

다만 수식이 등장하기 시작하면 난이도가 확 올라갑니다. 편미분, 그래디언트, 소프트맥스, 손실 함수, 강화학습의 가치 함수, RNN의 그래디언트 계산 같은 내용이 나오는데, 솔직히 제 실력으로는 전부 이해하면서 읽기는 쉽지 않았습니다.

그림이 있다고 해서 수식 자체가 쉬워지는 것은 아니더라고요. 읽으면서 “아, 나는 아직 입문서를 더 보고 와야 하는구나”라는 생각이 들었습니다.


그래서 이 책은 확실히 입문서라고만 보기는 어렵습니다. 물론 책 안에서 기초 개념을 설명해주기는 합니다. 자연어 처리의 시작부터 강화학습, 시퀀스 모델, 어텐션, 트랜스포머까지 흐름을 잡아주려는 구성도 있습니다.

하지만 다루는 내용의 깊이와 폭을 생각하면, 완전 초보자가 아무런 배경지식 없이 편하게 읽을 책은 아닙니다. 파이썬 실습만 어느 정도 따라 할 수 있다고 해서 끝나는 책도 아니고, 딥러닝과 수학 개념에 대한 기본적인 감각이 있으면 훨씬 더 잘 읽힐 책입니다.

저처럼 AI 에이전트나 랭체인, 랭그래프에 대한 관심으로 접근한 독자라면 초반 이론 파트에서 조금 당황할 수 있습니다.

“나는 에이전트를 만들어보고 싶었는데, 갑자기 편미분과 강화학습이 나오네?” 싶은 순간이 있습니다.

그런데 책의 의도는 이해됩니다. AI 에이전트를 제대로 이해하려면 결국 LLM이 어떻게 동작하는지, 트랜스포머가 어떤 구조인지, 모델 학습과 추론이 어떤 원리로 이루어지는지 알아야 한다는 것이겠죠. 그러니까 이 책은 빠르게 결과물을 만들고 싶은 사람보다, 도구 뒤의 원리를 알고 싶은 사람에게 더 잘 맞습니다.


중반 이후로 가면 책의 주제가 점점 요즘 AI 개발 흐름과 가까워집니다. Ollama, 허깅페이스 트랜스포머, Llama_cpp 같은 도구를 다루고, 랭체인과 랭그래프 실습으로 이어집니다. 이후에는 파인튜닝, PEFT, LoRA, QLoRA, 양자화, RAG, ChromaDB, Iterative RAG, Adaptive RAG, 멀티 에이전트, A2A, MCP까지 다룹니다.

목차만 봐도 상당히 넓습니다. 개인적으로는 이 점이 이 책의 가장 큰 장점이자 동시에 부담으로 느껴졌습니다.

장점은 AI 에이전트 개발과 관련된 주요 키워드를 한 권 안에서 큰 흐름으로 볼 수 있다는 점입니다. 요즘 여기저기서 들리는 개념들이 따로 흩어져 있는 것이 아니라, 자연어 처리와 트랜스포머라는 기반 위에서 어떻게 이어지는지 확인할 수 있습니다.

반대로 부담은, 이 모든 내용을 한 번에 소화하기 어렵다는 점입니다. 특히 파인튜닝이나 RAG 응용, 멀티 에이전트, MCP 같은 부분은 각각 따로 공부해도 적지 않은 주제입니다.

이 책은 그것들을 한 권 안에 담고 있기 때문에, 독자 입장에서는 깊이 이해하기보다 “일단 이런 구조와 흐름이 있구나”를 잡는 쪽으로 접근하는 것이 더 현실적일 것 같습니다.


이 책을 보면서 가장 크게 느낀 건, AI 관련 기술서에도 단계가 있다는 점이었습니다.

처음에는 AI 도구를 써보는 책이 필요합니다. ChatGPT를 어떻게 활용할지, API를 어떻게 호출할지, 간단한 챗봇이나 RAG 예제를 어떻게 만들지 알려주는 책이 입문자에게는 더 맞습니다.

그 다음 단계에서 필요한 것이 이런 책이 아닐까 싶습니다. 단순히 코드를 복사해서 실행하는 수준에서 벗어나, 왜 이 구조가 필요한지, 모델이 어떤 방식으로 문맥을 처리하는지, 랭체인과 랭그래프 같은 도구가 어떤 문제를 해결하려고 등장했는지를 알고 싶을 때 이 책의 가치가 살아납니다.

초반은 어떻게든 따라잡기는 했는데, 중반부터는... ㅠ

저는 조금 섣부르게 중급 서적에 도전한 느낌이 있었습니다. 아직은 AI 입문서나 파이썬 기반 딥러닝 기초를 조금 더 보고 오는 편이 맞겠다는 생각도 들었습니다.

하지만 그렇다고 책이 별로였다는 뜻은 아닙니다. 오히려 제 현재 위치를 확인하게 해준 책에 가깝습니다.

“아, 내가 지금 관심 있는 AI 에이전트라는 분야가 생각보다 훨씬 깊은 기반 위에 서 있구나.”

“랭체인이나 랭그래프를 쓰기 전에, 트랜스포머와 RAG의 구조를 어느 정도는 이해해야겠구나.”

이런 생각을 하게 만들었습니다.


이 책의 장점은 원리 중심의 구성입니다. 요즘 AI 개발은 도구가 너무 빠르게 바뀝니다.

어떤 라이브러리가 유행하다가 금방 다른 도구가 나오고, 새로운 프로토콜이나 프레임워크도 계속 등장합니다. 이런 상황에서는 단순한 사용법만 익히면 금방 낡을 수 있습니다.

반면 트랜스포머, 어텐션, RAG, 에이전트 구조 같은 원리를 이해하면 새로운 도구가 나와도 어느 정도 스스로 판단할 수 있습니다. 이 책은 그런 기준을 만들고 싶은 독자에게 도움이 될 책입니다.

다만 아쉬운 점은 역시 난이도입니다. 수식이 많고, 다루는 개념도 많습니다. 설명과 그림을 통해 최대한 풀어주려는 시도는 보이지만, 중급 수준의 배경지식이 없다면 중간중간 따라잡기 힘든 구간이 있습니다.

그래서 이 책은 “AI가 궁금한 완전 초보자”보다는 “AI 에이전트 개발을 더 깊게 이해하고 싶은 개발자”에게 더 적합합니다.


추천 대상을 정리하면 이렇습니다.

랭체인과 랭그래프를 단순히 사용하는 수준을 넘어 구조적으로 이해하고 싶은 분.

RAG, 파인튜닝, 로컬 LLM, MCP 같은 최신 AI 개발 키워드를 한 권 안에서 넓게 훑어보고 싶은 분.

트랜스포머 아키텍처가 실제로 어떤 흐름으로 LLM과 AI 에이전트까지 이어지는지 알고 싶은 분.

AI 기능을 서비스에 붙이는 것을 넘어, 내부 원리와 한계를 이해하고 싶은 개발자.

반대로 AI나 딥러닝을 처음 접하는 분에게는 조금 어렵게 느껴질 수 있습니다. 저처럼 아직 입문 단계(초급은 지났다고 생각했었지만...)에 있다면, 이 책을 처음부터 끝까지 완벽히 이해하려고 하기보다는 관심 있는 챕터를 먼저 훑고, 모르는 부분은 나중에 다시 돌아오는 방식이 더 좋을 것 같습니다.


마무리하자면, 『트랜스포머 아키텍처로 배우는 AI 에이전트 with 랭체인 & 랭그래프』는 가벼운 실습서가 아닙니다. AI 에이전트를 만드는 방법을 다루기는 하지만, 그 전에 “AI 에이전트가 서 있는 기반”을 설명하려는 책입니다. 그래서 읽는 데 시간이 필요하고, 수식과 이론을 마주할 준비도 필요합니다.

저에게는 솔직히 쉽지 않은 책이었습니다. 아직은 입문서를 조금 더 보고 와야겠다는 생각이 들 정도로 중급 이상의 밀도가 있었습니다.

그럼에도 이 책이 보여주는 방향은 분명합니다. AI를 블랙박스처럼 가져다 쓰는 데서 한 걸음 더 나아가, 그 구조를 이해하고 자기만의 에이전트를 설계하고 싶은 사람이라면 충분히 도전해볼 만한 책입니다.

지금 당장 모든 내용을 이해하지 못하더라도, AI 에이전트라는 분야가 얼마나 넓고 깊은지 확인하는 데에는 꽤 의미 있는 책이었습니다.

 

한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다.

 

 

프론트엔드 개발자로 일한 지 4년 가까이 됐다. AI 공부를 아예 안 한 건 아니다. 학교에서 RAG도 배웠고 랭체인 실습도 해봤고, 파이썬으로 간단한 챗봇 비슷한 것도 만들어봤다. 근데 솔직히 그게 진짜 이해였냐고 하면 자신 없다. chain.invoke() 한 줄 치면 결과가 나왔고, 왜 되는지는 몰랐고, 에러 나면 스택 트레이스 분석하는 게 아니라 구글링부터 했다. 내가 쓰는 도구가 어떻게 동작하는지 전혀 모른 채로, 그냥 블랙박스를 쓰고 있었던 거다.

 

 

이 책 제목을 처음 봤을 때 솔직히 겁먹었다. '트랜스포머 아키텍처'라는 단어가 박혀 있으니까. React 컴포넌트 트리 다루는 게 주업인 사람한테 딥러닝 모델 아키텍처라니. 근데 읽다 보니 내가 그동안 얼마나 표면만 긁고 있었는지를 실감하게 됐다. 무섭다기보다는, 몰랐던 게 이렇게 많았구나 하는 느낌이 더 컸다.

 

제일 인상 깊었던 건 트랜스포머 챕터 자체가 아니라, 거기에 도달하기까지의 흐름이었다. RNN이 왜 한계가 있었는지, 그래서 LSTM이 나왔고, seq2seq가 나왔고, 어텐션이 나왔고, 결국 트랜스포머로 이어졌다는 맥락. 학교에서 배울 때는 각각이 따로 존재하는 기술처럼 느껴졌는데, 이 책을 읽고 나서야 하나의 흐름으로 연결됐다. 기술이 왜 등장했는지를 알면, 그 기술이 어디서 한계를 드러내는지도 자연스럽게 보인다. 그게 단순히 구조를 외우는 것과 다른 점이다.셀프 어텐션 개념도 그랬다. Query, Key, Value라는 단어를 수업에서 들었을 때는 그냥 세 가지 벡터가 있다는 정도로만 알았다. 이 책은 그게 실제로 어떤 계산을 수행하는 건지, 입력 벡터 기준과 입력 행렬 기준으로 두 시각에서 풀어준다. 완전히 다 이해됐다고 하면 거짓말이고, 중간에 멈추고 다시 읽은 부분도 있다. 그래도 '이 구조가 왜 필요한가'의 감은 처음으로 잡혔다. 그 감이 생기기 전이랑 후가 꽤 다르다. 랭체인 코드를 볼 때 예전보다 덜 막막하고, 에러 메시지가 조금 더 읽힌다.

 

처음엔 강화학습 내용이 왜 이 책에 있는지 의아했다. AI 에이전트 책인데 슬롯머신 문제에 마르코프 결정 프로세스까지 나오니까. 솔직히 그 파트 읽을 때는 좀 지루했다. 근데 나중에 ChatGPT 같은 모델이 사용자 피드백으로 학습하는 방식, RLHF와 PPO 알고리즘이 어떻게 적용되는지를 설명하는 부분에 도달했을 때 이해됐다. 앞에서 개념을 쌓아놓지 않으면 그냥 그런가 보다로 넘어갈 수밖에 없는 내용이었다. 내가 매일 쓰는 AI 도구들이 어떻게 더 나은 답변을 내놓도록 훈련됐는지를 처음으로 이해한 순간이기도 했다. 책 구성이 꽤 치밀하다는 걸 뒤늦게 알았다.

 

 

랭그래프는 이 책에서 처음 제대로 봤다. 학교에서 랭체인은 다뤘는데 랭그래프까지는 못 갔었다. 랭그래프가 단순 체인 방식을 넘어서 상태를 가진 그래프 기반의 에이전트를 만들 수 있다는 개념, 즉 조건에 따라 다른 노드로 분기하거나 루프를 돌 수 있다는 구조가 프론트엔드 개발자 입장에서는 오히려 친숙하게 느껴졌다. 리덕스의 상태 흐름이나 유한 상태 머신이랑 비슷한 개념이라고 생각하니까 훨씬 빨리 들어왔다. 이쪽 배경지식이 생각보다 도움이 됐다.

 

RAG 부분도 새로웠다. 학교에서 배운 건 '임베딩해서 벡터DB에 저장하고 유사도 검색으로 컨텍스트 넣기'였는데, 이 책은 거기서 더 나아간다. 쿼리가 단순할 때와 복잡할 때 검색 전략 자체를 다르게 가져가는 Adaptive RAG까지 실습 코드와 함께 다룬다. 단순 RAG와 비교하면서 보니까 어디서 한계가 생기는지가 눈에 보였다. 학교에서 'RAG 좋은 거야'로만 배우고 끝났던 게 조금 아쉬워졌다. 이 책을 먼저 읽었으면 수업이 훨씬 재밌었을 것 같다.

 

 

어려웠던 부분도 솔직히 얘기하자면, 파인튜닝 챕터는 한 번에 소화가 안 됐다. LoRA가 왜 저랭크 분해로 파라미터를 줄이면서도 성능을 유지할 수 있는지, QLoRA의 양자화가 정확히 어떤 트레이드오프를 만드는지, 수학적 배경이 약한 상태에서는 읽으면서 그렇구나하고 넘어가는 부분이 꽤 있었다. 억지로 다 이해하려다가 오히려 흐름을 잃을 것 같아서, 이 파트는 맥락만 잡고 나중에 실제로 필요할 때 다시 깊이 파고드는 레퍼런스로 쓰기로 했다. 책이 어렵다기보다 AI가 원래 이 정도 깊이를 가지고 있다는 걸 실감한 거라고 받아들였다.

 

MCP 파트는 반대로 읽으면서 눈이 반짝였다. AI 에이전트가 외부 시스템과 표준화된 방식으로 연결되는 프로토콜이라는 개념인데, 프론트엔드 개발자한테는 REST API나 WebSocket 같은 통신 표준이 익숙하다 보니 'AI 에이전트 세계의 인터페이스 표준'이라고 이해하니까 바로 와닿았다. 요즘 실무에서도 MCP 얘기가 슬슬 나오기 시작하는데, 이 책에서 개념부터 실습까지 다뤄줘서 타이밍이 좋았다.

 

마지막 Streamlit 챕터는 솔직히 제일 재밌었다. 이론이 아니라 실제로 돌아가는 서비스를 만드는 파트니까. 대화 기억이 되는 챗봇, 랭그래프 기반 에이전트, RAG까지 붙인 AI 서비스를 순서대로 구현하는데, 파이썬 파일 하나로 UI랑 로직을 다 처리하는 Streamlit 방식이 처음엔 이상하게 느껴졌다가 나중엔 프로토타입 만들 때 이게 얼마나 강력한지 이해됐다.

 

요즘 실무에서 AI 기능을 붙여야 하는 상황이 점점 많아지고 있다. 예전엔 그냥 API 문서 보고 가져다 쓰는 식이었는데, 이 책을 읽고 나서는 조금 달라진 느낌이다. 완전히 이해했다는 게 아니라, 적어도 이 코드가 어떤 원리 위에 서 있는지를 어렴풋이 알고 쓰게 됐다는 거다. 그게 에러 대응할 때 차이를 만들고, 구조를 설계할 때 차이를 만든다.

 

AI 도구를 매일 쓰면서도 속이 어떻게 돌아가는지 한 번도 들여다본 적 없는 개발자라면, 이 책이 꽤 좋은 시작점이 될 것 같다. 다 이해 못해도 괜찮다. 나도 그랬으니까.

 



    "한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 

제목만 보면 랭체인·랭그래프 실습서처럼 보이지만, 실제로는 절반 이상이 자연어 처리와 딥러닝의 기초 이론에 할애되어 있습니다. 저자도 서문에서 "모델을 단순히 사용하는 방법보다 모델이 어떤 구조로 구성되었는지를 자세히 살펴본다"고 분명히 밝히고 있습니다. 즉 LLM을 블랙박스로 쓰는 데서 그치지 않고, 새로운 도구가 등장해도 그 내부에서 무엇이 달라졌는지 스스로 판단할 수 있는 기준을 만들어 주는 것이 이 책의 목표입니다.

전체 구성은 크게 세 덩어리로 나뉜니다다.

1부 — 기초 체력 (2~4장) 자연어 처리 기초(토큰화, 임베딩, word2vec, 청킹, 풀링)와 강화학습 기초(몬테카를로, 시간차 학습, Q-learning), 그리고 시퀀스 모델(RNN, LSTM, seq2seq, 빔 서치).

2부 — 핵심 구조 (5~7장) 어텐션(셀프/멀티 헤드/크로스 어텐션, Query·Key·Value), 트랜스포머(포지셔널 인코딩, 인코더·디코더, Add & Norm, Feed Forward), 그리고 LLM의 발전(PPO, InstructGPT, few/one/zero-shot, GPT·LLaMA·BERT).

3부 — 실전 활용 (8~12장) Ollama·허깅페이스 트랜스포머·Llama.cpp·랭체인·랭그래프 같은 개발 도구, 파인튜닝(Full fine-tuning, PEFT, Adapter, LoRA, QLoRA), RAG(벡터 DB, ChromaDB, Iterative/Adaptive RAG), 멀티 에이전트(A2A, MCP), 마지막으로 Streamlit으로 나만의 에이전트를 만드는 데까지 이어집니다.

원리부터 차근차근 쌓고 싶으면 1장부터, 랭체인·랭그래프 실습 위주로 빠르게 가고 싶으면 8장부터 읽어나가면 될 것 같습니다.

 

책의 난이도가 만만치 않다...

 

좋았던 점

1. "트랜스포머가 혁신이었는지"를 몸으로 느끼게 한다

대부분의 LLM 책이 트랜스포머부터 시작하는 것과 달리, 이 책은 RNN의 한계 → LSTM의 보완 → seq2seq의 고정 길이 컨텍스트 벡터 문제 → 어텐션의 등장이라는 흐름 전체를 따라가게 합니다. "앞에서부터 순서대로 읽는 대신 모든 페이지를 펼쳐놓고 보는 것"이라는 트랜스포머 비유(그림 2-1)나, seq2seq의 고정 길이 병목을 직접 보여준 뒤 어텐션으로 넘어가는 구성이 인상적이었습니다.

2. 이론과 실습

3장의 Q-learning을 곧바로 "다음에 올 단어를 예측"하는 자연어 처리 강화학습 실습으로 연결하거나, 8장에서 허깅페이스 토크나이저의 input_ids·attention_mask 출력을 실제로 찍어보게 합니다.

 

 

 

아쉬웠던 점

수학 공식이 정말, 정말 복잡했다

솔직히 이 부분이 책을 읽으며 가장 힘들던 부분입니다. 4장 물론 그림으로 최대한 풀어주려고 노력한 흔적은 분명하나... 하지만 그렇다고 수식 자체가 쉬워지는 건 아니었던 것 같습니다.

한 줄 요약

순환 신경망(RNN)부터 트랜스포머, LLM, 그리고 RAG·멀티 에이전트까지를 "사용법"이 아니라 "구조" 로 기술한 책. 도구 사용서가 아니라 원서에 가깝다. 수학을 잘 알아야 할듯.

순환 신경망(RNN)부터 최신 트랜스포머 아키텍처까지 인공지능 모델의 거대한 진화 과정을 한 권에 모두 담아냈다는 점이 장점입니다.
자신이 부족하거나 공부하고 싶은 파트만 발췌해서 볼 수 있는 백과사전 같은 든든함이 있습니다.
AI 기술의 파편화된 지식들을 하나로 모아 전체적인 개념과 뼈대를 탄탄하게 잡고 싶은 독자들에게는 훌륭한 교재가 될 것입니다.

하지만 이것이 독이 될 수도 있습니다.
책의 제목만 보고 'AI 에이전트의 실무적인 활용 방안'을 빠르게 습득하길 원했던 독자라면, 초중반부의 방대한 분량이 다소 지루하게 느껴질 수 있습니다.
기초를 탄탄히 하는 것도 물론 좋지만, 실무에서 당장 에이전트를 구축해야 하는 개발자 입장에서는 책의 메인 주제(AI 에이전트)와는 조금 동떨어져 보이는 과거의 기술들에 너무 많은 페이지를 할애한 것은 아닌가 하는 의문이 들기도 했습니다.

한빛미디어 서평단 <나는 리뷰어다> 활동을 위해 도서를 제공받아 작성한 리뷰입니다.
 

최근 몇 년 사이 ChatGPT를 비롯한 생성형 AI가 빠르게 확산되면서 LLM(Large Language Model)에 대한 관심도 크게 높아졌습니다. 하지만 실제로 LLM이 어떤 구조로 동작하는지, RAG나 AI 에이전트는 어떻게 만드는지 체계적으로 설명하는 책은 생각보다 많지 않습니다.


이번에 읽은 이 책은 LLM의 근간이 되는 트랜스포머 아키텍처부터 RAG, LangChain, LangGraph, 파인튜닝, 양자화, MCP, A2A까지 최근 AI 서비스 개발에 필요한 핵심 기술을 폭넓게 다루고 있습니다. 특히 단순히 개념만 설명하는 것이 아니라 직접 따라 해볼 수 있는 실습 예제를 함께 제공한다는 점이 인상적이었습니다.


무엇보다 LoRA, QLoRA와 같은 파인튜닝 기법과 양자화, 멀티 에이전트 구조까지 포함하고 있어 기존 입문서보다 한 단계 더 실무적인 내용을 담고 있다는 점이 이 책의 가장 큰 특징이라고 생각합니다.


책은 먼저 개발 환경 구축부터 시작합니다. 1장에서는 Visual Studio Code와 Miniconda를 이용해 Python 가상환경을 구성하고, Transformers, LangChain, LangGraph 등 이후 실습에 필요한 라이브러리를 설치합니다.

Miniconda는 AI 개발자들이 가장 많이 사용하는 Python 가상환경 관리 도구 중 하나입니다. 실습 과정에서는 Python 3.11 환경을 구성한 뒤 다양한 AI 패키지를 설치하는데, 이를 통해 서로 다른 라이브러리 버전 충돌 없이 실습을 진행할 수 있습니다. 이후 등장하는 양자화 실습이나 RAG 구축 과정도 모두 이 환경을 기반으로 진행됩니다.


이 책의 가장 큰 장점은 LLM의 원리를 설명하는 데서 멈추지 않고 실제 서비스 개발에 필요한 LangChain, LangGraph, RAG, 벡터 DB, 파인튜닝, MCP, 멀티 에이전트까지 하나의 흐름으로 연결해 설명한다는 점입니다.

최근 AI 관련 서적은 많지만 트랜스포머부터 최신 AI 에이전트 아키텍처까지 폭넓게 다루면서 실습 예제를 제공하는 책은 많지 않습니다. 특히 LangGraph와 MCP, A2A 같은 최신 주제를 포함하고 있다는 점은 현업 개발자들에게도 큰 도움이 될 것으로 보입니다.


개인적으로는 9장의 파인튜닝과 QLoRA 실습, 그리고 10장의 RAG 및 벡터 DB 설명이 가장 인상적이었습니다. 단순히 "어떻게 사용한다" 수준을 넘어 왜 이러한 기술이 등장했는지 배경까지 함께 설명하고 있어 개념을 이해하기 수월했습니다.

LLM을 처음 공부하는 개발자, AI 서비스를 직접 만들어보고 싶은 엔지니어, 그리고 LangChain과 AI 에이전트 개발을 체계적으로 배우고 싶은 분들에게 추천할 만한 책입니다. 실습 환경을 직접 구축하고 코드를 실행해 본다면 책의 내용을 훨씬 빠르게 체득할 수 있을 것입니다.
 

리뷰쓰기

닫기
* 상품명 :
트랜스포머 아키텍처로 배우는 AI 에이전트 with 랭체인 & 랭그래프
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
트랜스포머 아키텍처로 배우는 AI 에이전트 with 랭체인 & 랭그래프
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
트랜스포머 아키텍처로 배우는 AI 에이전트 with 랭체인 & 랭그래프
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 적립금 500P를 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?