트랜스포머 아키텍처로 배우는 AI 에이전트 with 랭체인 & 랭그래프

simry***l2026-07-01

"한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다."

제목이 꽤 긴 편입니다. 다만, 목차를 따라가 보면 저자의 분명한 집필 방향을 알 수 있었습니다. 자연어 처리의 기본 개념에서 시작해 어텐션, 트랜스포머, LLM, 랭체인, 랭그래프, RAG, 로컬 LLM, 멀티 에이전트까지 이어지는 흐름입니다

1장에서는 실습 환경 구성을 먼저 안내합니다. 비주얼 스튜디오 설치, 미니콘다 기반 가상 환경 구성, CPU와 GPU 환경에 따른 파이썬 라이브러리 설치가 포함되어 있습니다.

2장에서 배경 이해에 도움이 될 수 있는 자연어 처리가 무엇이고, 어떤 수학적인 근거를 바탕으로 동작하는 지를 잘 배치하고 있습니다.

기본 원리 설명은 이해에 도움이 되지만, 수학적인 원리와 같은 부분은 꼭 왜 이해 안되지 하시면서 붙잡지 않으셔도 됩니다. 저자의 전체적인 의도인 AI 에이전트가 이렇게 돌아간다라는 큰 흐름 안에서 한 번 훑어보는 정도로만 권장합니다.

왜냐하면 이미 아시는 분들은 이미 아실만한 개념일테고 수학적인 것을 들이파고자 이 책을 선택하신 것은 아니실테니까요, 혹시 이쪽에 좀 더 자세한 공부를 원하신다면 처음 배우는 딥러닝 수학 이나 AI를 위한 필수 수학 과 같은 책들을 먼저 보시기를 추천합니다.

3장에서는 강화학습을 다룹니다. 보상, 상태, 행동, 정책, 가치 함수 같은 개념을 바탕으로 모델이 선택을 개선해 가는 과정을 설명합니다. 다중 슬롯 머신 문제, 마르코프 결정 프로세스, 몬테카를로 방법, TD(0), Sarsa, Q-learning까지 이어집니다.

4장에서는 시퀀스 모델을 다룹니다. RNN, LSTM, 양방향 LSTM, seq2seq, 빔 서치가 포함되어 있습니다. 이 부분은 뒤에 나오는 어텐션과 트랜스포머를 이해하기 위한 전 단계로 볼 수 있습니다.

이 정도까지는 어깨 너머로 한 귀로 들어오던 내용이라 크게 어려움이 없었습니다.

하지만 본격적인 내용이 시작되는 5장의 어텐션과 6장의 트랜스포머 쪽을 보시게 되면 이 쪽에 익숙하지 않으신 분들은 반복해서 읽고, 다른 내용들도 찾아보고 하시면 도움이 되실 것 같습니다.

본문의 어텐션 스코어와 컨텍스트 관련된 도표 트랜스포머 전체 구조

개략적으로 알고 싶으시면 본문의 아래 표를 참조하시고 관심이 있는 쪽에 해당하는 부분만 좀 더 자세히 파악하시면 될 것 같습니다.

LLM 발전 연대기

이론은 잘 모르겠고, 난 실습부터 하고 싶다 하시는 분들은 8장부터 보시면 됩니다. Ollama 를 통해 트랜스포머를 사용해볼 수 있는 내용들을 소개하고 있고, 9장에서는 LLM을 나만의 데이터로 추가 학습을 시키는 파인튜닝을 설명하고 있고, 10장에서는 외부 지식을 데이터베이스화 해서 이를 LLM이 검색해서 활용할 수 있게 하는 RAG의 개념과 실제 테스트할 수 있는 내용들에 대해서 소개하고 있습니다.

11장과 12장은 각각 간략히 멀티에이전트, MCP, Streamlit 을 통한 에이전트 발행(?) 기능을 안내하고 있습니다.

개인적으로 Ollama 는 설치해서 어떻게 동작하는지 등을 살펴보았지만, 사용 환경의 한계(구형 그래픽 카드, 자원 제약 등등)로 만족할만한 테스트는 못 해봤습니다. 좀 더 넉넉한 예산이 있었으면 좋겠지만, 1백만원대 후반에서 2백만원이면 구축할 수 있었던 환경이 3백만원 이상을 줘야 시작을 할 수 있는 상황이 계속 되는지라 엄두는 못냈습니다.

ollama 실행 날씨를 물었더니 엉뚱한 날짜로 검색하는 ollama 아직은 상당히 불안한(HW 스펙 부족 때문인지 ㅜㅜ) ollama 동작 출력

이 책은 AI 에이전트를 다루기 위해 필요한 배경 개념을 앞에서 정리하고, 뒤쪽에서 실제 도구와 실습으로 연결하는 구성을 가지고 있습니다. 빠르게 결과물부터 만들고 싶은 분에게는 앞부분이 조금 길게 느껴질 수 있습니다. 반대로 LLM, 트랜스포머, RAG, 로컬 LLM, 랭체인, 랭그래프가 어떤 순서로 연결되는지 보고 싶은 분에게는 전체 흐름을 잡는 데 도움이 될 책이라고 생각합니다.

ryuhyoj***l2026-06-28

랭체인으로 챗봇 만드는 법을 알려주는 책이 아니라, 그 챗봇이 왜 그렇게 동작하는지를 알려주는 책.

"한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬받아 작성된 서평입니다."

제목에 '랭체인 & 랭그래프'가 큼지막하게 박혀 있어서 가벼운 실습서를 기대하고 펼쳤다가, 1장부터 한 대 맞는 느낌을 받았다. 이 책은 도구 사용법을 빠르게 훑는 책이 아니다. 오히려 절반 이상을 자연어 처리와 딥러닝의 기초 이론에 쏟는다. 토큰화·임베딩에서 시작해 강화학습, RNN, LSTM, seq2seq, 어텐션을 거쳐 트랜스포머까지 차곡차곡 쌓아 올린 다음에야 비로소 랭체인과 랭그래프가 등장한다.

요즘 AI 책들은 대체로 기본 개념은 슬쩍 건너뛰고 "이렇게 쓰면 됩니다" 하는 사용법·활용법 위주로 흘러간다. 빠르게 결과물을 내기엔 좋지만, 정작 안쪽에서 무슨 일이 벌어지는지는 끝내 모르고 지나가게 된다.

그런 흐름 속에서 이 책은 꽤 보기 드문 선택을 한다. 딥러닝의 기초부터 트랜스포머 아키텍처까지, 필수 기본 개념을 하나하나 빼놓지 않고 짚고 넘어간다. 이런 책이 점점 귀해지는 시대라, 그 점만으로도 반가웠다.

? 책의 흐름 — 기초 체력부터 실전 배포까지

이 책은 크게 세 덩어리로 읽힌다.

① 기본 개념 (2~4장)

자연어 처리 기초(토큰화, 임베딩, word2vec, 청킹)와 강화학습(다중 슬롯머신, 마르코프 결정 프로세스, 몬테카를로, Q-learning), 그리고 시퀀스 모델(RNN, LSTM, seq2seq, 빔 서치). 트랜스포머라는 산을 오르기 위한 베이스캠프 구간이다.

② 핵심 구조 (5~7장)

어텐션(셀프/멀티 헤드/크로스 어텐션, Query·Key·Value)과 트랜스포머(포지셔널 인코딩, 인코더·디코더), 그리고 LLM의 발전사(RLHF, PPO, InstructGPT, few/one/zero-shot, GPT·LLaMA·BERT). 이 책의 심장부.

③ 실전 활용 (8~12장)

Ollama, 허깅페이스 트랜스포머, Llama.cpp, 랭체인, 랭그래프 같은 개발 도구부터 파인튜닝(Full fine-tuning, PEFT, Adapter, LoRA, QLoRA, 양자화), RAG(ChromaDB, 대화형/Iterative/Adaptive RAG), 멀티 에이전트(A2A, MCP), 그리고 Streamlit으로 실제 서비스를 배포하는 데까지.

원리부터 차근차근 가고 싶다면 1장부터, 도구 실습이 급하다면 8장부터 펼쳐도 흐름이 끊기지 않게 구성돼 있다.

? 좋았던 점

1. 요즘 보기 드물게, 기본 개념부터 차근차근 짚는다

이게 이 책의 가장 큰 미덕이라고 생각한다. 요즘 나오는 AI 책들은 기본 원리는 "아시죠?" 하고 넘어간 뒤 곧장 라이브러리 사용법과 활용 예제로 직행하는 경우가 많다.

빠르긴 한데, 막상 에러가 나거나 모델이 엉뚱한 답을 내놓으면 손 쓸 도리가 없다. 결국 도구를 블랙박스로 쓰고 있었던 셈이다. 반면 이 책은 스칼라·벡터·내적·편미분·그래디언트 디센트 같은 기초 수학부터, 강화학습의 가치 함수, 순환 신경망의 동작 원리, 셀프 어텐션의 계산 과정까지 필수 개념을 하나하나 펼쳐서 설명한다.

빠른 결과보다 단단한 토대를 택한 구성이고, 이런 책이 점점 줄어드는 요즘이라 더 값지게 느껴졌다.

2. "트랜스포머가 왜 혁신이었나"를 흐름으로 이해시킨다

대부분의 LLM 책이 트랜스포머부터 시작하는 것과 달리, 이 책은 RNN의 한계 → LSTM의 보완 → seq2seq의 고정 길이 병목 → 어텐션의 등장 → 트랜스포머라는 진화의 맥락을 그대로 따라가게 만든다. 각각이 따로 노는 기술처럼 외우는 게 아니라, "이 기술이 어떤 문제를 풀려고 나왔는지"를 알게 되니 그 기술이 어디서 한계를 드러내는지도 자연스럽게 보인다. Query·Key·Value를 입력 벡터 기준과 입력 행렬 기준, 두 시각으로 풀어주는 부분도 인상적이었다.

3. 그림과 도식이 많다

토큰화, 임베딩, 트랜스포머 내부 처리처럼 말로만 하면 추상적인 개념을 도식으로 풀어주려는 시도가 곳곳에 보인다. 모델 내부 구조는 글자만으로는 멀게 느껴지는데, 그림이 함께 있으니 흐름을 붙잡기가 한결 수월하다.

4. 이론과 실습이 따로 놀지 않는다

3장의 Q-learning을 곧바로 "다음 단어 예측" 강화학습 실습으로 이어붙이거나, 허깅페이스 토크나이저의 input_ids·attention_mask를 직접 찍어보게 하는 식이다. 개념 → 코드의 연결고리가 촘촘하다.

5. 폭이 넓다 — 한 권짜리 지도

랭체인·랭그래프·RAG·LoRA·QLoRA·양자화·A2A·MCP·Streamlit까지, 요즘 여기저기서 들리는 키워드들이 트랜스포머라는 기반 위에서 어떻게 연결되는지 한 권으로 조망할 수 있다.

흩어진 지식의 뼈대를 잡고 싶은 사람에게는 백과사전 같은 든든함이 있다.

? 아쉬웠던 점

수식이 정말, 정말 만만치 않다.

편미분, 그래디언트, 소프트맥스, 손실 함수, 강화학습 가치 함수, RNN의 그래디언트 계산… 그림으로 최대한 풀고자 하는 흔적은 분명하지만, 그렇다고 수식 자체가 쉬워지는 건 아니었다. 딥러닝과 기초 수학에 대한 감이 없는 상태라면 중간중간 "그렇구나" 하고 넘어가게 되는 구간이 있을 것 같기도 했다.

그래서 이 책은 "AI가 궁금한 완전 초보자"보다는, "도구 뒤의 원리까지 이해하고 싶은 개발자"에게 더 잘 맞는다. 제목만 보고 실무 활용법을 빠르게 얻으려던 독자라면 초중반의 방대한 이론 분량이 다소 지루하게 느껴질 수 있다.

? 이런 분께 추천

✅ 랭체인·랭그래프를 단순히 쓰는 수준을 넘어 구조적으로 이해하고 싶은 분

✅ RAG, 파인튜닝, 로컬 LLM, MCP 같은 최신 키워드를 한 권에서 넓게 훑고 싶은 분

✅ 트랜스포머가 LLM과 AI 에이전트까지 어떤 흐름으로 이어지는지 알고 싶은 분

✅ AI 기능을 서비스에 붙이는 걸 넘어, 내부 원리와 한계까지 이해하고 싶은 개발자

? 반대로 AI, 딥러닝을 처음 접하는 분이라면 다소 버거울 수 있다.

이 경우 처음부터 완벽히 이해하려 하기보다, 관심 있는 챕터를 먼저 훑고 모르는 부분은 나중에 돌아오는 식으로 접근하는 걸 권한다.

? 마무리

요즘 AI 개발은 도구가 너무 빠르게 바뀐다. 유행하던 라이브러리가 금방 다른 것으로 대체되고, 새로운 프로토콜과 프레임워크가 끊임없이 등장한다. 이런 환경에서 사용법만 익히면 그 지식은 금세 낡는다.

이 책의 진짜 가치는 거기에 있다. 트랜스포머, 어텐션, RAG, 에이전트의 구조를 이해해두면, 새 도구가 나와도 "그래서 안쪽에서 뭐가 달라진 거지?"를 스스로 판단할 수 있다. 이 책은 그 판단 기준을 세워주는 책이다.

솔직히 쉬운 책은 아니다. 읽는 데 시간이 걸리고, 수식과 이론을 마주할 각오도 필요하다. 하지만 LLM을 블랙박스처럼 가져다 쓰는 데서 한 걸음 더 나아가고 싶다면, 충분히 도전해볼 만하다. 지금 당장 모든 걸 이해하지 못하더라도, AI 에이전트라는 분야가 얼마나 넓고 깊은 기반 위에 서 있는지 확인하는 것만으로도 의미가 있었다.

rapper***l2026-06-27

AI 에이전트를 쓰는 법보다, 그 안쪽 구조를 보게 만드는 책

※ 한빛 서평단 활동의 일환으로 책을 제공 받았으며, 그것과 별개로 최대한 객관적으로 쓰려고 노력하였습니다.

요즘 AI 관련 책을 보면 랭체인, 랭그래프, RAG, MCP 같은 키워드가 정말 자주 보입니다.

솔직히 이런 단어들을 보면 일단 흥미가 생깁니다. AI 에이전트를 직접 만들어볼 수 있다거나, 문서 기반으로 답변하는 RAG를 구현할 수 있다거나, 여러 도구를 연결해 자동화할 수 있다는 이야기는 확실히 매력적입니다.

그래서 이번에 『트랜스포머 아키텍처로 배우는 AI 에이전트 with 랭체인 & 랭그래프』를 살펴보게 되었습니다. 다만 먼저 말해두자면, 이 책은 제가 생각했던 것보다 훨씬 깊이가 있는 책이었습니다. 책을 받은 뒤 충분히 오랜 시간 동안 모든 내용을 따라가 보지는 못했고, 이번 글은 책의 목차와 일부 본문을 살펴보며 느낀 첫인상에 가까운 리뷰입니다.

그럼에도 한 가지는 분명하게 느꼈습니다. 이 책은 단순히 “랭체인으로 챗봇 만들기” 같은 가벼운 실습서가 아닙니다. 오히려 AI 에이전트가 어떤 원리 위에서 움직이는지, 그 기반이 되는 트랜스포머 아키텍처를 어떻게 이해해야 하는지를 꽤 본격적으로 다루는 책에 가깝습니다.

책 제목에는 랭체인과 랭그래프가 들어가지만, 책의 출발점은 훨씬 앞에 있습니다. 자연어 처리의 기본 개념부터 시작해서 토큰화, 임베딩, 기초 수학, 강화학습, RNN, LSTM, seq2seq, 어텐션, 트랜스포머로 이어집니다. 이후에야 Ollama, 허깅페이스 트랜스포머, Llama_cpp, 랭체인, 랭그래프, 파인튜닝, RAG, 멀티 에이전트, MCP, Streamlit 서비스 구현으로 넘어갑니다.

그러니까 이 책은 최신 AI 도구를 바로 사용하는 방법만 알려주는 책이라기보다는, 그 도구들이 어떤 배경에서 나왔고 내부적으로 어떤 구조를 가지고 있는지 설명하려는 책입니다.

이 방향성 자체는 좋았습니다.

요즘은 AI 도구가 워낙 쉽게 느껴집니다. 프롬프트를 입력하면 답이 나오고, API를 호출하면 결과가 돌아오고, 랭체인이나 랭그래프 같은 도구를 쓰면 뭔가 그럴듯한 에이전트를 만들 수 있을 것처럼 보입니다.

하지만 막상 문제가 생기면 이야기가 달라집니다. 왜 답변이 이상한지, 왜 문맥을 제대로 못 잡는지, RAG 검색이 왜 엉뚱하게 되는지, 에이전트 흐름이 왜 꼬이는지 이해하려면 결국 내부 구조를 어느 정도 알아야 합니다.

이 책은 바로 그 지점을 건드립니다.

초반부에서 인상적이었던 부분은 트랜스포머를 설명하기 위해 자연어 처리의 흐름을 차근차근 쌓아간다는 점이었습니다. 단어를 토큰으로 나누고, 그 토큰을 임베딩 벡터로 바꾸고, 문맥을 처리하는 방식이 어떻게 변화해왔는지를 설명합니다.

트랜스포머가 갑자기 하늘에서 떨어진 기술이 아니라, 기존 순차 모델의 한계 속에서 등장했다는 흐름을 잡아주는 방식입니다.

특히 본문을 보면 그림과 도식을 꽤 많이 사용합니다. 토큰화, 임베딩, 트랜스포머 처리 과정처럼 말로만 설명하면 추상적으로 느껴지는 내용을 그림으로 풀어주려는 시도가 보입니다.

이런 부분은 좋았습니다. AI 모델의 내부 구조는 말만으로 설명하면 너무 멀게 느껴지는데, 그림이 함께 있으니 그래도 흐름을 따라가기가 조금 수월했습니다.

다만 수식이 등장하기 시작하면 난이도가 확 올라갑니다. 편미분, 그래디언트, 소프트맥스, 손실 함수, 강화학습의 가치 함수, RNN의 그래디언트 계산 같은 내용이 나오는데, 솔직히 제 실력으로는 전부 이해하면서 읽기는 쉽지 않았습니다.

그림이 있다고 해서 수식 자체가 쉬워지는 것은 아니더라고요. 읽으면서 “아, 나는 아직 입문서를 더 보고 와야 하는구나”라는 생각이 들었습니다.

그래서 이 책은 확실히 입문서라고만 보기는 어렵습니다. 물론 책 안에서 기초 개념을 설명해주기는 합니다. 자연어 처리의 시작부터 강화학습, 시퀀스 모델, 어텐션, 트랜스포머까지 흐름을 잡아주려는 구성도 있습니다.

하지만 다루는 내용의 깊이와 폭을 생각하면, 완전 초보자가 아무런 배경지식 없이 편하게 읽을 책은 아닙니다. 파이썬 실습만 어느 정도 따라 할 수 있다고 해서 끝나는 책도 아니고, 딥러닝과 수학 개념에 대한 기본적인 감각이 있으면 훨씬 더 잘 읽힐 책입니다.

저처럼 AI 에이전트나 랭체인, 랭그래프에 대한 관심으로 접근한 독자라면 초반 이론 파트에서 조금 당황할 수 있습니다.

“나는 에이전트를 만들어보고 싶었는데, 갑자기 편미분과 강화학습이 나오네?” 싶은 순간이 있습니다.

그런데 책의 의도는 이해됩니다. AI 에이전트를 제대로 이해하려면 결국 LLM이 어떻게 동작하는지, 트랜스포머가 어떤 구조인지, 모델 학습과 추론이 어떤 원리로 이루어지는지 알아야 한다는 것이겠죠. 그러니까 이 책은 빠르게 결과물을 만들고 싶은 사람보다, 도구 뒤의 원리를 알고 싶은 사람에게 더 잘 맞습니다.

중반 이후로 가면 책의 주제가 점점 요즘 AI 개발 흐름과 가까워집니다. Ollama, 허깅페이스 트랜스포머, Llama_cpp 같은 도구를 다루고, 랭체인과 랭그래프 실습으로 이어집니다. 이후에는 파인튜닝, PEFT, LoRA, QLoRA, 양자화, RAG, ChromaDB, Iterative RAG, Adaptive RAG, 멀티 에이전트, A2A, MCP까지 다룹니다.

목차만 봐도 상당히 넓습니다. 개인적으로는 이 점이 이 책의 가장 큰 장점이자 동시에 부담으로 느껴졌습니다.

장점은 AI 에이전트 개발과 관련된 주요 키워드를 한 권 안에서 큰 흐름으로 볼 수 있다는 점입니다. 요즘 여기저기서 들리는 개념들이 따로 흩어져 있는 것이 아니라, 자연어 처리와 트랜스포머라는 기반 위에서 어떻게 이어지는지 확인할 수 있습니다.

반대로 부담은, 이 모든 내용을 한 번에 소화하기 어렵다는 점입니다. 특히 파인튜닝이나 RAG 응용, 멀티 에이전트, MCP 같은 부분은 각각 따로 공부해도 적지 않은 주제입니다.

이 책은 그것들을 한 권 안에 담고 있기 때문에, 독자 입장에서는 깊이 이해하기보다 “일단 이런 구조와 흐름이 있구나”를 잡는 쪽으로 접근하는 것이 더 현실적일 것 같습니다.

이 책을 보면서 가장 크게 느낀 건, AI 관련 기술서에도 단계가 있다는 점이었습니다.

처음에는 AI 도구를 써보는 책이 필요합니다. ChatGPT를 어떻게 활용할지, API를 어떻게 호출할지, 간단한 챗봇이나 RAG 예제를 어떻게 만들지 알려주는 책이 입문자에게는 더 맞습니다.

그 다음 단계에서 필요한 것이 이런 책이 아닐까 싶습니다. 단순히 코드를 복사해서 실행하는 수준에서 벗어나, 왜 이 구조가 필요한지, 모델이 어떤 방식으로 문맥을 처리하는지, 랭체인과 랭그래프 같은 도구가 어떤 문제를 해결하려고 등장했는지를 알고 싶을 때 이 책의 가치가 살아납니다.

초반은 어떻게든 따라잡기는 했는데, 중반부터는... ㅠ

저는 조금 섣부르게 중급 서적에 도전한 느낌이 있었습니다. 아직은 AI 입문서나 파이썬 기반 딥러닝 기초를 조금 더 보고 오는 편이 맞겠다는 생각도 들었습니다.

하지만 그렇다고 책이 별로였다는 뜻은 아닙니다. 오히려 제 현재 위치를 확인하게 해준 책에 가깝습니다.

“아, 내가 지금 관심 있는 AI 에이전트라는 분야가 생각보다 훨씬 깊은 기반 위에 서 있구나.”

“랭체인이나 랭그래프를 쓰기 전에, 트랜스포머와 RAG의 구조를 어느 정도는 이해해야겠구나.”

이런 생각을 하게 만들었습니다.

이 책의 장점은 원리 중심의 구성입니다. 요즘 AI 개발은 도구가 너무 빠르게 바뀝니다.

어떤 라이브러리가 유행하다가 금방 다른 도구가 나오고, 새로운 프로토콜이나 프레임워크도 계속 등장합니다. 이런 상황에서는 단순한 사용법만 익히면 금방 낡을 수 있습니다.

반면 트랜스포머, 어텐션, RAG, 에이전트 구조 같은 원리를 이해하면 새로운 도구가 나와도 어느 정도 스스로 판단할 수 있습니다. 이 책은 그런 기준을 만들고 싶은 독자에게 도움이 될 책입니다.

다만 아쉬운 점은 역시 난이도입니다. 수식이 많고, 다루는 개념도 많습니다. 설명과 그림을 통해 최대한 풀어주려는 시도는 보이지만, 중급 수준의 배경지식이 없다면 중간중간 따라잡기 힘든 구간이 있습니다.

그래서 이 책은 “AI가 궁금한 완전 초보자”보다는 “AI 에이전트 개발을 더 깊게 이해하고 싶은 개발자”에게 더 적합합니다.

추천 대상을 정리하면 이렇습니다.

랭체인과 랭그래프를 단순히 사용하는 수준을 넘어 구조적으로 이해하고 싶은 분.

RAG, 파인튜닝, 로컬 LLM, MCP 같은 최신 AI 개발 키워드를 한 권 안에서 넓게 훑어보고 싶은 분.

트랜스포머 아키텍처가 실제로 어떤 흐름으로 LLM과 AI 에이전트까지 이어지는지 알고 싶은 분.

AI 기능을 서비스에 붙이는 것을 넘어, 내부 원리와 한계를 이해하고 싶은 개발자.

반대로 AI나 딥러닝을 처음 접하는 분에게는 조금 어렵게 느껴질 수 있습니다. 저처럼 아직 입문 단계(초급은 지났다고 생각했었지만...)에 있다면, 이 책을 처음부터 끝까지 완벽히 이해하려고 하기보다는 관심 있는 챕터를 먼저 훑고, 모르는 부분은 나중에 다시 돌아오는 방식이 더 좋을 것 같습니다.

마무리하자면, 『트랜스포머 아키텍처로 배우는 AI 에이전트 with 랭체인 & 랭그래프』는 가벼운 실습서가 아닙니다. AI 에이전트를 만드는 방법을 다루기는 하지만, 그 전에 “AI 에이전트가 서 있는 기반”을 설명하려는 책입니다. 그래서 읽는 데 시간이 필요하고, 수식과 이론을 마주할 준비도 필요합니다.

저에게는 솔직히 쉽지 않은 책이었습니다. 아직은 입문서를 조금 더 보고 와야겠다는 생각이 들 정도로 중급 이상의 밀도가 있었습니다.

그럼에도 이 책이 보여주는 방향은 분명합니다. AI를 블랙박스처럼 가져다 쓰는 데서 한 걸음 더 나아가, 그 구조를 이해하고 자기만의 에이전트를 설계하고 싶은 사람이라면 충분히 도전해볼 만한 책입니다.

지금 당장 모든 내용을 이해하지 못하더라도, AI 에이전트라는 분야가 얼마나 넓고 깊은지 확인하는 데에는 꽤 의미 있는 책이었습니다.

lbn3***l2026-06-26

트랜스포머 아키텍처로 배우는 AI에이전트 with 랭체인&랭그래프 서평

한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다.

^{프론트엔드 개발자로 일한 지 4년 가까이 됐다. AI 공부를 아예 안 한 건 아니다. 학교에서 RAG도 배웠고 랭체인 실습도 해봤고, 파이썬으로 간단한 챗봇 비슷한 것도 만들어봤다. 근데 솔직히 그게 진짜 이해였냐고 하면 자신 없다. chain.invoke() 한 줄 치면 결과가 나왔고, 왜 되는지는 몰랐고, 에러 나면 스택 트레이스 분석하는 게 아니라 구글링부터 했다. 내가 쓰는 도구가 어떻게 동작하는지 전혀 모른 채로, 그냥 블랙박스를 쓰고 있었던 거다.}

^{이 책 제목을 처음 봤을 때 솔직히 겁먹었다. '트랜스포머 아키텍처'라는 단어가 박혀 있으니까. React 컴포넌트 트리 다루는 게 주업인 사람한테 딥러닝 모델 아키텍처라니. 근데 읽다 보니 내가 그동안 얼마나 표면만 긁고 있었는지를 실감하게 됐다. 무섭다기보다는, 몰랐던 게 이렇게 많았구나 하는 느낌이 더 컸다.}

^{제일 인상 깊었던 건 트랜스포머 챕터 자체가 아니라, 거기에 도달하기까지의 흐름이었다. RNN이 왜 한계가 있었는지, 그래서 LSTM이 나왔고, seq2seq가 나왔고, 어텐션이 나왔고, 결국 트랜스포머로 이어졌다는 맥락. 학교에서 배울 때는 각각이 따로 존재하는 기술처럼 느껴졌는데, 이 책을 읽고 나서야 하나의 흐름으로 연결됐다. 기술이 왜 등장했는지를 알면, 그 기술이 어디서 한계를 드러내는지도 자연스럽게 보인다. 그게 단순히 구조를 외우는 것과 다른 점이다.셀프 어텐션 개념도 그랬다. Query, Key, Value라는 단어를 수업에서 들었을 때는 그냥 세 가지 벡터가 있다는 정도로만 알았다. 이 책은 그게 실제로 어떤 계산을 수행하는 건지, 입력 벡터 기준과 입력 행렬 기준으로 두 시각에서 풀어준다. 완전히 다 이해됐다고 하면 거짓말이고, 중간에 멈추고 다시 읽은 부분도 있다. 그래도 '이 구조가 왜 필요한가'의 감은 처음으로 잡혔다. 그 감이 생기기 전이랑 후가 꽤 다르다. 랭체인 코드를 볼 때 예전보다 덜 막막하고, 에러 메시지가 조금 더 읽힌다.}

^{처음엔 강화학습 내용이 왜 이 책에 있는지 의아했다. AI 에이전트 책인데 슬롯머신 문제에 마르코프 결정 프로세스까지 나오니까. 솔직히 그 파트 읽을 때는 좀 지루했다. 근데 나중에 ChatGPT 같은 모델이 사용자 피드백으로 학습하는 방식, RLHF와 PPO 알고리즘이 어떻게 적용되는지를 설명하는 부분에 도달했을 때 이해됐다. 앞에서 개념을 쌓아놓지 않으면 그냥 그런가 보다로 넘어갈 수밖에 없는 내용이었다. 내가 매일 쓰는 AI 도구들이 어떻게 더 나은 답변을 내놓도록 훈련됐는지를 처음으로 이해한 순간이기도 했다. 책 구성이 꽤 치밀하다는 걸 뒤늦게 알았다.}

^{랭그래프는 이 책에서 처음 제대로 봤다. 학교에서 랭체인은 다뤘는데 랭그래프까지는 못 갔었다. 랭그래프가 단순 체인 방식을 넘어서 상태를 가진 그래프 기반의 에이전트를 만들 수 있다는 개념, 즉 조건에 따라 다른 노드로 분기하거나 루프를 돌 수 있다는 구조가 프론트엔드 개발자 입장에서는 오히려 친숙하게 느껴졌다. 리덕스의 상태 흐름이나 유한 상태 머신이랑 비슷한 개념이라고 생각하니까 훨씬 빨리 들어왔다. 이쪽 배경지식이 생각보다 도움이 됐다.}

^{RAG 부분도 새로웠다. 학교에서 배운 건 '임베딩해서 벡터DB에 저장하고 유사도 검색으로 컨텍스트 넣기'였는데, 이 책은 거기서 더 나아간다. 쿼리가 단순할 때와 복잡할 때 검색 전략 자체를 다르게 가져가는 Adaptive RAG까지 실습 코드와 함께 다룬다. 단순 RAG와 비교하면서 보니까 어디서 한계가 생기는지가 눈에 보였다. 학교에서 'RAG 좋은 거야'로만 배우고 끝났던 게 조금 아쉬워졌다. 이 책을 먼저 읽었으면 수업이 훨씬 재밌었을 것 같다.}

^{어려웠던 부분도 솔직히 얘기하자면, 파인튜닝 챕터는 한 번에 소화가 안 됐다. LoRA가 왜 저랭크 분해로 파라미터를 줄이면서도 성능을 유지할 수 있는지, QLoRA의 양자화가 정확히 어떤 트레이드오프를 만드는지, 수학적 배경이 약한 상태에서는 읽으면서 그렇구나하고 넘어가는 부분이 꽤 있었다. 억지로 다 이해하려다가 오히려 흐름을 잃을 것 같아서, 이 파트는 맥락만 잡고 나중에 실제로 필요할 때 다시 깊이 파고드는 레퍼런스로 쓰기로 했다. 책이 어렵다기보다 AI가 원래 이 정도 깊이를 가지고 있다는 걸 실감한 거라고 받아들였다.}

^{MCP 파트는 반대로 읽으면서 눈이 반짝였다. AI 에이전트가 외부 시스템과 표준화된 방식으로 연결되는 프로토콜이라는 개념인데, 프론트엔드 개발자한테는 REST API나 WebSocket 같은 통신 표준이 익숙하다 보니 'AI 에이전트 세계의 인터페이스 표준'이라고 이해하니까 바로 와닿았다. 요즘 실무에서도 MCP 얘기가 슬슬 나오기 시작하는데, 이 책에서 개념부터 실습까지 다뤄줘서 타이밍이 좋았다.}

^{마지막 Streamlit 챕터는 솔직히 제일 재밌었다. 이론이 아니라 실제로 돌아가는 서비스를 만드는 파트니까. 대화 기억이 되는 챗봇, 랭그래프 기반 에이전트, RAG까지 붙인 AI 서비스를 순서대로 구현하는데, 파이썬 파일 하나로 UI랑 로직을 다 처리하는 Streamlit 방식이 처음엔 이상하게 느껴졌다가 나중엔 프로토타입 만들 때 이게 얼마나 강력한지 이해됐다.}

^{요즘 실무에서 AI 기능을 붙여야 하는 상황이 점점 많아지고 있다. 예전엔 그냥 API 문서 보고 가져다 쓰는 식이었는데, 이 책을 읽고 나서는 조금 달라진 느낌이다. 완전히 이해했다는 게 아니라, 적어도 이 코드가 어떤 원리 위에 서 있는지를 어렴풋이 알고 쓰게 됐다는 거다. 그게 에러 대응할 때 차이를 만들고, 구조를 설계할 때 차이를 만든다.}

^{AI 도구를 매일 쓰면서도 속이 어떻게 돌아가는지 한 번도 들여다본 적 없는 개발자라면, 이 책이 꽤 좋은 시작점이 될 것 같다. 다 이해 못해도 괜찮다. 나도 그랬으니까.}

gidrm***l2026-06-25

트랜스포머 아키텍처로 배우는 AI 에이전트 with 랭체인 & 랭그래프

    "한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을

제목만 보면 랭체인·랭그래프 실습서처럼 보이지만, 실제로는 절반 이상이 자연어 처리와 딥러닝의 기초 이론에 할애되어 있습니다. 저자도 서문에서 "모델을 단순히 사용하는 방법보다 모델이 어떤 구조로 구성되었는지를 자세히 살펴본다"고 분명히 밝히고 있습니다. 즉 LLM을 블랙박스로 쓰는 데서 그치지 않고, 새로운 도구가 등장해도 그 내부에서 무엇이 달라졌는지 스스로 판단할 수 있는 기준을 만들어 주는 것이 이 책의 목표입니다.

전체 구성은 크게 세 덩어리로 나뉜니다다.

1부 — 기초 체력 (2~4장) 자연어 처리 기초(토큰화, 임베딩, word2vec, 청킹, 풀링)와 강화학습 기초(몬테카를로, 시간차 학습, Q-learning), 그리고 시퀀스 모델(RNN, LSTM, seq2seq, 빔 서치).

2부 — 핵심 구조 (5~7장) 어텐션(셀프/멀티 헤드/크로스 어텐션, Query·Key·Value), 트랜스포머(포지셔널 인코딩, 인코더·디코더, Add & Norm, Feed Forward), 그리고 LLM의 발전(PPO, InstructGPT, few/one/zero-shot, GPT·LLaMA·BERT).

3부 — 실전 활용 (8~12장) Ollama·허깅페이스 트랜스포머·Llama.cpp·랭체인·랭그래프 같은 개발 도구, 파인튜닝(Full fine-tuning, PEFT, Adapter, LoRA, QLoRA), RAG(벡터 DB, ChromaDB, Iterative/Adaptive RAG), 멀티 에이전트(A2A, MCP), 마지막으로 Streamlit으로 나만의 에이전트를 만드는 데까지 이어집니다.

원리부터 차근차근 쌓고 싶으면 1장부터, 랭체인·랭그래프 실습 위주로 빠르게 가고 싶으면 8장부터 읽어나가면 될 것 같습니다.

책의 난이도가 만만치 않다...

좋았던 점

1. "트랜스포머가 혁신이었는지"를 몸으로 느끼게 한다

대부분의 LLM 책이 트랜스포머부터 시작하는 것과 달리, 이 책은 RNN의 한계 → LSTM의 보완 → seq2seq의 고정 길이 컨텍스트 벡터 문제 → 어텐션의 등장이라는 흐름 전체를 따라가게 합니다. "앞에서부터 순서대로 읽는 대신 모든 페이지를 펼쳐놓고 보는 것"이라는 트랜스포머 비유(그림 2-1)나, seq2seq의 고정 길이 병목을 직접 보여준 뒤 어텐션으로 넘어가는 구성이 인상적이었습니다.

2. 이론과 실습

3장의 Q-learning을 곧바로 "다음에 올 단어를 예측"하는 자연어 처리 강화학습 실습으로 연결하거나, 8장에서 허깅페이스 토크나이저의 input_ids·attention_mask 출력을 실제로 찍어보게 합니다.

아쉬웠던 점

수학 공식이 정말, 정말 복잡했다

솔직히 이 부분이 책을 읽으며 가장 힘들던 부분입니다. 4장 물론 그림으로 최대한 풀어주려고 노력한 흔적은 분명하나... 하지만 그렇다고 수식 자체가 쉬워지는 건 아니었던 것 같습니다.

한 줄 요약

순환 신경망(RNN)부터 트랜스포머, LLM, 그리고 RAG·멀티 에이전트까지를 "사용법"이 아니라 "구조" 로 기술한 책. 도구 사용서가 아니라 원서에 가깝다. 수학을 잘 알아야 할듯.

moonlight***l2026-06-19

LLM의 기술적인 내용을 광범위하게 다룹니다.

순환 신경망(RNN)부터 최신 트랜스포머 아키텍처까지 인공지능 모델의 거대한 진화 과정을 한 권에 모두 담아냈다는 점이 장점입니다.
자신이 부족하거나 공부하고 싶은 파트만 발췌해서 볼 수 있는 백과사전 같은 든든함이 있습니다.
AI 기술의 파편화된 지식들을 하나로 모아 전체적인 개념과 뼈대를 탄탄하게 잡고 싶은 독자들에게는 훌륭한 교재가 될 것입니다.

하지만 이것이 독이 될 수도 있습니다.
책의 제목만 보고 'AI 에이전트의 실무적인 활용 방안'을 빠르게 습득하길 원했던 독자라면, 초중반부의 방대한 분량이 다소 지루하게 느껴질 수 있습니다.
기초를 탄탄히 하는 것도 물론 좋지만, 실무에서 당장 에이전트를 구축해야 하는 개발자 입장에서는 책의 메인 주제(AI 에이전트)와는 조금 동떨어져 보이는 과거의 기술들에 너무 많은 페이지를 할애한 것은 아닌가 하는 의문이 들기도 했습니다.

sangj***l2026-06-14

한 권의 책으로 LLM과 RAG, MCP, 에이전트까지!

한빛미디어 서평단 <나는 리뷰어다> 활동을 위해 도서를 제공받아 작성한 리뷰입니다.

최근 몇 년 사이 ChatGPT를 비롯한 생성형 AI가 빠르게 확산되면서 LLM(Large Language Model)에 대한 관심도 크게 높아졌습니다. 하지만 실제로 LLM이 어떤 구조로 동작하는지, RAG나 AI 에이전트는 어떻게 만드는지 체계적으로 설명하는 책은 생각보다 많지 않습니다.

이번에 읽은 이 책은 LLM의 근간이 되는 트랜스포머 아키텍처부터 RAG, LangChain, LangGraph, 파인튜닝, 양자화, MCP, A2A까지 최근 AI 서비스 개발에 필요한 핵심 기술을 폭넓게 다루고 있습니다. 특히 단순히 개념만 설명하는 것이 아니라 직접 따라 해볼 수 있는 실습 예제를 함께 제공한다는 점이 인상적이었습니다.

무엇보다 LoRA, QLoRA와 같은 파인튜닝 기법과 양자화, 멀티 에이전트 구조까지 포함하고 있어 기존 입문서보다 한 단계 더 실무적인 내용을 담고 있다는 점이 이 책의 가장 큰 특징이라고 생각합니다.

책은 먼저 개발 환경 구축부터 시작합니다. 1장에서는 Visual Studio Code와 Miniconda를 이용해 Python 가상환경을 구성하고, Transformers, LangChain, LangGraph 등 이후 실습에 필요한 라이브러리를 설치합니다.

Miniconda는 AI 개발자들이 가장 많이 사용하는 Python 가상환경 관리 도구 중 하나입니다. 실습 과정에서는 Python 3.11 환경을 구성한 뒤 다양한 AI 패키지를 설치하는데, 이를 통해 서로 다른 라이브러리 버전 충돌 없이 실습을 진행할 수 있습니다. 이후 등장하는 양자화 실습이나 RAG 구축 과정도 모두 이 환경을 기반으로 진행됩니다.

이 책의 가장 큰 장점은 LLM의 원리를 설명하는 데서 멈추지 않고 실제 서비스 개발에 필요한 LangChain, LangGraph, RAG, 벡터 DB, 파인튜닝, MCP, 멀티 에이전트까지 하나의 흐름으로 연결해 설명한다는 점입니다.

최근 AI 관련 서적은 많지만 트랜스포머부터 최신 AI 에이전트 아키텍처까지 폭넓게 다루면서 실습 예제를 제공하는 책은 많지 않습니다. 특히 LangGraph와 MCP, A2A 같은 최신 주제를 포함하고 있다는 점은 현업 개발자들에게도 큰 도움이 될 것으로 보입니다.

개인적으로는 9장의 파인튜닝과 QLoRA 실습, 그리고 10장의 RAG 및 벡터 DB 설명이 가장 인상적이었습니다. 단순히 "어떻게 사용한다" 수준을 넘어 왜 이러한 기술이 등장했는지 배경까지 함께 설명하고 있어 개념을 이해하기 수월했습니다.

LLM을 처음 공부하는 개발자, AI 서비스를 직접 만들어보고 싶은 엔지니어, 그리고 LangChain과 AI 에이전트 개발을 체계적으로 배우고 싶은 분들에게 추천할 만한 책입니다. 실습 환경을 직접 구축하고 코드를 실행해 본다면 책의 내용을 훨씬 빠르게 체득할 수 있을 것입니다.