한빛미디어 서평단 <나는 리뷰어다> 활동을 위해 도서를 제공받아 작성한 리뷰입니다.
최근 몇 년 사이 ChatGPT를 비롯한 생성형 AI가 빠르게 확산되면서 LLM(Large Language Model)에 대한 관심도 크게 높아졌습니다. 하지만 실제로 LLM이 어떤 구조로 동작하는지, RAG나 AI 에이전트는 어떻게 만드는지 체계적으로 설명하는 책은 생각보다 많지 않습니다.
이번에 읽은 이 책은 LLM의 근간이 되는 트랜스포머 아키텍처부터 RAG, LangChain, LangGraph, 파인튜닝, 양자화, MCP, A2A까지 최근 AI 서비스 개발에 필요한 핵심 기술을 폭넓게 다루고 있습니다. 특히 단순히 개념만 설명하는 것이 아니라 직접 따라 해볼 수 있는 실습 예제를 함께 제공한다는 점이 인상적이었습니다.
무엇보다 LoRA, QLoRA와 같은 파인튜닝 기법과 양자화, 멀티 에이전트 구조까지 포함하고 있어 기존 입문서보다 한 단계 더 실무적인 내용을 담고 있다는 점이 이 책의 가장 큰 특징이라고 생각합니다.
책은 먼저 개발 환경 구축부터 시작합니다. 1장에서는 Visual Studio Code와 Miniconda를 이용해 Python 가상환경을 구성하고, Transformers, LangChain, LangGraph 등 이후 실습에 필요한 라이브러리를 설치합니다.
Miniconda는 AI 개발자들이 가장 많이 사용하는 Python 가상환경 관리 도구 중 하나입니다. 실습 과정에서는 Python 3.11 환경을 구성한 뒤 다양한 AI 패키지를 설치하는데, 이를 통해 서로 다른 라이브러리 버전 충돌 없이 실습을 진행할 수 있습니다. 이후 등장하는 양자화 실습이나 RAG 구축 과정도 모두 이 환경을 기반으로 진행됩니다.
이 책의 가장 큰 장점은 LLM의 원리를 설명하는 데서 멈추지 않고 실제 서비스 개발에 필요한 LangChain, LangGraph, RAG, 벡터 DB, 파인튜닝, MCP, 멀티 에이전트까지 하나의 흐름으로 연결해 설명한다는 점입니다.
최근 AI 관련 서적은 많지만 트랜스포머부터 최신 AI 에이전트 아키텍처까지 폭넓게 다루면서 실습 예제를 제공하는 책은 많지 않습니다. 특히 LangGraph와 MCP, A2A 같은 최신 주제를 포함하고 있다는 점은 현업 개발자들에게도 큰 도움이 될 것으로 보입니다.
개인적으로는 9장의 파인튜닝과 QLoRA 실습, 그리고 10장의 RAG 및 벡터 DB 설명이 가장 인상적이었습니다. 단순히 "어떻게 사용한다" 수준을 넘어 왜 이러한 기술이 등장했는지 배경까지 함께 설명하고 있어 개념을 이해하기 수월했습니다.
LLM을 처음 공부하는 개발자, AI 서비스를 직접 만들어보고 싶은 엔지니어, 그리고 LangChain과 AI 에이전트 개발을 체계적으로 배우고 싶은 분들에게 추천할 만한 책입니다. 실습 환경을 직접 구축하고 코드를 실행해 본다면 책의 내용을 훨씬 빠르게 체득할 수 있을 것입니다.
