메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기
정가 33,600원
판매가
33,600원
총 결제 금액 33,600원
dropdown arrow
  • 소장/대여 옵션 선택
  • 소장
  • 365일
    30% 할인
  • 180일
    40% 할인
  • 90일
    50% 할인
  • 30일
    60% 할인

전자책은 웹뷰어와 한빛+ 앱에서
열람할 수 있으며, PDF 다운로드는 지원되지 않습니다.

대여 가능

전자책

종이책

에이전트 시대의 AI 시스템 설계

RAG, 최적화, 가드레일로 완성하는 32가지 프로덕션 패턴

  • 저자발리아파 락슈마난 , 하네스 하프케
  • 번역류광
  • 출간2026-04-27
  • 페이지592 쪽
  • eISBN9791175796539
  • 물류코드51653
  • 난이도
    초급 초중급 중급 중고급 고급
4.8점 (14명)

프로토타입을 넘어 프로덕션으로!
성공적인 AI 서비스를 위한 32가지 실전 패턴

 

생성형 AI는 강력한 기능을 제공하지만, 이를 실제 프로덕션 환경에 안정적으로 도입하려면 환각, 비결정적 응답, 지식 공백 등 치명적인 한계를 극복해야 한다. 이 책은 현업 전문가들이 LLM 애플리케이션과 에이전트를 구축할 때 마주치는 핵심 문제를 해결하는 검증된 설계 패턴 32가지를 집대성했다. 최신 연구와 실제 현장의 경험을 바탕으로 패턴마다 명확한 문제 정의, 완전한 예제 코드, 도입 시 장단점까지 상세히 다루어 흔들리지 않는 AI 시스템 구축을 위한 명확한 실무 지침을 제공한다.
 

 

발리아파 락슈마난 저자

발리아파 락슈마난

금융 분야의 심화 도메인 AI 에이전트를 구축하는 스타트업 오빈 AI의 공동 창업자이자 CTO다. 그전에는 구글에서 AI 솔루션 부문 디렉터로, 미국 해양대기청(NOAA)에서 머신러닝 연구원으로 일했다. 다수의 오라일리 도서를 저술했으며, 기상 이변 예측 분야에 머신러닝을 도입한 선구적인 공로를 인정받아 미국기상학회 펠로로 선출되었다.

하네스 하프케 저자

하네스 하프케

AI 기반 핀테크 스타트업인 디지츠(Digits)의 수석 머신러닝 엔지니어로서 금융 애플리케이션용 머신러닝 시스템을 구축했다. 머신러닝 분야 구글 개발자 전문가(GDE)이며, 구글 개발자 자문 위원회에서 활동한다. 또한 『살아 움직이는 머신러닝 파이프라인 설계』(한빛미디어, 2021)와 『파이썬으로 배우는 자연어 처리 인 액션』(제이펍, 2020)을 포함해 여러 권의 머신러닝 관련 도서를 공동 저술했다.

류광 역자

류광

도널드 커누스 교수의 『컴퓨터 프로그래밍의 예술』 시리즈를 비롯해 다양한 IT 전문서를 번역한 전문 번역가이다. 생성형 AI 관련 번역서로는 『마스터링 트랜스포머』, 『실전! RAG 기반 생성형 AI 개발』, 『LLM 인 프로덕션』, 『AI 에이전트 인 액션』, 『스프링 AI 인 액션』(이상 위키북스), 『그림으로 배우는 생성형 AI』(한빛미디어, 2026) 등이 있다. 개인 웹사이트 류광의 번역 이야기(https://occamsrazr.net)와 IT 및 게임 개발 정보 공유 사이트 GpgStudy(https://gpgstudy.com)를 운영한다.

 

CHAPTER 1 서론
_1.1 생성형 AI 설계 패턴
_1.2 기초 모델에 기반한 애플리케이션 구축
_1.3 에이전트형 AI
_1.4 세밀한 제어
_1.5 컨텍스트 내 학습
_1.6 사후훈련
_1.7 이 책의 구성

 

CHAPTER 2 콘텐츠 스타일의 제어
_2.1 패턴 1: 로짓 마스킹
_2.2 패턴 2: 문법
_2.3 패턴 3: 스타일 전이
_2.4 패턴 4: 역중립화
_2.5 패턴 5: 콘텐츠 최적화
_2.6 요약

 

CHAPTER 3 지식 추가: 기본
_3.1 패턴 6: 기본 RAG
_3.2 패턴 7: 의미 기반 색인화
_3.3 패턴 8: 대규모 색인화
_3.4 요약

 

CHAPTER 4 지식 추가: 고급
_4.1 패턴 9: 색인 인식 검색
_4.2 패턴 10: 노드 후처리
_4.3 패턴 11: 신뢰할 수 있는 생성
_4.4 패턴 12: 심층 탐색
_4.5 요약

 

CHAPTER 5 모델 능력 확장
_5.1 LLM 추론의 한계
_5.2 패턴 13: 사고 연쇄(CoT)
_5.3 패턴 14: 사고 트리(ToT)
_5.4 패턴 15: 어댑터 조정
_5.5 패턴 16: 지시사항 진화
_5.6 요약

 

CHAPTER 6 신뢰성 개선
_6.1 패턴 17: 심판형 LLM
_6.2 패턴 18: 성찰
_6.3 패턴 19: 의존성 주입
_6.4 패턴 20: 프롬프트 최적화
_6.5 요약

 

CHAPTER 7 에이전트의 행동 능력 활성화
_7.1 패턴 21: 도구 호출
_7.2 패턴 22: 코드 실행
_7.3 패턴 23: 다중 에이전트 협업
_7.4 요약

 

CHAPTER 8 제약 조건 해결
_8.1 패턴 24: 소규모 언어 모델
_8.2 패턴 25: 프롬프트 캐싱
_8.3 패턴 26: 인퍼런스 최적화
_8.4 패턴 27: 성능 저하 테스트
_8.5 패턴 28: 장기 기억
_8.6 요약

 

CHAPTER 9 안전장치 설정
_9.1 패턴 29: 템플릿 생성
_9.2 패턴 30: 조립 후 재구성
_9.3 패턴 31: 자체점검
_9.4 패턴 32: 가드레일
_9.5 요약

 

CHAPTER 10 조합 가능한 에이전트형 작업흐름
_10.1 에이전트형 작업흐름
_10.2 요약
 

LLM이 스스로 판단하고 행동하는 시대,
모델을 바꿔도 무너지지 않는 설계 원칙

 

기반 모델을 호출해 그럴듯한 AI 애플리케이션을 만드는 일은 이제 누구에게나 열려 있습니다. 하지만 이를 실제 서비스로 운영하려 할 때, 본격적인 문제가 시작됩니다. 모델이 지어낸 답이 고객에게 그대로 전달되고, 매번 달라지는 출력이 후속 파이프라인을 무너뜨리고, 에이전트가 엉뚱한 도구를 호출하는 순간, 프롬프트 수정만으로는 해결되지 않는 구조적 문제가 드러납니다. AI가 스스로 계획하고 판단하고 행동하는 시대일수록 그 행동을 떠받치는 시스템 설계의 격차가 서비스의 성패를 결정합니다.

 

이 책은 콘텐츠 제어, RAG 고도화, 추론 확장, 다중 에이전트 협업, 비용·지연시간 최적화, 안전 가드레일까지 7개 영역을 관통하는 32가지 설계 패턴을 담았습니다. 각 패턴은 문제 정의, 해법, 트레이드오프, 예제 코드로 구성되어 있으며 특정 모델이나 프레임워크에 종속되지 않습니다. 기술 스택이 교체되어도 유효한 설계 원칙을 손에 쥐고 싶다면 이 책이 가장 확실한 출발점이 될 것입니다.

 

주요 내용
●    LLM의 태생적 한계를 극복하는 방법과 시스템 설계 우회법 알아보기
●    출력 콘텐츠의 특정 스타일, 어조, 데이터 형식 제어하기
●    비용, 지연시간과 같은 다양한 위험을 통제해 모델 효율성 극대화하기
●    스스로 계획하고 수정하며 외부 도구를 실행하는 자율 에이전트 구축하기
●    여러 패턴을 결합해 상용화 수준의 에이전틱 애플리케이션 완성하기

 

대상 독자
●    생성형 AI 기반 서비스를 설계·개발·운영하는 AI/백엔드 엔지니어
●    시스템 아키텍처와 품질을 책임지는 아키텍트나 기술 리더
●    LLM과 사내 데이터를 연결해 업무 자동화를 구축하려는 데이터/ML 엔지니어
●    AI 도입의 설계 방향을 판단해야 하는 PM이나 CTO
 

 

요즘 생성형 AI 관련 책들은 정말 많다.
하지만 대부분은 프롬프트 작성법이나 특정 프레임워크 사용법 중심으로 흘러가는 경우가 많다. 반면 『에이전트 시대의 AI 시스템 설계』는 조금 다른 방향을 바라본다. 단순히 AI를 “어떻게 사용할까”보다, 실제 서비스 환경에서 생성형 AI를 어떻게 설계하고 운영할 것인가에 더 집중한다.

특히 좋았던 건 책 전체가 “패턴” 중심으로 구성되어 있다는 점이었다. 단순 개념 설명이 아니라, 실제 AI 시스템에서 반복적으로 마주치는 문제들을 어떤 구조로 해결할 수 있는지를 단계적으로 보여준다. 그래서 읽다 보면 단순 AI 활용서라기보다 “생성형 AI 아키텍처 설계서”에 가깝다는 느낌을 받게 된다.

개인적으로 가장 인상 깊었던 부분은 RAG, 심판형 LLM, 가드레일 패턴이었다.

RAG 파트에서는 단순히 외부 문서를 검색하는 수준이 아니라, 왜 검색 품질과 컨텍스트 설계가 중요한지까지 설명한다. 생성형 AI의 한계가 결국 “정보 부족”과 “잘못된 근거”에서 시작된다는 걸 구조적으로 이해하게 만든다.

심판형 LLM 패턴 역시 흥미로웠다. 생성형 AI는 놀라울 정도로 자연스럽게 답변하지만 동시에 너무 자연스럽게 틀리기도 한다. 그래서 앞으로는 단순 생성 능력보다 결과를 검증하고 평가하는 구조가 더 중요해질 수 있다는 점이 인상 깊었다.

마지막으로 가드레일 파트는 정말 현실적이었다. 프롬프트 인젝션, 개인정보 유출, 유해 콘텐츠 생성 같은 문제를 단순 개념이 아니라 실제 운영 관점에서 다룬다. 읽다 보니 AI 보안 역시 결국 소프트웨어 엔지니어링과 시스템 설계의 문제라는 생각이 들었다.

무엇보다 좋았던 건 이 책이 AI를 지나치게 낙관적으로만 바라보지 않는다는 점이다. 환각, 평가, 신뢰성, 운영 비용 같은 현실적인 문제들을 계속 이야기한다. 덕분에 단순 “AI 사용법”을 넘어, 실제 서비스 수준의 생성형 AI 시스템을 고민하는 개발자와 엔지니어에게 꽤 좋은 방향성을 제시해주는 책이라는 느낌을 받았다.

한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다.

한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬받아 작성된 서평입니다.

한빛미디어의 '나는 리뷰어다' 5월 서평단으로 '에이전트 시대의 AI 시스템 설계' 책을 선택하여 전자책으로 받아 읽게 되었다.

이제는 누구나 AI를 활용하게 되면서 AI 시대 혹은 에이전트 시대라고 부를 수 있게 됐다.

개인적으로는 AI 시대라고 불러왔는데, 책 이름에서 에이전트 시대라고 하는 걸 보고 우리가 사용하는게 사실상 AI를 응용하여 만들어진 에이전트를 사용하는 것이기 때문에, 에이전트 시대라고 부르는게 적합할거 같다는 생각을 하기도 했다.

이 책은 AI 프롬프트를 사용하거나 하네스 엔지니어링에 대한 내용이 아닌, AI 시스템을 만들기 위한 내용을 다루고 있다.
RAG이나 LLM을 활용하여 추론 모델을 만들어 시스템에 적합한 AI 시스템을 만드는 과정과 방법을 알려주는 책이다.

프롬프트를 활용하고 모델을 최적화 시키는 것에 있어 프롬프트 엔지니어링이라고 부를 수도 있을 것 같으나, 그 보다 조금 더 깊은 내용을 다루고 있다.

나와 같은 일반적인 개발자들 입장에서는 사실 내용을 이해하기는 어려운 편에 속한다.
AI 구조에 대해 전문적으로 학습을 해보진 않았기에, 그저 따라하는 수준에서는 이 책을 읽어보는 것으로만 해서는 이해하기가 쉽지는 않았다.

다만, 책을 보면서 AI의 모델을 어떻게 응용할 수 있을 지, 혹은 시스템을 구축하기 위한 방법을 알수 있다는 점에서 인사이트를 넓힐 수 있었다.

책 내용이 쉬운 책은 아니지만, AI를 활용하여 시스템을 구축하고 싶다면 시간을 들여서 따라해볼만한 책이라고 생각한다.

<한빛미디어 <나는 리뷰어다> 활동을 위해 책을 제공받아 작성된 서평입니다.>

 



생성형 AI로 프로토타입을 만드는 일은 이제 누구나 한다. 문제는 그다음이다. 환각, 비결정성, 비용 폭증, 컨텍스트 부족, 도구 호출 실패, 보안 구멍… 프롬프트 몇 줄로는 해결되지 않는 구조적 문제들이 줄줄이 튀어나온다. 『에이전트 시대의 AI 시스템 설계』는 그 줄을 32개 패턴으로 정리한 책이다.

원제가 Generative AI Design Patterns이니, GoF를 떠올리는 게 자연스럽다. 다만 GoF가 객체지향이라는 단단한 토대 위에 세워졌다면, 이 책은 매주 모델이 바뀌는 진흙탕 위에 패턴을 세웠다. 그래도 무너지지 않는 건, 패턴을 특정 모델·프레임워크에서 떼어내 추상화했기 때문이다. 흔들리는 땅 위에서 흔들리지 않는 원칙을 잡으려는 시도다.

책의 구조가 깔끔하다. 비슷한 패턴들을 그룹으로 묶고, 각 패턴은 문제 제기 → 단계별 해법(다이어그램 포함) → 예제 코드(Python + Pydantic AI + LlamaIndex) → 고려사항과 대안 → 참고 논문 순으로 흘러간다. 군더더기가 없다. 다이어그램은 한 번에 머리에 들어오고, 예제는 따라 치는 맛이 있다.

개인적으로 가장 와닿은 패턴은 어댑터 조정과 프롬프트 캐싱이다. 프론티어 모델을 마음껏 쓸 수 있는 환경이라면 굳이 고민할 필요 없는 영역이지만, 현실은 그렇지 않다. 충분한 GPU도, 외부 API 호출 권한도 없는 고객이 훨씬 많다. 두 패턴은 그 제약을 정면으로 다룬다. "큰 모델 한 방"이 아니라 "작은 모델을 잘 다루는 법"이다.

단점이라면 단점은 두 가지. 분야가 방대해서 어느 정도 사전 지식이 있어야 술술 읽힌다는 것, 그리고 패턴 끝마다 붙는 참고 논문이 너무 풍성해서 진지하게 다 따라가려면 1년 치 독서 계획을 따로 세워야 한다는 것. 후자는 좋은 의미의 함정이다.

결론은 단순하다. AI 프로덕트를 기획하거나 개발하는 개발자라면 필수다. 32개를 다 외울 필요는 없다. 어떤 패턴이 어디 있는지만 기억해두면 된다. 그게 디자인 패턴 책의 본질이니까.



<2장 콘텐츠 스타일의 제어, p68~p69>

 

책 중간중간 Note에서는 '될 때까지 재시도'라는 현업의 골칫거리 질문에 명쾌한 답변을 제공한다.

 

<4장 지식 추가: 고급, p274~p275>

 

비슷한 유형의 패턴 비교

<8장 제약 조건 해결, p462~p463>

파인 튜닝의 재해석, SLM 모델도 잘한다. 특히 파인튜닝이 생각보다 어렵지 않다.

 

<10장 조합 가능한 에이전트형 작업흐름, p560~561>

32개 패턴을 활용한 마지막 장 예제

 

 

에이전트 시대의 AI 시스템 설계 책 표지

“한빛미디어 <나는 리뷰어다> 활동을 위해 도서를 제공받아 작성된 서평입니다.”

제품을 만들 때 AI로 실습 문제를 생성하는 기능을 붙인 적이 있다. 사용자의 직무, 개선하고 싶은 업무, 지금 하고 있는 일을 입력으로 받아서 그 사람의 상황에 맞는 실습 문제를 만들어주는 흐름이었다. 처음에는 프롬프트에 규칙을 잘 적어두면 어느 정도 안정적인 결과가 나올 거라고 생각했다.

그런데 실제로 만들어보니 생각보다 쉽지 않았다. 결과물이 겉으로는 문제 형식을 갖추고 있었지만, 실제 업무 상황처럼 느껴지지 않는 경우가 많았다. 실습 데이터도 부실해서 사용자가 “이걸 내 업무에서 어떻게 쓰지?”라고 느낄 만한 결과가 나왔다. 직무와 상황을 입력으로 넣었는데도, 결과물은 그 맥락을 깊게 반영하지 못했다.

그래서 계속 규칙을 고쳤다. “이런 상황을 더 구체적으로 반영해라”처럼 규칙을 자세히 쓰기도 했고, 반복해서 안 좋은 결과가 나오는 경우에는 “이런 식으로 만들면 안 된다”는 금지 규칙을 추가하기도 했다. 이 과정을 반복하면서 AI 기능은 프롬프트 한 번으로 완성되는 게 아니라, 실패 사례를 보고 규칙과 검증 기준을 계속 보강하는 운영 루프에 가깝다는 생각을 하게 됐다.

이 책 <에이전트 시대의 AI 시스템 설계>는 생성형 AI를 실제 서비스로 운영할 때 마주치는 환각, 비결정적 응답, 지식 공백, 도구 호출 실패, 비용과 지연시간, 안전장치 문제를 32가지 설계 패턴으로 다루는 책이다. 내가 겪었던 “AI가 문제는 만들지만 좋은 실습 문제는 못 만든다”는 문제도 결국 프롬프트 문장력보다 시스템 설계에 가까웠다.

인사이트 1: 좋은 문제를 만들려면 좋은 맥락이 먼저 필요하다

AI에게 직무와 상황을 넣었다고 해서 곧바로 실제 업무 같은 문제가 나오지는 않았다. “프론트엔드 개발자”, “업무 자동화를 개선하고 싶다”, “현재 이런 일을 하고 있다” 같은 정보를 줘도 결과물은 종종 일반적인 예시 문제에 머물렀다. 입력값은 구체적인데 출력은 뭉뚱그려지는 느낌이었다.

이때 아쉬웠던 건 실습 데이터였다. 실제 업무에서 다룰 법한 데이터, 제약 조건, 예외 상황, 의사결정 맥락이 있어야 문제가 살아나는데, AI가 만든 데이터는 너무 얇았다. 테이블이나 예시 값은 있지만 현업에서 마주치는 복잡함이 없었다. 그래서 학습자는 문제를 풀 수는 있어도, 그 문제가 자기 업무와 연결된다는 느낌을 받기 어려웠다.

책을 읽으면서 가장 먼저 연결된 부분도 RAG와 지식 추가였다. 기본 RAG, 의미 기반 색인화, 대규모 색인화, 신뢰할 수 있는 생성 같은 주제를 따로 다루는데, 여기서 좋았던 건 RAG를 단순히 “문서 검색 붙이기”로 설명하지 않는다는 점이었다. 내가 만들던 기능에 대입해보면, 사용자 입력 몇 개를 프롬프트에 넣는 것만으로는 부족하고, 직무별 업무 사례나 좋은 실습 데이터의 기준을 어떻게 공급할지까지 설계해야 한다는 이야기로 읽혔다.

결국 맥락은 “문장으로 설명하는 것”만으로 충분하지 않다. 좋은 실습 문제를 만들려면 사용자의 직무와 상황을 해석할 수 있는 참고 데이터, 예시, 제약 조건이 같이 들어가야 한다. 책을 읽고 나서는 내가 부족하다고 느꼈던 “실습 데이터의 부실함”도 단순 데이터 양의 문제가 아니라, 어떤 지식을 어떻게 가져오고 생성 과정에 연결할지의 문제였다는 생각이 들었다.

RAG와 지식 추가 관련 내용을 읽은 화면

인사이트 2: 금지 규칙도 시스템의 일부다

실습 문제 생성에서 규칙을 추가하다 보면 자연스럽게 금지 규칙이 늘어난다. 처음에는 “직무와 레벨을 반영해라”처럼 원하는 방향을 적는다. 그런데 결과를 보다 보면 “이런 식으로 만들면 안 된다”는 조건이 더 중요해지는 순간이 생긴다. 실제 업무 상황 같지 않은 문제, 데이터가 너무 단순한 문제, 정답이 뻔한 문제, 맥락 없이 용어만 바꾼 문제 같은 것들이다.

이런 금지 규칙을 넣으면 당장은 나아진다. 하지만 금지 규칙만 계속 늘어나는 방식은 한계가 있다. 프롬프트가 길어지고, 규칙 사이의 우선순위가 애매해지고, 새로운 실패 유형이 나오면 또 규칙을 추가해야 한다. 결국 “규칙을 얼마나 많이 쓰느냐”보다 “어떤 실패를 막아야 하고, 그 실패를 어떻게 감지할 것인가”가 더 중요한 문제가 된다.

책의 후반부에는 템플릿 생성, 조립 후 재구성, 자체점검, 가드레일 같은 안전장치 패턴이 나온다. 이 부분을 읽으면서 내가 프롬프트에 계속 추가하던 금지 규칙을 조금 다르게 보게 됐다. AI가 부실한 실습 문제를 만들지 않게 하려면 단순히 “잘 만들어줘”라고 하는 게 아니라, 나쁜 결과의 유형을 정의하고 막는 장치가 필요하다.

내가 추가했던 금지 규칙은 일종의 작은 가드레일이었다. 다만 그때는 그것을 시스템 설계라고까지 생각하지 못했다. 책을 읽고 나니 금지 규칙을 프롬프트 안에 계속 쌓아두는 것보다, 템플릿, 자체점검, 평가 기준으로 분리하는 편이 더 운영 가능한 방식이라는 생각이 들었다.

가드레일과 자체점검 관련 내용을 읽은 화면

인사이트 3: 퀄리티 컨트롤은 생성 이후에 더 중요해진다

실습 문제 생성에서 가장 어려웠던 건 퀄리티 컨트롤이었다. 문제를 하나 생성하는 것 자체는 어렵지 않았다. 어려운 건 그 문제가 정말 사용자의 직무와 상황에 맞는지, 실습 데이터가 충분한지, 실제 업무 상황처럼 느껴지는지 판단하는 일이었다.

처음에는 결과가 마음에 들지 않으면 프롬프트를 고쳤다. 규칙을 더 구체화하거나 금지 규칙을 추가했다. 하지만 시간이 지날수록 프롬프트를 수정하는 것만으로는 충분하지 않다는 생각이 들었다. 어떤 결과가 좋은 문제인지, 어떤 결과가 나쁜 문제인지 판단하는 기준이 더 중요했다. 기준이 없으면 매번 사람이 감으로 보고 고쳐야 한다.

이 책은 신뢰성 개선 파트에서 심판형 LLM, 성찰, 의존성 주입, 프롬프트 최적화 같은 패턴을 다룬다. 제약 조건 해결 파트에는 성능 저하 테스트도 있다. 이 부분을 읽으면서 이 책이 “생성”만이 아니라 “생성된 결과를 어떻게 믿을 것인가”를 꽤 중요하게 다룬다는 느낌을 받았다.

내 경험에 대입하면, AI가 만든 실습 문제를 다시 평가하는 단계가 필요했다. 예를 들어 “실제 업무 상황이 드러나는가”, “사용자의 입력이 문제에 반영됐는가”, “실습 데이터가 충분한가”, “금지한 유형의 문제가 나오지 않았는가” 같은 기준이다. 이 기준을 사람이 매번 감으로 보는 게 아니라, 시스템 안에 넣을 수 있어야 제품으로 안정화될 수 있다. 책에서 말하는 신뢰성 개선 패턴은 이 지점을 정리하는 데 도움이 됐다.

신뢰성 개선과 성능 저하 테스트 관련 내용을 읽은 화면

마무리

책을 다 읽고 나니, 이 책은 단순한 AI 입문서나 프롬프트 작성법 책과는 거리가 있었다. 생성형 AI를 실제 서비스로 운영할 때 생기는 문제를 패턴 단위로 다루는 책에 가깝다. 그래서 처음부터 끝까지 순서대로 읽는 것도 가능하지만, 지금 만들고 있는 AI 기능에서 막히는 지점을 기준으로 필요한 패턴을 찾아 읽는 방식도 잘 맞아 보였다.

내가 AI 실습 문제 생성 기능을 만들면서 겪었던 문제도 결국 같은 방향이었다. 좋은 결과가 나오지 않을 때마다 프롬프트를 고치고 규칙을 추가했지만, 더 근본적으로는 맥락 공급, 금지 규칙, 품질 평가, 검증 루프가 필요했다. 이 책을 읽으면서 그 경험을 RAG, 신뢰성 개선, 가드레일, 성능 저하 테스트 같은 패턴으로 다시 정리할 수 있었다.

AI 기능을 빠르게 만드는 단계에서는 프롬프트와 데모가 중요하다. 하지만 오래 버티는 AI 시스템을 만들려면 그 뒤의 설계가 필요하다. 특히 AI로 무언가를 생성하는 제품을 만들고 있고, “결과는 나오는데 품질이 안정적이지 않다”는 고민을 해본 사람이라면 이 책에서 연결해볼 지점이 많을 것 같다.

#한빛미디어 #나는리뷰어다 #에이전트시대의AI시스템설계 #AI시스템설계 #RAG #가드레일 #AI에이전트

"한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬받아 작성된 서평입니다."

 

 

 책의 핵심 메시지

"그럴듯한 프로토타입은 누구나 만든다. 하지만 무너지지 않는 서비스는 '설계'에서 갈린다."

이 책은 LLM API를 붙여 데모를 만드는 시대를 지나, 그 데모를 실제 사용자에게 내보내는 '프로덕션'의 문턱에서 모두가 부딪히는 골짜기-환각, 매번 달라지는 응답, 지식 공백-를 정면으로 다룬다.

저자는 이 문제들을 "프롬프트를 더 잘 쓰면 된다"는 식으로 넘기지 않는다.

대신 시스템 설계의 문제로 격상시킨 뒤, 현업에서 반복적으로 마주치는 32가지 상황을 문제 정의 → 해결 방식 → 코드 예제 → 트레이드오프라는 일관된 형식의 '패턴'으로 정리한다.

책을 덮을 때쯤이면, 어떤 모델을 쓰든 흔들리지 않는 설계 원칙 한 묶음이 손에 쥐어져 있다.

 

 

 이 책이 좋은 이유

1. '패턴'이라는 형식의 힘 — GoF의 AI 버전

오래전 개발자들이 손에 들고 다니던 GoF 디자인 패턴서를 떠올리면 가장 가깝다. 모든 패턴이 동일한 구조로 서술되어, 정답을 외우는 게 아니라 판단의 좌표계를 얻게 된다. 덕분에 설계 회의에서 "지금 우리 RAG는 검색 품질 검증 단계가 비었으니 CRAG 패턴을 넣을지 보자"고 말할 팀 공용 언어가 생긴다.

 

2. RAG를 '검색 붙이기'에서 '아키텍처'로 끌어올린다

분량으로 보나 깊이로 보나 이 책의 심장은 RAG다. "임베딩 + 벡터DB"라는 흔한 한 줄 요약을 넘어, CRAG(검색된 문서 품질을 재검증), Self-RAG(모델이 스스로 근거가 충분한지 점검)까지 단계적으로 분화시킨다. 검색 결과 하나만 잘못 들어와도 답변 전체가 무너지던 고질병을 아키텍처로 푸는 방법을 보여준다.

 

3. "모델은 틀릴 수 있다"를 전제로 설계한다

심판형 LLM(LLM-as-a-Judge)과 성찰(Reflection) 패턴은 AI가 낸 답을 또 다른 AI가 평가하고 스스로 고치게 만든다. 그 밑에 깔린 "AI도 테스트의 대상"이라는 관점이 인상적이다. 기존 소프트웨어의 단위 테스트처럼, 생성형 AI를 검증 가능한 엔지니어링 안으로 끌어들인다.

 

4. 특정 모델·프레임워크에 종속되지 않는다

GPT든 클로드든 제미나이든, 랭체인이든 무엇이든 가리지 않는다. 무게중심을 구현이 아니라 설계 사고에 두었기 때문에, 코드 예제는 낡아도 패턴은 살아남는다. 변화 속도가 빠른 AI 환경에서 비교적 오래 참고할 수 있다는 게 가장 영리한 선택이다.

 

5. 가장 가려운 곳 — 신뢰성·안전·비용까지 챙긴다

후반부 9장의 가드레일은 프롬프트 인젝션 방어, 행동 제한, 자체점검을 다루며 "에이전트가 외부 도구를 쓰는 순간 보안은 곧 설계 문제가 된다"는 걸 체감시킨다. 8장에서는 소규모 언어 모델(SLM), 프롬프트 캐싱, 인퍼런스 최적화로 비용과 지연시간이라는 현실적 제약까지 놓치지 않는다.

 

 

 이런 사람에게 추천

  • LLM API는 이미 붙여봤고, 이제 진짜 서비스 구조를 고민하기 시작한 개발자
  • RAG를 단순 검색이 아니라 운영 수준의 아키텍처로 이해하고 싶은 엔지니어
  • 환각·비결정적 응답이 무서워 배포 직전에 멈춰 서본 적 있는 사람
  • 모델과 도구가 바뀌어도 오래 통하는 설계 원칙을 손에 쥐고 싶은 사람
  • AI 도입의 방향을 판단해야 하는 아키텍트·기술 리더·PM·CTO
  • AI 에이전트 트렌드를 흥분이 아니라 견고한 시스템 설계 역량으로 바꾸고 싶은 사람

 

 

 이런 사람에게는 조금 어려움

  • LLM을 한 번도 다뤄본 적 없는 완전 입문자 (1장 '서론'부터 Temperature·LoRA·RLHF가 빠르게 지나간다. 사실상 압축된 AI 개론이라 초반 진입 장벽이 높다)
  • 코딩 없이 'AI 활용법'만 알고 싶은 라이트 유저 (이 책은 활용서가 아니라 명백히 개발·설계자를 위한 설계서다)
  • 책의 코드를 그대로 베껴 바로 돌아가길 기대하는 사람 (MCP·에이전트 프레임워크는 변화가 빨라 예제는 금세 낡는다. 깃허브 저장소 병행이 사실상 필수다)
  • "버튼만 누르면 끝"인 A-Z 완성형 튜토리얼을 기대하는 사람 (어디까지나 방향성과 인사이트가 핵심인 책이다)

 

 

 총평

이 책의 미덕은 "AI를 써보는 단계에서 AI로 시스템을 설계하는 단계로 데려다 준다"는 점이다.

시중의 AI 책 상당수가 "이런 게 가능해요!"에서 멈추는 반면, 이 책은 출력 형식 제어부터 RAG 고도화, 신뢰성 검증, 다중 에이전트 협업, 비용 최적화, 가드레일까지 프로덕션을 떠받치는 전 과정을 32개의 이름 붙은 패턴으로 촘촘히 안내한다.

 

특히 인상 깊었던 건 두 가지다.

첫째, 관점의 전환. "모델은 틀릴 수 있다"를 전제로 시스템을 설계한다는 한 문장이, 배포를 망설이던 마음의 매듭을 풀어줬다.

둘째, 레퍼런스로서의 가치. 쉽게 읽히는 책은 아니다. 하지만 생성형 AI 정보가 사방에 흩어진 지금, 책상 옆에 꽂아두고 설계 회의 전에 꺼내 보게 될 그런 책이다.

 

앞으로의 경쟁력은 "얼마나 큰 모델을 쓰느냐"가 아니라 "그 모델을 얼마나 신뢰할 수 있는 시스템으로 엮어내느냐"에서 갈린다. AI 도구에 어느 정도 익숙해진 분이라면, 이 책으로 분명히 한 단계 더 나아갈 수 있다.

한빛미디어 서평단 활동으로 '에이전트 시대의 AI 시스템 설계'를 읽었습니다. 최근 생성형 AI는 단순한 질의응답 도구를 넘어 스스로 판단하고 작업을 수행하는 방향으로 빠르게 발전하고 있습니다. 이제 AI는 단순히 답변을 생성하는 모델이 아니라, 실제 업무를 처리하고 여러 시스템과 연동하며 문제를 해결하는 에이전트 형태로 진화하고 있습니다. 기업 입장에서도 AI를 어떻게 사용할 것인가보다, 어떻게 시스템 안에 녹여내고 운영할 것인가가 더 중요한 과제가 되고 있습니다. 그런 흐름 속에서 이 책은 AI 에이전트 시대에 필요한 시스템 설계 관점을 정리해주는 책입니다.

이 책은 AI 에이전트를 단순한 새로운 기술 트렌드로 소개하지 않습니다. 오히려 에이전트가 실제 시스템 안에서 어떤 구조로 동작해야 하는지, 어떤 요소를 고려해 설계해야 하는지를 중심으로 설명합니다. 프롬프트나 모델 사용법 같은 단편적인 기능 설명보다, 에이전트의 역할 분리와 작업 흐름, 메모리 구조, 도구 연동, 상태 관리, 오케스트레이션 같은 시스템 수준의 내용을 다룹니다. 덕분에 AI 기능을 단순히 붙여보는 수준이 아니라, 운영 가능한 서비스 구조로 바라보게 만듭니다.

기존에 읽었던 'LLM 엔지니어링'이나 'AI 엔지니어링'이 AI 시스템의 전반적인 구조와 운영 관점을 설명했다면, 이 책은 그 연장선에서 에이전트 중심 시스템이라는 보다 구체적인 방향을 제시합니다. 또한 'LLM 서비스 설계와 최적화'가 서비스 구조와 품질에 집중했다면, 이 책은 여러 AI 기능과 외부 시스템이 협업하는 구조를 어떻게 만들어야 하는지에 초점을 맞춥니다. 결국 AI가 단독 모델로 움직이던 시대에서, 여러 기능과 역할이 연결된 에이전트 시스템 시대로 넘어가는 흐름을 이해하게 해주는 책입니다.

이 책의 가장 큰 특징은 특정 모델이나 프레임워크 사용법보다 설계 사고를 강조한다는 점입니다. 최근 AI 관련 책들이 특정 라이브러리나 개발 도구 중심으로 설명하는 경우가 많은데, 이 책은 기술 자체보다 왜 그런 구조가 필요한지에 더 집중합니다. 에이전트를 어떻게 나눌 것인지, 어떤 방식으로 협업하게 만들 것인지, 상태와 컨텍스트는 어떻게 유지할 것인지처럼 실제 시스템 설계 과정에서 고민해야 할 문제를 다룹니다. 덕분에 기술 변화 속도가 빠른 AI 환경에서도 비교적 오래 참고할 수 있는 내용이 많습니다.

이 책은 단순한 AI 입문서라기보다 실무 관점의 설계서에 가깝습니다. 따라서 AI를 처음 접하는 독자보다는, 생성형 AI를 실제 서비스나 업무 시스템에 적용하려는 개발자와 아키텍트, 기술 기획자에게 더 잘 맞습니다. 특히 기업 환경에서 AI 도입을 고민하는 사람이라면, 단순한 PoC를 넘어 운영 가능한 구조를 고민하게 만든다는 점에서 도움이 됩니다. AI가 단독 기능이 아니라 하나의 시스템으로 동작해야 한다는 관점을 이해하는 데 유용한 책입니다.

'에이전트 시대의 AI 시스템 설계'는 AI를 단순한 기능이 아니라 시스템으로 바라보게 만드는 책입니다. 생성형 AI가 빠르게 보급된 지금, 앞으로의 경쟁력은 모델 자체보다 이를 어떻게 연결하고 설계하는가에서 결정될 가능성이 큽니다. 그런 점에서 이 책은 에이전트 시대의 AI 시스템이 어떤 방향으로 발전해야 하는지 고민하는 사람에게 좋은 길잡이가 되는 책입니다. 단순히 AI를 써보는 수준을 넘어, 실제 서비스와 비즈니스 안에 녹여내고 싶다면 읽어볼 가치가 충분한 책입니다.

한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다.

 

https://spems.tistory.com/entry/에이전트-시대의-AI-시스템-설계-LLM으로-사칙연산-하기

 


 

배경

난 평소에 오픈소스 모델을 활용해보고 싶었다. 요즘 다들 누가 더 돈 많이 쓰는지 경쟁하는 느낌이라, 속세의 경쟁에서 벗어나 자연에서 힐링하는 느낌이었다.

 

실습: 사칙연산 계산기

LLM은 확률적 언어 모델이라, 일반적으로 이런 결정론적인 작업을 맡기는 것은 일반적이지 않다. 하지만 견고한 멀티 에이전트 시스템을 만들려면 이러한 기능이 필요하다고 생각했다. 그 시작은 단순한 계산기를 만드는 것이었다.

 

1. 출력 형식 강제

연산 결과를 문자열이 아닌, 수의 형태로 나타내고 싶었다. 책의 2장 '콘텐츠 스타일의 제어'에는 이와 관련된 내용이 있는데, 특히 2.2절 '문법'에서 옵션3 '사용자가 지정한 스키마 사용' 방식은 내가 사용하는 Ollama 인퍼런스 엔진에서 손쉽게 구현할 수 있었다.

 

2. 도구 호출

막상 대충 구현해놓고 보니까, 조금만 케이스가 다양해져도 모델은 오답을 내놓았다. 모델이 선택할 수 있는 경우를 구조적으로 줄여나가야 한다고 생각했다. 7장 '에이전트의 행동 능력 활성화' 중 7.1절에서는 도구 호출과 관련된 내용을 다룬다. 마침 Ollama도 쉽게 도구를 호출할 수 있는 인터페이스를 제공하고 있었다. 만든 함수를 세션 맥락에 넘겨주기만 하면 됐는데, 인자의 순서를 뒤바꾸거나 적절한 값을 전달하지 못하는 등의 문제로 함수를 고치느라 시간이 걸렸다.

 

3. 시스템 프롬프트

나는 일반적인 수식에 대한 처리뿐만 아니라, 자연어 형태로 표현된 형태도 처리할 수 있길 원했다. 예를 들어, '4를 절반으로 나누면?'과 같은 문장에서 '4 / 2' 따라서 답은 '2'라는 결론을 도출할 수 있길 원했다. 자꾸 욕심이 커지다보니 유효하지 않은 입력에 대한 예외 처리도 생각했는데, '무한대 / 0'과 같은 사례는 None을 반환하길 원했다. 내가 처음에 사용한 모델은 llama-3.2로, 한글에 대한 학습을 하지 않은 모델이다. 따라서, 모델은 자연스럽게 오답을 반환하기도 했다.

5장에서는 '모델 능력 확장'에 대한 내용을 다루는데, 그 중 5.1절에서는 'LLM 추론의 한계'라고 해서, 모델이 이미 아는 지식과 모르는 지식이 있음을 설명한다. 가령, 우리가 업무에서 일반적으로 총칭하는 '도메인'과 관련된 내용은, 공개된 정보가 아니라면 모델의 학습 대상이 될 수 없다. 따라서, 프롬프트를 통해 그 정보가 무엇인지, 또 어떻게 다루어야 하는지 안내해주어야 한다. 2절과 3절에서 CoT, ToT도 소개하는데, 그렇게까지 복잡하게 들어갈 필요는 없어서, 실패한 테스트를 모두 통과하도록 프리티어 ChatGPT, Gemini를 활용해서 프롬프트를 수정했다.

 

4. 모델 선택 / 튜닝

책의 1.4절은 '세밀한 제어'에 대한 내용으로, 튜닝 가능한 대표적인 모델 파라미터에 대한 설명을 하고 있다. 모델의 추천 역시 Gemini의 조언을 받았다. llama3.2와 같은 모델은 애초부터 경량화가 목적이라 정확성을 보장하는 것이 쉽지 않고, 컴퓨팅 자원이 제한되어 있는 환경에서는 프론티어 모델 중 파라미터가 적은 것을 사용하면 정확도 측면에서 이점을 볼 수 있다고 했다. 실험 결과, 시간은 9배 더 소요됐지만 qwen은 주어진 테스트를 모두 완벽하게 처리했다. (물론 노트북 스펙이 좋지 못해 오버헤드가 포함된 결과이고, 순수하게 모델이 처리에 소요한 시간만 계산하면 3배 정도의 차이를 보인다.)

 

 

마치며

책은 전체적으로 패턴을 나열하는 형태라, 전형적으로 참조하고 활용하기 좋은 형태다. 참고할 수 있는 소스 코드도 함께 제공되었는데, 아무래도 인퍼런스 차이도 있고 내 프로젝트에 직접적으로 활용하기는 어려울 것 같아, 적극적으로 참고하지는 않았던 것 같다. 어디까지나 방향성과 인사이트가 핵심인 책이니, 당연히 A-Z식의 구현 예제를 기대하긴 어렵다. 번역도 특별히 어색한 부분 없이 잘 읽혔고, 참고할만한 내용들도 주석으로 제공되어서 어려움 없이 읽을 수 있었다.

자투리 시간을 들여 만지작거렸는데, langchain, langgraph 등 확실히 프레임워크가 없으니까 속도가 나지 않았던 것 같다. 그래도 패턴 22 '코드 실행', 패턴 16 '지시사항 진화' 느낌으로 발전시켜나가면 좋을 것 같다는 방향성은 잡혔다.

프리티어 기준으로는 ChatGPT보다 Gemini 성능이 평균적으로 더 좋다. 다음에는 Claude도 적극적으로 사용해볼 예정.

역자 '류광'님은 학부 때, 도널드 커누스 책에서 번역하신 것을 기억해서인지 다시 뵙게되어 반가웠다.

 

 

https://www.hanbit.co.kr/store/books/look.php?p_code=B4205161590

원제 'Generative AI Design Patterns'에서 알 수 있듯 여러가지 상황을 패턴으로 설명을 한다. 각각에 대해 문제 상황 -> 해결 방식 → 코드 예제 → 트레이드오프의 구조로 알려주며, 32가지 패턴이 나와서 분량도 많다. 개인적으로 책의 수준이 높아서 이해하기 쉽지 않았다. 한 번에 쉽게 읽히는 책은 아니다. 그럼에도 활용 가능성이 매우 높다고 생각한다.
이번에 고객사 관련 업무 준비를 하면서 이 책을 동시에 읽었는데, 중간중간 나오는 다이어그램과 설명을 조합해서 요구사항과 맞춰보니 기본적인 이해에도 도움이 되고, 무엇보다 빠진 부분과 논의할 부분을 도출하는 데 큰 도움이 되었다. 예를 들어 RAG 파이프라인이 색인 → 검색 → 생성같은 한 줄짜리 그림에서 끝나는 게 아니라, 색인 인식 검색, 노드 후처리, 신뢰할 수 있는 생성, 자기 RAG, 교정 RAG 같은 단계로 세분화되어 있다는 걸 다이어그램으로 보고 내용을 읽으면, 현재 작업에서 어느 부분에 뭐가 부족한가? 라는 생각을 자연스럽게 하게 된다.
이 책에서 가장 큰 비중을 차지하는 건 사실상 RAG라고 봐도 된다. 기본 RAG에서 시작해서 여러가지 세분화를 통해 단계적으로 확장한다. 기본적인 RAG 이외의 패턴/설계에 대해서는 잘 몰랐는데, 이번에 읽으면서 조금은 확장할 수 있게 되었다. 약 3년 전 일하던 곳에서 RAG를 활용해 실제 업무에 적용을 해봤었는데, 당시에는 검색 결과 하나만 잘못 만들어져도 답변 전체가 흔들리는 경우가 흔했다. 이런 문제를 이제는 아키텍처를 통해, 예를 들어 CRAG는 검색된 문서 자체의 품질을 다시 검증하고, Self-RAG는 모델이 스스로 “지금 답변 근거가 충분한가”를 점검하는 식으로 해결할 수 있다는 걸 알 수 있다. RAG를 “임베딩 + 벡터DB” 정도로만 알고 있던 나 같은 사람이라면 시야가 넓어질 거라고 생각한다.
내용이 쉽지 않다고 느껴지는 책이지만, 예전 GoF Design Pattern을 사용할 때를 생각해보면 이런 패턴들을 이용해 논의를 하고 합의를 이끌어낼 수 있다면 시간을 절약하고, 더 나은 품질의 산출물을 만들어내는 데도 도움이 될 것이다. 이 차이는 어떤 모델을 사용하느냐에도 있지만, 어떤 시스템을 어떻게 설계하느냐가 더 큰 차이를 주고, 이 책이 이런 방향으로 일하는 데 큰 도움이 된다고 생각한다.

 

https://www.hanbit.co.kr/store/books/look.php?p_code=B4205161590

"한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다."

"한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬받아 작성된 서평입니다."


"AI로 만든 서비스, 실제로 배포해도 될까?"
저는 AI 엔지니어로 취업을 준비하면서 부트캠프에서 LLM 기반 프로젝트를 진행했습니다.
데모할 때는 정말 그럴듯하게 작동했지만 실제 사용자에게 배포한다고 생각하면 솔직히 자신이 없었습니다.

같은 질문인데 답이 매번 달라지거나 답은 같아도 답변의 질이 다르거나, 없는 정보를 있다고 우기는 할루시네이션이 보이는 등 크고 작은 문제들을 찾아냈습니다.

"이게 내가 실제로 서비스라고 부를 수 있는 건가?"라는 생각이 계속 들었고, 저의 부족함을 느꼈습니다.

그리고 '에이전트 시대의 AI 시스템 설계' 책을 읽으면서 알게 됐습니다.

바로 설계의 문제였습니다.

'에이전트 시대의 AI 시스템 설계'는 바로 그 불편한 현실에서 출발합니다.

책의 서문은 이렇게 말합니다.

"이 책은 생성형 AI 모델 기반의 프로덕션 애플리케이션을 구축할 때 여러분이 마주할 이런 문제점들과 기타 여러 반복되는 문제들에 대한 모범관행과 해법을 담은 설계 패턴들을 소개한다"

서문의 이 한 문장은 제가 이 책을 읽게 만든 이유였습니다.

저자 발리아파 락슈마난과 하네스 하프케는 대규모 AI 시스템을 직접 배포한 현장 경험을 바탕으로, 프로토타입과 프로덕션 사이의 간극을 메우는 32가지 검증된 패턴을 9개 챕터에 걸쳐 정리했습니다.

이 책을 읽으면서 바로 머릿속에 떠오른 독자층은

첫 번째, AI 프로토타입은 있는데 실 서비스로 올리기가 어려운 개발자입니다.

API 연결해서 뭔가 그럴듯한 걸 만들어 봤는데, 막상 배포하려니 할루시네이션이 무서워서 망설이고 계신 분들은 패턴 '17: 심판형 LLM'과 '패턴 18: 성찰'을 통해 AI가 낸 답을 AI가 스스로 검증하고, 틀렸으면 스스로 수정하게 만드는 법을 알려줍니다.
심판형 LLM은 프롬프팅 접근법, 머신러닝 접근법, 미세조정 접근법을 소개함으로써 다양한 평가 방법들을 제시한다.
모델이 틀릴 수 있다는 걸 전제로 시스템을 설계하는 것, 그게 프로덕션 레벨 AI 엔지니어링의 시작입니다.

두 번째, 기업 내부 데이터를 AI에 연결하고 싶은 엔지니어입니다.
hallucination을 줄이기 위해 "내가 갖고 있는 자료를 AI가 참고해서 답해줄 수 없을까?"라는 고민을 해보신 분들도 있으실 거예요

이 책의 3~4장은 바로 그 문제를 해결하는 RAG(Retrieval-Augmented Generation, 검색 증강 생성)를 집중적으로 다룹니다.
3장은 기본적인 RAG에 대해 설명하고, RAG 파이프라인은 어떻게 해야 하는지 알려줍니다

단순한 Basic RAG(3장 패턴 6)부터, 더 정교한 검색이 필요한 상황에서의 심층 탐색 패턴 12까지. 자료, 내부 DB, 사내 자료를 AI가 실시간으로 참조해서 답하게 만드는 법을 단계별로 알려줍니다.

세 번째, AI 엔지니어를 목표로 준비하는 취업 준비생입니다.

면접관이 "AI 시스템 설계해 보신 적 있으세요?"라고 물었을 때 자신 있게 대답하고 싶은 분들입니다.

이 책은 OpenAI, Anthropic, Google, Meta 어떤 모델이든, LangChain, Pydantic AI, Hugging Face 어떤 프레임워크든 가리지 않는 다양한 예제를 담고 있습니다.

특정 회사 기술에 종속되지 않고 AI 시스템을 설계하는 사고방식 자체를 알려주기 때문에, 어떤 모델이 나오고 어떤 도구가 사라져도 오래 통하는 책입니다.

개인적으로 가장 인상 깊었던 부분은 9장의 패턴 32: 가드레일 였습니다.

가드레일이란 "시스템이 허용된 범위 내에서 작동하도록 보장함으로써 악의적인 행위자로부터 시스템을 보호하는 코드 모듈"을 얘기합니다

즉 AI가 위험하거나 잘못된 답변을 하지 못하도록 시스템 레벨에서 막는 안전장치를 구현하는 방법으로, 구글·아마존·메타 같은 빅테크에서 신뢰할 수 있는 AI 시스템 설계 능력을 중요하게 보는 이유를 이 챕터에서 제대로 이해할 수 있었습니다.

그리고 흐름들을 도식화를 통해 이해하기 쉽게 한 게 너무 좋았습니다.

이 책은 AI를 써보는 단계에서 AI로 실제 시스템을 만드는 단계로 넘어가고 싶은 모든 분들을 위한 가장 현실적인 책이라고 생각합니다.

프로토타입은 누구나 만들 수 있습니다.

하지만 실제로 돌아가는 AI 시스템을 설계할 수 있는 사람은 많지 않습니다.

그 차이를 만들어 주는 책, '에이전트 시대의 AI 시스템 설계' 추천합니다.

한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다.

 

 

AI를 많이 활용하고 있지만, 아직도 AI의 제성능을 10%도 제대로 쓰고 있지 못한 것 같다.

이 책을 읽게된 이유도 책소개에서 말한 내용이 와닿았기 때문이었다. 그럴듯한 프로토타입은 금방 만들지만 완성도 있는 서비스를 만드는 것은 매우 어려워서이다.

이 책은 사실상 거의 개발자를 타겟으로 쓰여졌다. 나는 개발자는 아니지만 AI를 더 잘 활용하고 싶고, 언젠가 나만의 소프트웨어를 만들고 싶다. 아직은 간단한 프로젝트를 계획하고 만들 때도 사소한 문제가 발생할 때마다 해결하는데 너무 오래걸린다.

이 책은 프로덕션을 만들 때 나타나는 문제들을 해결하는데 도움이 되는 실전 설계 패턴 32가지를 제공한다.

결론부터 말하자만 책의 수준이 상당히 높아 이해하기 좀 어렵다. 초반부터 RAG, 로짓, 청크와 같은 인공지능과 관련된 전문 용어들이 나오면서 책의 내용을 이해하기가 쉽지 않다. 그럼에도 꿋꿋하게 읽어보면 생성형 AI의 기본 원리를 배우는데 도움이 된다. 또한 모든 것이 개발자 위주로 설명하는 것은 아니다. 기본적인 설명 구조가 AI의 기본 원리를 바탕으로 문제에 대한 해결 방법을 제시하기 때문에 AI 애플리케이션을 구축하는 PM이라면 알아야할 지식들이 충분히 담겨 있다.

이 책이 내게 어렵게 느껴진다는 것은 어딘가에는 이것을 이해하고 활용하는 상급 개발자들이 우리와 같은 생성형 AI를 사용하면서도 더 훌륭한 결과물을 얻는다는 말이 아닌가 싶다. 결국 미래에는 AI를 현재보다 더 많이 활용할 수 밖에 없고 그렇다면 배경지식을 더 쌓아서 AI 활용 능력을 높여야 살아남을 수 있지 않을까 싶다.

한빛미디어 서평단 <나는 리뷰어다> 활동을 위해서 책을 협찬받아 작성된 서평입니다


 

에이전트 시대의 AI 시스템 설계

 

 

최근 정보기술(IT) 업계를 바라보고 있으면 거대한 패러다임의 전환 한복판에 서 있다는 사실을 온몸으로 실감하게 됩니다. 생성형 AI의 등장 이후 우리는 매일같이 쏟아지는 새로운 모델과 기법의 홍수 속에 살고 있지요. 하지만 현업에서 이를 활용해 실제 비즈니스에 가치를 더하는 애플리케이션을 구축하려고 하면, 기술의 화려함 이면에 숨겨진 수많은 현실적 장벽과 마주하게 됩니다. 환각 현상을 어떻게 제어할 것인가, 예측 불가능한 거대 언어 모델의 출력을 어떻게 기존 시스템과 안정적으로 연동할 것인가와 같은 고민들 말입니다. '에이전트 시대의 AI 시스템 설계'는 바로 이러한 지점에서 방황하는 엔지니어와 설계자들에게 명확한 이정표를 제시해 주는 책입니다. 단순히 프롬프트를 잘 쓰는 요령을 알려주는 시중의 가벼운 지침서들과는 궤를 달리하며, AI를 견고한 소프트웨어 공학의 영역으로 끌어올리는 묵직한 내공이 돋보입니다.

이 책이 지닌 가장 독보적인 가치는 거대 언어 모델이라는 원시적인 재료를 가지고 어떻게 실무에서 작동하는 안전하고 확장 가능한 에이전트 시스템을 '빌드'할 수 있는지 그 아키텍처 패턴을 집대성했다는 점에 있습니다. 로짓 마스킹이나 문법 제어 같은 텍스트 스타일링의 기본기부터 시작해서, 검색 증강 생성(RAG)의 기초와 심화 과정을 거쳐, 종국에는 다중 에이전트 협업과 장기 기억 시스템 구축에 이르기까지 그 여정이 무척이나 촘촘합니다. 흔히 AI 시스템을 만든다고 하면 거대한 모델 자체를 학습시키는 일에만 주목하기 쉽지만, 이 책은 그 모델이 현실 세상의 API를 호출하고 코드를 실행하며 안전하게 행동할 수 있도록 만드는 '시스템적 안전장치'와 '컨텍스트 제어'가 왜 더 중요한지 집요하게 파고듭니다. 기술의 표면적 현상에 매몰되지 않고 시스템 전체를 관통하는 설계 원칙을 다룬다는 점에서, 읽는 내내 노련한 아키텍트의 깊이 있는 통찰력을 고스란히 느낄 수 있었습니다.

특히 페이지를 넘기며 무릎을 탁 치게 만들었던 부분은, 이론적인 아키텍처 패턴의 나열에 그치지 않고 개발자가 현업에서 즉시 활용할 수 있는 구체적인 예시 코드를 아낌없이 제공한다는 점이었습니다. 추상적인 다이어그램 몇 장으로 '이렇게 설계하면 됩니다'라고 말하는 책들은 많지만, 이 책은 그 설계가 실제 애플리케이션 레벨에서 어떻게 구현되는지 코드를 통해 직접 증명해 보입니다. 사고 연쇄(CoT)나 심판형 LLM, 프롬프트 캐싱과 가드레일 같은 고난도 기법들이 소스 코드 안에서 어떻게 유기적으로 맞물려 돌아가는지 눈으로 확인하는 과정은 대단히 짜릿한 경험이었습니다. 덕분에 모호하게 구름 위에 떠 있던 에이전트형 작업흐름의 개념이 단숨에 현실의 영역으로 내려와 명쾌하게 이해되었습니다.

결국 이 책이 우리에게 던지는 메시지는 명확합니다. 앞으로의 AI 애플리케이션 개발은 얼마나 더 큰 모델을 쓰느냐의 싸움이 아니라, 주어진 모델의 능력을 확장하고 제약 조건을 극복하며 얼마나 신뢰할 수 있는 '에이전트형 작업흐름'을 촘촘하게 설계하느냐의 싸움이 될 것이라는 점입니다. 소규모 언어 모델의 최적화나 성능 저하 테스트, 인퍼런스 비용을 아끼기 위한 캐싱 전략까지 다루는 후반부를 읽다 보면, 저자가 실제 프로덕션 환경에서 수많은 시행착오를 겪으며 쌓아 올린 실전 노하우가 그대로 전해집니다. AI를 다루는 엔지니어뿐만 아니라 차세대 서비스 아키텍처를 고민하는 모든 기술 리더들에게 이 책은 훌륭한 길잡이가 되어줄 것입니다.

우리가 만드는 시스템은 과연 변화하는 AI 패러다임 수용할 만큼 유연하고, 동시에 비즈니스의 엄격한 기준을 만족할 만큼 통제 가능한 구조를 갖추고 있을까요? 단순히 신기한 기술을 구현하는 것을 넘어, 비즈니스를 실제로 움직이는 '살아있는 에이전트 시스템'을 설계하기 위해 우리는 지금 무엇을 준비해야 할지 진지하게 고민해보게 됐습니다.

오늘날 LLM API를 붙이는 건 이제 예전처럼 어렵지 않습니다. 문제는 그다음입니다.
응답 형식을 어떻게 할지, 회사 자료를 어떻게 연결할지, 환각(hallucination)을 어떻게 줄일지, 비용과 지연 시간을 어떻게 관리할지. MVP가 아닌 실제 서비스 단계로 들어가면 프롬프트 몇 줄로 해결되지 않는 문제들이 참 많습니다.


제가 본 '에이전트 시대의 AI 시스템 설계'는 바로 그 부분을 생각하게 되는 책입니다.


이 책은 부제처럼 RAG, 최적화, 가드레일을 중심으로 생성형 AI 시스템을 프로덕션 환경에서 어떻게 설계할지 봅니다. 일반적인 “LLM 활용법”이 아니라, 반복적으로 마주치는 문제를 패턴 단위로 정리한 설계서에 가까운 편입니다.


 

어떤 책인가

 

원제는 『Generative AI Design Patterns』.
O’Reilly 원서를 번역한 책으로, 발리아파 락슈마난과 하네스 하프케가 썼습니다.
책은 전통적인 디자인 패턴 책과 비슷합니다. 생성형 AI 시스템에서 반복적으로 등장하는 문제를 패턴으로 정리하고, 각 패턴마다 문제 상황 → 해결 방식 → 코드 예제 순서로 설명합니다.
솔직히 분량도 꽤 되고 내용도 가볍지 않습니다. 대신 “AI 서비스를 실제로 굴릴 때 무엇을 고민해야 하는가”를 비교적 체계적으로 묶어둔 책이라는 점이 좋습니다.

 


 

‘서론’인데 사실은 압축된 AI 개론

 

첫 장부터 꽤 밀도가 높습니다.
Temperature, Top-K, Top-P 같은 생성 제어 방식부터 에이전트 개념, 컨텍스트 학습, LoRA, RLHF까지 빠르게 훑고 지나갑니다. AI 관련 배경지식이 전혀 없다면 초반 진입 장벽이 높게 느껴질 수 있습니다. 그래도 무난히 읽을 수준은 됩니다.

 

에이전트 개념을 재고 관리로 비유하는데, 기존 소프트웨어는 “재고가 일정 수치 이하이면 주문” 같은 규칙을 사람이 직접 작성해야 하지만, 에이전트는 역할과 목표만 주고 판단 과정은 모델이 스스로 구성한다고 설명해줍니다.

 

 

요즘은 종이책을 갖고 다니기 너무 무거워서 노트북이나 아이패드로 읽는 편입니다. 아직은 종이책의 그 느낌을 따라가지 못하지만 여러가지 이 것만의 장점도 많아서 뭐가 딱 하나만 좋다라고 하기도 그렇네요.

 

 

“왜 에이전트가 기존 자동화와 다른가”를 꽤 직관적으로 보여줍니다.
LoRA 설명도 좋았습니다. 원본 모델 전체를 다시 학습하는 대신 작은 어댑터만 추가로 학습한다는 개념을 “건물 전체를 다시 짓는 대신 필요한 층만 리모델링한다”는 식으로 풀어내는데 이해가 쉬웠습니다.

 


 

출력 형식을 통제하는 방법

 

생성 결과를 어떻게 안정적으로 다룰지도 다루는데요.
실무에서 LLM을 써보면 가장 먼저 부딪히는 문제 중 하나가 “응답 형식이 매번 달라진다”는 점입니다. 사람이 읽을 때는 자연스럽지만, 후속 코드가 처리하기엔 꽤 까다롭습니다.
책에서는 로짓 마스킹, 문법 기반 출력 제한, 스타일 전이 같은 패턴을 소개합니다.
특히 JSON 스키마를 강제로 맞추는 방식이나 구조적 출력 패턴은 실무에서 바로 활용 가능한 내용이 많았습니다. 단순히 프롬프트를 잘 쓰는 수준이 아니라, 시스템 차원에서 출력 안정성을 확보하려는 접근이 반복해서 등장합니다.

 


 

RAG는 ‘검색 붙이기’ 이상이다

 

RAG는 사실상 책의 중심이라는 생각이 듭니다. 기본적인 RAG 구조부터 시작해서 재순위화, 메타데이터 필터링, GraphRAG, CRAG, Self-RAG까지 단계적으로 확장됩니다.
재밌던 건 RAG를 단순한 벡터 검색 문제가 아니라 “아키텍처 문제”로 다룬다는 점입니다.
예를 들어 CRAG는 검색된 문서 자체의 품질을 다시 검증하고, Self-RAG는 모델이 스스로 “지금 답변 근거가 충분한가”를 점검합니다.
실제로 RAG 시스템을 운영해보면 검색 결과 하나만 잘못 들어와도 답변 전체가 흔들리는 경우가 많은데, 그런 현실적인 문제를 꽤 잘 짚습니다.
RAG를 “임베딩 + 벡터DB” 정도로만 생각했던 사람이라면 시야가 넓어질 것이라 생각됩니다.

 


 

CoT와 추론 패턴

 

Chain of Thought. “단계별로 생각해봐” 같은 프롬프트가 왜 성능 차이를 만드는지 예시로 설명합니다.
항공 수하물 계산처럼 조건이 복잡한 문제에서, 예시 몇 개만 보여줘도 모델의 추론 방향이 꽤 안정적으로 바뀌는 과정을 볼 수 있습니다.
읽다 보면 프롬프트 엔지니어링이 단순 말재주가 아니라, 모델의 추론 경로를 유도하는 작업이라는 게 체감됩니다.

 


 

검증 레이어와 심판형 LLM

 

AI 결과물을 다시 AI가 평가하는 구조.
LLM-as-a-Judge 개념인데, 대량 생성 결과를 사람이 전부 검수하기 어려운 상황에서 1차 품질 필터 역할을 맡기는 방식입니다.
흥미로웠던 건 “AI도 테스트 대상”이라는 관점입니다. 기존 소프트웨어처럼 assertion을 두고, 최소 기대 품질을 만족하는지 자동 검증하는 흐름이 소개됩니다.
생성형 AI를 기존 소프트웨어 엔지니어링 방식 안으로 끌어들이려는 시도가 계속 보입니다.

 


 

에이전트와 가드레일

 

후반부에서는 도구 호출, MCP, 프롬프트 주입 공격 같은 주제가 등장합니다. 특히 프롬프트 인젝션 방어를 실제 운영 환경에서 어떤 가드레일이 필요한지 설명합니다.
행동 제한, 계획 후 실행, 맵-리듀스 기반 처리 같은 방식들이 소개되는데, “에이전트가 외부 도구를 쓰기 시작하면 보안 문제가 바로 시스템 설계 문제로 이어진다”는 걸 실감하게 됩니다.

 


 

비용 최적화

 

모델 증류, 양자화, 확장성 테스트. 
“모든 요청에 거대 모델을 쓰지 말라”는 관점이 현실적입니다.
실서비스에서는 결국 비용과 응답 속도가 중요해지는데, 책은 작은 모델과 큰 모델을 어떻게 역할 분담할지까지 포함해서 설명합니다.
양자화 설명도 꽤 직관적입니다. 메모리 사용량이 얼마나 줄어드는지 수치로 보여줘서, 왜 많은 서비스가 INT8·4bit 같은 방식을 쓰는지 이해하기 쉬웠습니다.

 


 

진입 장벽은 분명히 있음

 

AI를 처음 접하는 독자에게는 초반부터 용어 밀도가 높습니다. 어느 정도 LLM API를 써본 경험이 있는 개발자를 대상으로 한 책에 가깝습니다.
번역이 매끄럽게 느껴지지 않은 부분도 조금 보이네요. 문장이 길게 이어지는 부분이 종종 있어서 읽는 흐름이 끊길 때가 있습니다.
그리고 코드 예제는 빠르게 낡을 가능성이 큽니다. MCP나 랭체인 계열은 변화 속도가 워낙 빨라서, 책만 따라가기보다 깃허브 예제와 함께 보는 게 사실상 필수에 가깝습니다.

 


 

이런 분에게 추천

 

  • LLM API는 이미 붙여봤다
  • 이제 실제 서비스 구조를 고민하고 있다
  • RAG를 운영 수준에서 이해하고 싶다
  • 응답 품질·안전성·비용 문제를 함께 다루고 싶다

 

이런 상황이라면 꽤 도움이 됩니다.
반대로 “AI를 처음 공부한다”, “코딩 없이 AI 툴 활용법이 궁금하다”에 가까우면 다른 입문서가 더 맞을 수 있습니다.

 


 

괜찮은 레퍼런스

 

생성형 AI는 이제 단순 기능 추가 수준을 넘어가고 있습니다.
API 하나 연결하는 것보다 더 어려운 건, 그 모델이 안정적으로 동작하는 시스템을 만드는 일입니다. 출력 형식, 검색 구조, 검증, 비용, 보안까지 모두 함께 설계해야 하니까요.
이 책은 그 문제들을 “패턴”이라는 형태로 정리해둔 책입니다.
쉽게 읽히는 책은 아닙니다. 대신 지금처럼 생성형 AI 관련 정보가 흩어져 있는 시점에서는, 꽤 괜찮은 레퍼런스 역할을 해주는 책이라는 생각이 들었습니다.



 

사진 삭제

AI 활용 설정

사진 설명을 입력하세요.

 

요즘 생성형 AI에 대한 관심이 높아지면서, 단순히 ChatGPT를 사용하는 것을 넘어 실제 서비스나 업무에 어떻게 적용할 수 있을지 궁금해졌다.

그런 관점에서 읽어본 책이 '에이전트 시대의 AI 시스템 설계' 이다.

대표사진 삭제

대표사진 삭제

AI 활용 설정

사진 설명을 입력하세요.

사진 삭제

사진 삭제

AI 활용 설정

사진 설명을 입력하세요.

솔직히 말하면 내 기준에서는 조금 어려운 책이었다. 생성형 AI에 관심이 있어서 읽기 시작했지만, 막상 내용을 따라가다 보니 단순한 입문서라기보다는 실제 AI 애플리케이션 개발이나 서비스 설계를 염두에 둔 책에 가까웠다. RAG, 임베딩, 벡터 검색, 에이전트, 툴 호출, 가드레일, 추론 최적화 같은 개념들이 계속 등장하기 때문에 관련 배경지식이 많지 않다면 한 번에 술술 읽히는 책은 아니었다.

사진 삭제

사진 삭제

AI 활용 설정

사진 설명을 입력하세요.

그럼에도 이 책이 도움이 되었던 이유는, 생성형 AI를 실제 서비스로 만들 때 어떤 문제들이 생길 수 있는지 대략적으로나마 알 수 있었기 때문이다. 평소에는 AI 모델이 답변을 잘 생성하는지만 보게 되지만, 실제 애플리케이션을 개발한다고 생각하면 고민해야 할 지점이 훨씬 많다. 최신 정보를 어떻게 반영할지, 잘못된 답변이나 환각을 어떻게 줄일지, 답변의 신뢰성을 어떻게 검증할지, 비용과 응답 속도는 어떻게 관리할지 같은 문제들이 계속 따라온다.

 

이 책은 그런 상황들을 디자인 패턴이라는 방식으로 나누어 설명한다. 그래서 모든 내용을 완벽히 이해하지는 못했더라도, 아, 실제 AI 서비스를 만들 때는 이런 문제들이 발생할 수 있구나, “이런 식으로 접근하면 해결의 실마리를 찾을 수 있겠구나” 하는 감을 얻을 수 있었다. 특히 RAG와 신뢰성, 가드레일 관련 내용은 인상 깊었다. 단순히 문서를 검색해서 답변하게 하는 수준을 넘어, 검색 품질과 검증, 예외 처리까지 함께 고려해야 한다는 점이 기억에 남았다.

 

물론 생성형 AI를 처음 접하는 사람에게 바로 추천하기에는 난이도가 있는 편이다. 기본 개념을 어느 정도 알고 있거나, 실제로 AI 서비스를 만들어보고 싶은 개발자, 기획자, PM이라면 더 많은 것을 얻을 수 있을 것 같다. 나에게는 쉽지 않은 책이었지만, 오히려 생성형 AI 애플리케이션을 개발할 때 필요한 고민들을 미리 들여다볼 수 있었다는 점에서 의미가 있었다.

 

결론적으로 가볍게 읽는 입문서라기보다는, 생성형 AI를 실무와 설계의 관점에서 바라보게 해주는 책이다. 읽는 과정은 조금 어려웠지만, 실제 AI 애플리케이션을 만들 때 마주할 수 있는 상황과 그에 대한 해법을 대략적으로나마 이해할 수 있어 도움이 되었다. 생성형 AI를 단순한 유행이 아니라 실제 서비스로 연결해보고 싶은 사람이라면 한 번쯤 읽어볼 만한 책이다.

 

 

한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다.



생성형 AI 관련 책들은 많지만, 대부분 특정 도구 사용법이나 간단한 구현 위주로 끝나는 경우가 많았습니다. 그런데 이 책은 단순히 “AI를 사용하는 방법”이 아니라 실제 서비스 수준의 AI 시스템을 어떻게 설계해야 하는지를 구조적으로 설명해준다는 점이 특히 좋았습니다.

RAG, 도구 호출, 다중 에이전트, 장기 기억, 프롬프트 최적화, 가드레일 같은 개념들을 각각 따로 설명하는 것이 아니라 하나의 AI 시스템 흐름 안에서 연결해서 보여준다는 점이 인상 깊었습니다. 특히 “프로토타입은 쉽지만 프로덕션은 어렵다”는 메시지가 책 전체를 관통하는데, 실제로 AI 서비스를 만들어보려는 개발자라면 공감할 부분이 정말 많을 것 같습니다.

개인적으로는 RAG와 도구 호출, 프롬프트 최적화 파트가 특히 도움이 많이 되었습니다. 단순히 개념 설명으로 끝나는 것이 아니라 왜 필요한지, 어떤 문제를 해결하기 위한 패턴인지까지 함께 설명해줘서 공부 방향을 잡는 데 큰 도움이 되었습니다.

생성형 AI를 단순히 체험하는 수준에서 넘어가 실제 서비스와 시스템 관점으로 바라보고 싶은 개발자, 전공자, 현업 엔지니어에게 추천하고 싶은 책입니다.

더 자세한 리뷰:
https://mkisos.tistory.com/1350

리뷰쓰기

닫기
* 상품명 :
에이전트 시대의 AI 시스템 설계
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
에이전트 시대의 AI 시스템 설계
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
에이전트 시대의 AI 시스템 설계
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 적립금 500P를 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?