최근 몇 년 동안 AI는 놀라운 성능을 보여주고 있습니다. 이제는 누구나 LLM을 활용해 AI 에이전트를 만들거나 업무를 자동화할 수 있죠. 새로운 서비스도 끊임없이 등장하고 있습니다. 또한 기존 AI 서비스의 새 버전이 발표될 때마다 사용자들은 다른 서비스와 성능을 비교하며 놀라운 결과물에 열광합니다. 이런 열기 속에서 저는 한 가지 궁금증이 생겼습니다.
“AI 에이전트가 결과물을 만들어 내기까지 그 내부에서는 어떤 일이 일어나는 걸까?”

AI 에이전트를 사용하면 할수록, 긴 문맥을 이해하는 LLM의 원리가 알고 싶어졌습니다. 얼핏 보면 사용자의 질문에 따라 적절한 답변을 능숙하게 내놓는 모습이 마치 마법과도 같이 느껴지는데, 대체 그 답변이 나오기까지 어떤 과정을 거치는지 궁금해진 것입니다.
그렇게 LLM의 원리를 찾아보다 보니 트랜스포머 아키텍처가 LLM의 뼈대가 되는 구조라는 것을 알게 되었습니다. 트랜스포머 내부에는 어텐션, 셀프 어텐션, 멀티 헤드 어텐션 같은 다양한 개념이 있었고, 제 의문은 꼬리에 꼬리를 물고 이어졌습니다. 하지만 관련 내용을 찾아보면, 대부분의 설명은 단순히 ‘이렇게 해야 성능이 좋아진다’는 수준에 그치는 경우가 많았습니다.
저는 여러 궁금증을 해결하기 위해 LLM과 관련된 논문을 찾아보기 시작했습니다. 그런데 논문의 특성상 자세한 설명이 생략되는 경우가 많아 직관적으로 이해하기는 어려웠습니다. 그래서 논문만으로는 이해하기 힘든, 생략된 과정 하나하나를 풀어가면서 수식과 함께 정리해 나가기 시작했습니다. LLM과 관련된 논문이 워낙 많고 다양한 방법론을 조사하다 보니 그 양이 방대했습니다. 그래서 책을 집필할 때는 LLM의 발전 과정에서 반드시 이해하고 넘어가야 하는 부분을 위주로 다루었습니다.

트랜스포머 내부 구조는 매우 복잡합니다. LLM이 답변을 생성하기까지 트랜스포머 내부에서는 기본적으로 행렬을 기반으로 여러 연산을 수행하는데, 이 과정이 워낙 까다로워서 어떻게 하면 독자님들께 효율적으로 설명할 수 있을지 고민했습니다. 그러던 중 이 과정을 행렬로 시각화해서 설명하는 것이 단순히 텍스트를 활용한 설명보다 직관적이라고 생각했고, 여러 가지 행렬 연산을 그림으로 표현하는 데 집중했습니다.
저는 지금까지 다양한 책을 집필하면서 그림을 통한 설명을 중요하게 여겨 왔고, 개인적으로도 그림을 활용한 설명을 좋아합니다. 그래서 이전 도서인 『한 권으로 배우는 도커&쿠버네티스』에서도 쿠버네티스의 내부 구조를 상세히 그리면서 작동 원리를 설명했습니다. 이번 책에서도 트랜스포머 내부 구조를 최대한 상세히 묘사하자는 생각으로 그림 작업에 공을 들였습니다.
특히 이번에는 정말 많은 행렬을 그렸는데, 그중에서도 구성 요소를 하나하나 개별 객체로 표현한 작업이 기억에 남습니다. 행렬의 특성에 따라 내부에 들어가는 색도 서로 다르게 설정했고, 수많은 색 가운데 어떤 것을 골라야 원리를 이해하는 데 도움이 될지 깊이 고민했습니다. 그 과정에서 색에 대한 공부도 많이 하게 되었는데, 힘든 만큼 무척 재미있었습니다.

어떤 분들은 AI의 도움을 받으면 빨리 그릴 수 있지 않느냐고 말하기도 했지만, 제가 표현하고자 하는 것이 100이라고 했을 때 AI를 활용해서는 100을 온전히 담아내기 어렵다고 보았습니다. 그렇게 되면 책을 읽는 분 입장에서도 이해도가 떨어질 수밖에 없습니다. 결국 책에 들어가는 그림은 모두 제가 직접 그렸습니다.
이번 책은 지금까지 제가 출간한 책 중에서 그림 작업에 가장 많은 시간을 들인 작업이었습니다. 그림을 힘들게 그린 만큼, 책을 펼쳐 결과물을 볼 때마다 뿌듯함이 느껴집니다. 이 노력이 독자님들께서 트랜스포머 아키텍처를 이해하시는 데 도움이 되면 좋겠습니다.

시중에는 LLM을 활용하는 방법을 안내하는 책이 많습니다. 하지만 저는 단순 활용법을 넘어, LLM이 어떻게 사용자가 입력한 긴 문맥을 이해하는지, 다수의 헤드를 사용하는 이유는 무엇인지, Query·Key·Value가 왜 필요한지 같은 내부 작동 원리에 대한 궁금증을 해결할 수 있는 책을 만들고 싶었습니다. 사실 지금까지 제가 집필해 온 책들은 대부분 내부 원리 설명에 집중해 왔고, 이번 책에서도 기존 도서를 좋아해 주시던 독자님들이라면 저의 의도를 느끼실 수 있으리라 생각합니다.
많은 분이 이론과 실전을 따로 떼어 생각하는 경향이 있는데, AI 에이전트를 제대로 활용하려면 결국 트랜스포머 아키텍처를 충분히 이해해야 합니다. 이를 통해 AI 에이전트를 사용하며 흔히 겪는 환각 현상이 왜 발생하는지 연관 지어 생각할 수 있고, AI 에이전트의 활용 방법도 더욱 다양한 관점에서 바라볼 수 있습니다.
모든 일에 AI 에이전트를 활용하는 시대는 이미 현재 진행형입니다. 나날이 발전하는 시대에, AI를 단순히 활용하는 것을 넘어 AI가 어떻게 동작하는지 이해하는 일이 점점 더 중요해지고 있습니다. AI 에이전트의 작동 원리를 파악함으로써 더욱 능동적으로 활용하실 수 있으면 좋겠습니다. 독자님들이 이 책을 통해 AI 에이전트에 한 발 더 가까워지는 계기가 되면 좋겠습니다. 감사합니다.
장철원
AI 에이전트 개발 도구는 점점 쉬워지고 있습니다. Ollama로 로컬 모델을 실행하고, 랭체인과 랭그래프로 흐름을 만들고, RAG로 외부 문서를 연결하는 일도 이제는 낯설지 않습니다. 하지만 모델이 왜 그런 답을 내놓는지, RAG 결과가 왜 흔들리는지, 에이전트 구조를 어떻게 확장해야 하는지 모른다면 예제를 넘어 자기만의 서비스로 발전시키기 어렵습니다.
『트랜스포머 아키텍처로 배우는 AI 에이전트 with 랭체인 & 랭그래프』는 AI 에이전트를 단순히 사용하는 데서 벗어나, 내부 구조를 이해하며 직접 구현하도록 돕습니다. 토큰화, 임베딩, 강화학습 기초부터 RNN, 어텐션, 트랜스포머 구조까지 차근차근 살펴보고, 이후 Ollama, Transformers, 랭체인, 랭그래프로 AI 에이전트를 구현합니다.
또한 LoRA, QLoRA, 양자화, ChromaDB 기반 RAG, 멀티 에이전트, MCP까지 실습하며, 마지막에는 Streamlit으로 AI 에이전트 서비스를 직접 만들어봅니다. 단순히 “AI 에이전트를 만들어봤다”에서 끝나지 않고, 구조를 이해하고 원하는 문제에 맞게 설계·확장하고 싶다면 이 책이 좋은 출발점이 되어줄 것입니다.

댓글