메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기
정가 35,000원
판매가
10% 31,500원
총 결제 금액 31,500원
배송비 0원
할인 금액 - 3,500원
적립 예정 1,750P
예약 판매 안내

출고 예상일 : 2026-01-30 (출고 후 1~2일 이내 수령)

내부 사정으로 출시가 지연될 수 있습니다.

구매한 도서 중 예약도서가 포함되어 있을 경우, 예약도서 출고일에 함께 배송됩니다.

종이책

데이터 엔지니어링 디자인 패턴

데이터 수집부터 품질, 오케스트레이션, 관찰 가능성까지 반복되는 문제를 해결하는 70가지 패턴 전략

  • 저자바르토시 코니에치니
  • 번역김인범
  • 출간2026-01-30
  • 페이지408 쪽
  • ISBN9791175790117
  • 물류코드51011
  • 난이도
    초급 초중급 중급 중고급 고급
0점 (0명)

데이터 엔지니어링, 경험을 구조화하고 패턴으로 표준화하다

 

데이터 파이프라인을 설계하다 보면, 프로젝트가 달라져도 놀랍도록 비슷한 문제를 반복해서 마주하게 됩니다.
이 책은 이러한 반복이 개인의 역량 부족이 아니라, 표준화된 패턴과 전략이 부재했기 때문이라고 말합니다.
데이터 수집, 오류 처리, 멱등성, 데이터 품질, 관찰 가능성까지 현업 데이터 엔지니어가 매번 고민해 온 핵심 과제를 디자인 패턴으로 정리해 제시합니다. 패턴별로 언제 사용해야 하는지, 어떤 해결책이 있으며 어떤 트레이드오프가 따르는지를 함께 설명해 설계 판단의 기준을 명확히 합니다. 기술 스택과 환경이 바뀌어도 재사용할 수 있는 원칙을 통해, 더 탄력적이고 신뢰할 수 있는 데이터 파이프라인을 설계하도록 돕는 실무형 가이드입니다.

 

주요 내용

  • 반복되는 데이터 엔지니어링 문제를 패턴으로 일반화
  • 데이터 수집부터 운영·모니터링까지, 워크플로 전반에서 다루는 실무 핵심 과제
  • 설계 트레이드오프를 탐색하고 효과적인 멀티 에이전트 시스템 구현하기
  • 기술 스택에 종속되지 않는 설계 원칙 강조

 

바르토시 코니에치니 저자

바르토시 코니에치니

2010년부터 개발을 시작해 현재 프리랜서 데이터 엔지니어로 활동하고 있다. 엔지니어링 전반에 깊은 관심을 갖고 있다. 커리어 전반에 걸쳐 주요 퍼블릭 클라우드 서비스와 함께 아파치 스파크(Apache Spark), 아파치 플링크(Apache Flink), 아파치 에어플로(Apache Airflow), PostgreSQL, 델타 레이크(Delta Lake) 등 다양한 오픈 소스 기술을 활용하며 세션화, 데이터 수집과 정제, 순서가 있는 데이터 처리, 데이터 마이그레이션 등 폭넓은 데이터 엔지니어링 과제를 해결해 왔다.

김인범 역자

김인범

RSQUARE의 DATA 기술 팀 팀장이자 데이터 엔지니어로, 열정적인 동료들과 함께 여러 가지 데이터 과제를 수행하고 있다. SK AX 클라우드 컴퓨팅 기술 팀 및 클라우드 아키텍트 유닛을 거쳐, CNCITY에너지 AI 솔루션 팀에서 데이터 엔지니어로 근무했다. 다양한 분야의 데이터에 관심이 많으며 글쓰기를 좋아한다.

CHAPTER 1 데이터 엔지니어링 디자인 패턴 소개
_1.1 디자인 패턴이란 무엇인가?
_1.2 기존 디자인 패턴만으로 충분한가?
_1.3 일반적인 데이터 엔지니어링 패턴
_1.4 이 책에서 사용된 사례
_1.5 요약

 

CHAPTER 2 데이터 수집 디자인 패턴
_2.1 전체 적재
패턴 #01: 전체 로더
_2.2 증분 적재
패턴 #02: 증분 로더
패턴 #03: 변경 데이터 캡처
_2.3 복제
패턴 #04: 패스스루 복제기
패턴 #05: 변환 복제기
_2.4 데이터 컴팩션
패턴 #06: 컴팩터
_2.5 데이터 준비
패턴 #07: 준비 마커
_2.6 이벤트 주도
패턴 #08: 외부 트리거
_2.7 요약

 

CHAPTER 3 오류 관리 디자인 패턴
_3.1 처리할 수 없는 레코드
패턴 #09: 데드 레터
_3.2 중복된 레코드
패턴 #10: 윈도 중복 제거
_3.3 지연 데이터
패턴 #11: 지연 데이터 탐지기
패턴 #12: 정적 지연 데이터 통합기
패턴 #13: 동적 지연 데이터 통합기
_3.4 필터링
패턴 #14: 필터 인터셉터
_3.5 내결함성
패턴 #15: 체크포인터
_3.6 요약

 

CHAPTER 4 멱등성 디자인 패턴
_4.1 덮어쓰기
패턴 #16: 빠른 메타데이터 정리기
패턴 #17: 데이터 덮어쓰기
_4.2 갱신
패턴 #18: 병합기
패턴 #19: 상태 저장 병합기
_4.3 데이터베이스
패턴 #20: 키 기반 멱등성
패턴 #21: 트랜잭션 기반 작성자
_4.4 불변의 데이터셋
패턴 #22: 프록시
_4.5 요약

 

CHAPTER 5 데이터 가치 디자인 패턴
_5.1 데이터 강화
패턴 #23: 정적 조이너
패턴 #24: 동적 조이너
_5.2 데이터 데코레이션
패턴 #25: 래퍼
패턴 #26: 메타데이터 데코레이터
_5.3 데이터 집계
패턴 #27: 분산 집계기
패턴 #28: 로컬 집계기
_5.4 세션화
패턴 #29: 증분 세션화 처리기
패턴 #30: 상태 저장 세션화 처리기
_5.5 데이터 정렬
패턴 #31: 빈 팩 정렬기
패턴 #32: 선입 선출 정렬기
_5.6 요약

 

CHAPTER 6 데이터 흐름 디자인 패턴
_6.1 시퀀스
패턴 #33: 로컬 시퀀서
패턴 #34: 독립된 시퀀서
_6.2 팬인
패턴 #35: 정렬된 팬인
패턴 #36: 비정렬 팬인
_6.3 팬아웃
패턴 #37: 병렬 분할
패턴 #38: 배타적 선택
_6.4 오케스트레이션
패턴 #39: 단일 실행기
패턴 #40: 동시 실행기
_6.5 요약

 

CHAPTER 7 데이터 보안 디자인 패턴
_7.1 데이터 제거
패턴 #41: 수직 파티셔너
패턴 #42: 제자리 덮어쓰기
_7.2 접근 제어
패턴 #43: 테이블에 대한 세밀한 접근자
패턴 #44: 자원에 대한 세밀한 접근자
_7.3 데이터 보호
패턴 #45: 암호화기
패턴 #46: 익명화기
패턴 #47: 의사 익명화기
_7.4 연결성
패턴 #48: 비밀 포인터
패턴 #49: 비밀 없는 커넥터
_7.5 요약

 

CHAPTER 8 데이터 스토리지 디자인 패턴
_8.1 파티셔닝
패턴 #50: 수평 파티셔너
패턴 #51: 수직 파티셔너
_8.2 레코드 구성
패턴 #52: 버킷
패턴 #53: 정렬기
_8.3 조회 성능 최적화
패턴 #54: 메타데이터 강화기
패턴 #55: 데이터셋 구체화기
패턴 #56: 매니페스트
_8.4 데이터 표현
패턴 #57: 정규화기
패턴 #58: 역정규화기
_8.5 요약

 

CHAPTER 9 데이터 품질 디자인 패턴
_9.1 품질 확보
패턴 #59: 감사-쓰기-감사-배포(AWAP)
패턴 #60: 제약 조건 적용자
_9.2 스키마 일관성
패턴 #61: 스키마 호환성 적용자
패턴 #62: 스키마 마이그레이터
_9.3 품질 관찰
패턴 #63: 오프라인 옵서버
패턴 #64: 온라인 옵서버
_9.4 요약

 

CHAPTER 10 데이터 관찰 가능성 디자인 패턴
_10.1 데이터 탐지기
패턴 #65: 흐름 중단 탐지기
패턴 #66: 스큐 탐지기
_10.2 시간 탐지기
패턴 #67: 지연 탐지기
패턴 #68: SLA 위반 탐지기
_10.3 데이터 계보
패턴 #69: 데이터셋 추적기
패턴 #70: 세밀한 추적기
_10.4 요약

 

APPENDIX 디자인 패턴 요약

처음부터 다시 만들 필요는 없다 
답은 이미 패턴에 있다


데이터 엔지니어링에서도 디자인 패턴은 이제 선택이 아닌 필수적인 사고 도구로 자리 잡고 있습니다.


이 책은 소프트웨어 엔지니어링 분야에서 검증된 디자인 패턴 개념을 데이터 엔지니어링으로 확장해, 이 영역에서 디자인 패턴이 무엇을 의미하는지부터 차근차근 설명합니다.


데이터 수집을 출발점으로 오류 관리와 멱등성, 재시도와 백필 시나리오까지 실제 파이프라인에서 반드시 마주치는 문제를 설계 관점에서 살펴봅니다. 이어 데이터 가치를 창출하기 위한 데이터 결합과 흐름 설계, 보안과 스토리지 전략을 통해 파이프라인을 조직 전체의 데이터 아키텍처로 확장하는 방법을 다룹니다. 또한 데이터 품질과 관찰 가능성 패턴을 통해 문제를 사전에 감지하고, 신뢰할 수 있는 데이터 시스템을 구축하는 접근법을 제시합니다.


각 장은 특정 기술에 대한 설명이 아니라, 반복적으로 등장하는 문제와 그에 대한 검증된 해결 구조에 초점을 맞춰 환경이 달라져도 적용 가능한 기준을 제공합니다.


이 책을 통해 독자는 복잡한 데이터 파이프라인을 보다 체계적으로 사고하고, 상황에 맞는 설계 결정을 내리는 데 필요한 데이터 엔지니어링 디자인 패턴의 핵심을 익힐 수 있습니다.

  • 첫번째 리뷰어가 되어주세요.
  • 리뷰쓰기

    닫기
    * 상품명 :
    데이터 엔지니어링 디자인 패턴
    * 제목 :
    * 별점평가
    * 내용 :

    * 리뷰 작성시 유의사항

    글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

    1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
    2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

    오탈자 등록

    닫기
    * 도서명 :
    데이터 엔지니어링 디자인 패턴
    * 구분 :
    * 상품 버전
    종이책 PDF ePub
    * 페이지 :
    * 위치정보 :
    * 내용 :

    도서 인증

    닫기
    도서명*
    데이터 엔지니어링 디자인 패턴
    구입처*
    구입일*
    부가기호*
    부가기호 안내

    * 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

    * 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

    * 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

    닫기

    해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
    장바구니로 이동하시겠습니까?