깔끔한 데이터 정리를 위해 로그와 썸 타기!
로그(Log)는 NoSQL을 포함한 데이터베이스부터 분산 컴퓨팅에 이르기까지 다양한 시스템에서 전제가 되는 중요한 개념이지만, 이를 명확히 파악하고 관리/사용하는 개발자는 많지 않다.
데이터를 다루고 데이터 제품을 구축하려면 먼저 데이터 흐름의 신뢰성이 중요한데, 이는 효율적인 로그데이터 관리로 가능하다.
이 책은 뒤죽박죽 되어버린 데이터를 깔끔하게 정리하여 각종 시스템에서 데이터 흐름의 신뢰성을 높이려는 개발자에게 왜 로그에 관심을 가져야 하는지 깨닫게 해줄 것이다.
이 책의 주요 내용과 특징은 다음과 같다.
1 들어가며
1.1 로그란 무엇인가
1.2 데이터베이스에서의 로그
1.3 분산 시스템에서의 로그
1.4 변경로그 101: 테이블과 이벤트는 동전의 양면과 같다
1.5 다음 장에서는
2 데이터 통합
2.1 데이터 통합: 두 가지 문제
2.2 로그 구조의 데이터 흐름
2.3 링크드인에서 나의 경험
2.4 ETL과 데이터 웨어하우스와의 관계
2.5 ETL과 조직 확장성
2.6 어느 시점에서 데이터 변환을 수행하는가
2.7 시스템 간 결합도를 낮춤
2.8 로그 확장
3 로그와 실시간 스트림 처리
3.1 데이터 흐름 그래프
3.2 로그와 스트림 처리
3.3 데이터 재처리: 람다 아키텍처와 다른 대안
3.4 상태적 실시간 처리
3.5 Log Compaction
4 로그를 이용한 데이터 시스템 구축
4.1 언번들링?
4.2 시스템 아키텍처로서 로그의 중요성
4.3 마무리
부록 참고 자료
부록.1 학술 논문, 시스템, 강연, 블로그
부록.2 엔터프라이즈 소프트웨어
부록.3 오픈 소스