메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

케스케이딩 완벽 가이드 : 빅데이터 분석을 위한 하둡 워크플로우 관리 도구

  • 저자 : 파코 네이선
  • 번역 : 오세봉 , 장정호
  • 출간 : 2014-01-17
  • 페이지 : 220 쪽
  • ISBN : 9788968480775
  • 물류코드 :2077
초급 초중급 중급 중고급 고급
4점 (1명)
좋아요 : 27

더 빠르게 하둡 애플리케이션을 구현하고 빅데이터를 처리하라!


하둡 오픈 소스 프레임워크인 케스케이딩을 이용하면 복잡한 맵리듀스 프로그래밍을 배우지 않고도 엔터프라이즈 급 데이터를 처리하는 강력한 애플리케이션을 쉽게 만들고 관리할 수 있다. 자바와 JVM에서 동작하는 언어를 기반으로 작성된 예제 애플리케이션을 통해 케스케이딩이 얼마나 간결하고 빠르게 데이터 처리, 필터링, 워크플로우 최적화하는지 배우게 될 것이다.

  • 다양한 데이터 소스와 비정형 데이터에 대한 모델링과 분석
  • 링구알(Lingual)을 통한 ANSI SQL 지원
  • 익숙한 구조와 재사용 가능한 컴포넌트로 애플리케이션 구축과 테스트
  • 스콜딩(Scalding)과 케스칼로그Cascalog) 도메인 특화 언어를 이용한 작업
  • 클러스터의 위치와 데이터 크기에 상관없는 쉬운 애플리케이션 배치
  • 여러 빅데이터 프레임워크와 프로세스를 통합한 워크플로우 구축
  • 일반적인 예제를 통해 살펴보는 케스케이딩의 특징과 도구
  • 오픈 데이터 이니셔티브의 데이터셋을 이용한 사례 연구 검토

추천사


"이 책에서 파코는 케스케이딩이 제공하는 강력한 기능으로 피그와 하이브로 처리할 수 없는 중요한 워크플로우 작업을 어떻게 처리하는지 제시한다. 다양한 사례를 케스케이딩으로 얼마나 쉽게 해결할 수 있는지를 알려주므로 빅데이터 개발자라면 반드시 한번은 읽어보기 바란다."
- 제이슨 레빗 Jason Levitt, 『JavaScript Developer's Resource』 저자

저자

파코 네이선

Concurrent에서 개발자 지원 프로그램을 이끌고 있는 데이터 과학자다. 스탠포드 대학에서 수학/통계와 분산 컴퓨팅을 복수 전공했으며 IT업체에서 25년간 일해왔다. 하둡, R, 예측 분석, 머신 러닝 그리고 자연어 처리 분야의 전문가로서 대규모 클라우드 기반의 데이터 인프라와 함께 여러 전문 데이터 과학팀을 만들고 이끌어 왔다. 'AWS Start-Up Tour'에서 두 차례 강연했으며, 하둡과 데이터 과학 그리고 클라우드 컴퓨팅에 대해 자주 이야기한다.

역자

오세봉

2003년부터 티맥스소프트에서 근무하며 국산 웹 앱 서버인 JEUS 개발에 8년간 참여했다. 이 개발 기간 동안 자바 언어를 기반으로 서블릿, EJB, 데이터베이스, 트랜잭션, 메시징 시스템, 네트워크 프레임워크 등 다양한 기반 기술을 익혔다. 2011년 빅데이터가 바꿀 세상을 꿈꾸며 넥스알에 입사, 하둡, 하이브, 주키퍼, 우지, HBase, ElasticSearch 등을 이용하여 빅데이터 배치 처리, 실시간 검색 및 워크플로우를 위한 솔루션을 개발하고 있다.

역자

장정호

네이버 검색 소프트웨어 엔지니어. 2006년에 티맥스에서 애플리케이션/시스템 간 데이터 전송 시스템 개발을 시작으로, 다음커뮤니케이션에서 데이터 마이닝 업무, SAP에서 칼럼 기반의 인메모리 RDBMS인 HANA 개발에 동참했으며, 그 후 빅데이터 저장/분석 시스템 영역에 관한 연구를 통해 네이버에서 데이터 분석 시스템을 개발을 담당하고 있다. 한빛미디어에서 『하둡 완벽 가이드(4판)』(2017), 『하이브 완벽 가이드』(2013) 등을 번역했다.

 

프롤로그
_P.1 요구 사항 
_P.2 엔터프라이즈 데이터 워크플로우 
_P.3 거대함 그 이상의 복잡성 
_P.4 케스케이딩 API의 탄생 배경 
_P.5 예제 코드 사용 


1장. 시작하기
_1.1 프로그램 개발 환경 준비 
_1.2 예제 1 : 초간단 케스케이딩 애플리케이션 
_1.3 빌드와 실행 
_1.4 케스케이딩의 분류 체계 
_1.5 예제 2 : 흔한 단어 세기 
_1.6 플로우 다이어그램 
_1.7 대규모 환경에서의 케스케이딩 


2장. 파이프 어셈블리 확장
_2.1 예제 3 : 사용자 정의 연산 
_2.2 토큰 다듬기 
_2.3 예제 4 : 복제 조인 
_2.4 불용어와 복제 조인 
_2.5 아파치 피그와 비교 
_2.6 아파치 하이브와 비교 


3장. 테스트 주도 개발
_3.1 예제 5 : TF-IDF 구현 
_3.2 예제 6 : 테스트가 포함된 TF-IDF 
_3.3 테스트에 관한 부언 


4장. 케스케이딩용 스칼라 DSL
_4.1 스콜딩을 사용하는 이유 
_4.2 스콜딩 시작하기 
_4.3 스콜딩으로 작성한 예제 3 : 사용자 정의 연산 
_4.4 함수형 프로그래밍에 관한 부언 
_4.5 스콜딩으로 작성한 예제 4 : 복제 조인 
_4.6 그레이들로 스콜딩 애플리케이션 빌드하기 
_4.7 아마존 AWS에서 수행 


5장. 케스칼로그-케스케이딩을 위한 클로저 DSL
_5.1 케스칼로그를 사용하는 이유 
_5.2 케스칼로그 시작하기 
_5.3 케스칼로그로 작성한 예제 1 : 초간단 애플리케이션 
_5.4 케스케이딩으로 작성한 예제 4 : 복제 조인 
_5.5 케스칼로그로 작성한 예제 6 : 테스트가 포함된 TF-IDF 
_5.6 케스칼로그 기술적 내용과 사례 


6장. 맵리듀스 그 이상
_6.1 애플리케이션과 조직 
_6.2 링구알, ANSI SQL을 위한 도메인 특화 언어 
_6.3 패턴, 예측 모델 마크업 언어를 위한 DSL 


7장. 워크플로우 추상화
_7.1 핵심 통찰력 
_7.2 패턴 언어 
_7.3 문학적 프로그래밍 
_7.4 관심사 분리 
_7.5 함수형 관계형 프로그래밍 
_7.6 엔터프라이즈 대 스타트업 


8장. 사례 연구 : 팰로앨토시의 오픈 데이터
_8.1 왜 오픈 데이터인가? 
_8.2 팰로앨토시 
_8.3 원시 데이터 소스에서 데이터 제품으로 이동 
_8.4 추천기를 위한 메트릭 보정 
_8.5 공간 색인 
_8.6 개인화 
_8.7 추천 
_8.8 빌드와 실행 
_8.9 추천기 워크플로우 요점 


부록.  워크플로우 문제 해결

  • 아고 머리야! ㅎㅎ

    프로그래밍 언어를 잘알지 못하는 어느 책만보는 한량이 멋진 대구 한마리에 꽂혀 선뜻 뽑아든 책!
    사실 한빛미디어의 리더스 8기라는 활동이 아니었다면 절대로 스스로 구입하지는 않았을 책이었는데

    각설하고!

    일단 대구와 친해지기 위해 이 위험한 - 일본 방사능 땜시 물고기도 맘대로 못먹고 - 시기에 단지 그늠의 책표지 대구와 친해지기 위해서 그 보다는 조금 싸고 친절한 동태를 자주 섭취하였다.
    헌데 왠걸 점점 대구가 무서워져 결국에는 책을 뒤쪽부터 보기로 마음 먹었다.

    싫어하는 책은 결과부터 보아도 나름 재미지기에.....헌데
    rm -rf : 아는 사람은 다 안다. 이 명령어의 결과가 얼매나 무서운 것인지.
    묻지지 따지지도 않는다는 그 무시무시한 삭제 명령어! ㅎㅎ

    케스케이딩 자체가 태어난지 이제 갓 3년을 넘긴 늠이라 집필은 고사하고 번역된 전문서적 전무!
    대한민국 1호 케스케이딩 전문서적!
    내용에 대해서는 이제 갓 하둡에 입문한 초보자가 끄적 거릴 수준이 아니라 차지하고.......
    그 개략적인 의미에 대해서는 외국서적이 그러하듯 기본적인 내용에 지겨울 정도로 충실하다는 것이 장점이자
    단점인듯. 즉 내용을 충실하지만 조금 지겨울 듯......

    허나 새로운 기술을 습득한다는 것 자체에 의미를 부여하는 엔지니어들이라면 한 번쯤은 가벼운 마음으로 구입을 하지 않을까 한다.
    일단 부담없는 가격에 휴대하기도 편하다.

    조금 아쉬운 점이라면 기본에 더 충실하게 단어 하나하나의 의미를 각주 또는 책 사이드편에 제공을 했다면 조금 더 친근하게 다가오지 않았을까! 라는 욕심을 부려본다.

    Have a nice day!

결재하기
• 문화비 소득공제 가능
• 배송료 : 0원배송료란?

배송료 안내

  • 책, 아이템 등 상품을 3만원 이상 구매시 무료배송
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 도서명 :
케스케이딩 완벽 가이드 : 빅데이터 분석을 위한 하둡 워크플로우 관리 도구
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
케스케이딩 완벽 가이드 : 빅데이터 분석을 위한 하둡 워크플로우 관리 도구
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
케스케이딩 완벽 가이드 : 빅데이터 분석을 위한 하둡 워크플로우 관리 도구
구입처*
구입일*
부가기호*
부가기호 안내

* 회원가입후 도서인증을 하시면 마일리지 500점을 드립니다.

* 한빛 웹사이트에서 구입한 도서는 자동 인증됩니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한됩니다.

* 절판도서, eBook 등 일부 도서는 도서인증이 제한됩니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실