메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

AWS 기반 데이터 과학

엔드투엔드, AI/ML 파이프라인 구현하기 | 아마존 클라우드 컴퓨팅 분야 베스트셀러

한빛미디어

번역서

판매중

  • 저자 : 크리스 프레글리 , 안티 바르트
  • 번역 : 최미영 , 이용혁(감수) , 서진호
  • 출간 : 2023-04-28
  • 페이지 : 664 쪽
  • ISBN : 9791169210942
  • 물류코드 :11094
초급 초중급 중급 중고급 고급
4.7점 (14명)
좋아요 : 7

80여 가지 AWS AI & ML 서비스로 구현하는 데이터 과학 프로젝트 실전 가이드

 

이 책은 AWS에서 제공하는 AI와 ML 기능을 활용하여 데이터 과학 프로젝트를 구축하고 배포하는 방법을 다룬 실전 지침서다. 아마존 EC2, 아마존 EBS, 아마존 다이나모DB, AWS 람다, AWS IAM을 비롯한 다양한 AWS 서비스를 사용하여 데이터 수집 및 처리, 머신러닝, 보안을 다룬다. 또한 AWS에서 데이터 과학 프로젝트의 비용을 절감하고 성능을 향상시키는 팁도 소개한다. 이 책을 따라 모든 학습을 마치고 나면 머신러닝 모델의 성능을 향상하기 위한 기술과 방법을 이해하고, AWS를 효과적으로 활용하여 머신러닝 모델을 구축하고 배포할 수 있게 될 것이다.

 

상세페이지700px_AWS 기반 데이터 과학.jpg

크리스 프레글리 저자

크리스 프레글리

AWS 샌프란시스코 지사에서 AI/ML 분야 수석 개발자 애드버킷으로 재직 중이다. 동시에 파이프라인AI(PipelineAI)의 창립자이며, 이전에는 데이터브릭스(Databricks)의 솔루션 엔지니어, 넷플릭스(Netflix)의 소프트웨어 엔지니어로 일한 경력이 있다. 지난 10년간 AI/ML 분야에서 폭넓은 지식을 쌓아오면서 오라일리가 주최하는 AI 관련 시리즈 프로젝트인 ‘AI Superstream Series’에 참여하기도 했다. 또한 세계 각국에서 열리는 AI/ML 콘퍼런스에 참석하여 지식을 나누는 연설을 정기적으로 하고 있다. 현재 AWS에서는 AI/ML 파이프라인을 구축하는 데 전념하고 있다.

안티 바르트 저자

안티 바르트

AWS 뒤셀도르프 지사에서 AI/ML 분야 선임 개발자 애드버킷으로 재직 중이다. 동시에 Women in Big Data의 공동 창립자이며, 이전에는 데이터 센터 인프라, 빅데이터와 인공지능 애플리케이션에 중점을 둔 시스코(Cisco) 및 MapR의 엔지니어로 일한 경력이 있다. 세계 각국에서 열리는 AI/ML 콘퍼런스와 밋업에 참석하여 지식을 나누는 연설을 정기적으로 하고 있다. 오라일리가 주최하는 AI 관련 시리즈 프로젝트인 ‘AI Superstream events’에서 의장을 맡고 있으며 콘텐츠를 큐레이팅하고 있다.

서진호 역자

서진호

마이크로소프트 시니어 테크 에반젤리스트로 활동하다가 스탠퍼드 대학교에서 Advanced Project Management Certificate 과정을 수료했다. 또한 코세라 커뮤니티에서 클라우드 컴퓨팅, 빅데이터, 인공지능 콘텐츠 관련 온라인 강의 및 기술 데모 피드백을 전달하는 어드바이저로 활동했다. 현재는 서울과학종합대학원에서 AI 전략경영 석사와 프랭클린 대학교에서 Executive MBA 과정을 복수 전공하고 있다. 저서로는 2006년에 출간한 『마이크로소프트 IT 전략과 미래』(한빛미디어, 2006)가 있다.

최미영 역자

최미영

AWS 실리콘밸리 지사에서 AI/ML 분야 시니어 프로그래머 라이터로 재직 중이다. 아마존 세이지메이커의 모델 훈련에 관한 기술 문서 원문을 퍼블리싱하며, 특히 딥러닝 분야 컴퓨터 비전 모델과 자연어 처리 모델과 같은 대규모 모델 훈련 작업에 필요한 디버깅, 리소스 프로파일링, 데이터 및 모델 분산 훈련, 그리고 컴파일링 기술 문서를 담당하고 있다. 2019년 텍사스 주립대 댈러스 캠퍼스에서 물리학 박사학위를 취득하였다.

이용혁(감수) 역자

이용혁(감수)

메가존클라우드에서 ML 플랫폼 엔지니어로 IT 경력을 시작하였으며, 현재는 클래스101에서 Personalized eXperience 팀을 이끄는 시니어 머신러닝 엔지니어이다. 개인화에 있어서 중요한 두 가지 요소인 머신러닝 엔지니어링과 모델링 사이에서 균형을 찾기 위해 클라우드 활용을 극대화하고 있다. 최근에는 머신러닝 엔지니어와 데이터 과학자가 본연의 업무에 집중할 수 있도록 클라우드 기반의 MLOps를 효율적으로 구축하는 데 많은 열정을 쏟아붓고 있다.

CHAPTER 1 AWS 기반 데이터 과학 소개

1.1 클라우드 컴퓨팅의 장점

1.2 데이터 과학 파이프라인 및 워크플로우

1.3 MLOps 모범 사례

1.4 아마존 세이지메이커를 사용한 아마존 AI와 AutoML

1.5 AWS에서 데이터 수집, 탐색 및 준비

1.6 아마존 세이지메이커를 사용한 모델 훈련 및 튜닝

1.7 아마존 세이지메이커와 AWS 람다 함수를 사용한 모델 배포

1.8 AWS 스트리밍 데이터 분석 및 머신러닝

1.9 AWS 인프라 및 맞춤형 하드웨어

1.10 태그, 예산, 알림으로 비용 절감하기

1.11 마치며

 

CHAPTER 2 데이터 과학의 모범 사례

2.1 모든 산업에 걸친 혁신

2.2 개인별 상품 추천 시스템

2.3 아마존 레코그니션으로 부적절한 동영상 감지

2.4 수요 예측

2.5 아마존 프로드 디텍터를 사용한 가짜 계정 식별

2.6 아마존 메이시를 사용한 정보 유출 탐지 활성화

2.7 대화형 디바이스와 음성 어시스턴트

2.8 텍스트 분석 및 자연어 처리

2.9 인지 검색과 자연어 이해

2.10 지능형 고객 지원 센터

2.11 산업용 AI 서비스와 예측 정비

2.12 AWS IoT와 아마존 세이지메이커를 사용한 홈 자동화

2.13 의료 문서에서 의료 정보 추출

2.14 자체 최적화 및 지능형 클라우드 인프라

2.15 인지 및 예측의 비즈니스 인텔리전스

2.16 차세대 AI/ML 개발자를 위한 교육

2.17 양자 컴퓨팅을 통한 운영체제 프로그램

2.18 비용 절감 및 성능 향상

2.19 마치며

 

CHAPTER 3 AutoML

3.1 세이지메이커 오토파일럿을 사용한 AutoML

3.2 세이지메이커 오토파일럿을 사용한 트래킹 실험

3.3 세이지메이커 오토파일럿을 사용한 자체 텍스트 분류기 훈련 및 배포

3.4 아마존 컴프리헨드를 사용한 AutoML

3.5 마치며

 

CHAPTER 4 클라우드로 데이터 수집하기

4.1 데이터 레이크

4.2 아마존 아테나를 사용해 아마존 S3 데이터 레이크 쿼리하기

4.3 AWS 글루 크롤러를 통해 지속적으로 새 데이터 수집하기

4.4 아마존 레드시프트 스펙트럼으로 레이크 하우스 구축하기

4.5 아마존 아테나와 아마존 레드시프트 중에서 선택하기

4.6 비용 절감 및 성능 향상

4.7 마치며

 

CHAPTER 5 데이터셋 탐색하기

5.1 데이터 탐색을 위한 AWS 도구

5.2 세이지메이커 스튜디오를 사용한 데이터 레이크 시각화

5.3 데이터 웨어하우스 쿼리하기

5.4 아마존 퀵사이트를 사용한 대시보드 생성

5.5 아마존 세이지메이커 및 아파치 스파크를 사용한 데이터 품질 문제 감지

5.6 데이터셋에서 편향 감지하기

5.7 세이지메이커 클래리파이로 다양한 유형의 드리프트 감지

5.8 AWS 글루 데이터브루를 사용한 데이터 분석

5.9 비용 절감 및 성능 향상

5.10 마치며

 

CHAPTER 6 모델 훈련을 위한 데이터셋 준비

6.1 피처 선택 및 엔지니어링 실행

6.2 세이지메이커 프로세싱을 통한 피처 엔지니어링 확장

6.3 세이지메이커 피처 스토어를 통한 피처 공유

6.4 세이지메이커 데이터 랭글러를 사용한 데이터 수집 및 변환

6.5 아마존 세이지메이커를 사용한 아티팩트 및 익스페리먼트 계보 트래킹

6.6 AWS 글루 데이터브루를 사용한 데이터 수집 및 변환

6.7 마치며

 

CHAPTER 7 나의 첫 모델 훈련시키기

7.1 세이지메이커 인프라 이해하기

7.2 세이지메이커 점프스타트를 사용해 사전 훈련된 BERT 모델 배포하기

7.3 세이지메이커 모델 개발

7.4 자연어 처리 역사

7.5 BERT 트랜스포머 아키텍처

7.6 처음부터 BERT 훈련시키기

7.7 사전 훈련된 BERT 모델 미세 조정하기

7.8 훈련 스크립트 생성

7.9 세이지메이커 노트북에서 훈련 스크립트 시작하기

7.10 모델 평가하기

7.11 세이지메이커 디버거를 사용한 모델 훈련 디버깅 및 프로파일링

7.12 모델 예측 해석 및 설명

7.13 모델 편향 감지 및 예측 설명

7.14 BERT를 위한 추가 훈련 선택

7.15 비용 절감 및 성능 향상

7.16 마치며

 

CHAPTER 8 대규모 모델 훈련과 최적화 전략

8.1 최적의 모델 하이퍼파라미터 자동으로 찾기

8.2 세이지메이커 하이퍼파라미터 튜닝에 웜스타트 추가 사용

8.3 세이지메이커 분산 훈련으로 확장하기

8.4 비용 절감 및 성능 향상

8.5 마치며

 

CHAPTER 9 프로덕션에 모델 배포하기

9.1 실시간 예측 또는 일괄 예측 선택하기

9.2 세이지메이커 엔드포인트를 사용한 실시간 예측

9.3 아마존 클라우드워치를 사용한 세이지메이커 엔드포인트 오토스케일링

9.4 새 모델 또는 업데이트된 모델로 배포하는 전략

9.5 새 모델 테스트 및 비교

9.6 모델 성능 모니터링 및 드리프트 감지

9.7 배포된 세이지메이커 엔드포인트의 데이터 품질 모니터링

9.8 배포된 세이지메이커 엔드포인트의 모델 품질 모니터링하기

9.9 배포된 세이지메이커 엔드포인트의 편향 드리프트 모니터링

9.10 배포된 세이지메이커 엔드포인트의 피처 속성 드리프트 모니터링

9.11 세이지메이커 일괄 변환을 사용한 일괄 예측

9.12 AWS 람다 함수 및 아마존 API 게이트웨이

9.13 엣지에서의 모델 관리 및 최적화

9.14 토치서브를 사용한 파이토치 모델 배포

9.15 AWS DJL을 사용한 텐서플로우-BERT 추론

9.16 비용 절감 및 성능 향상

9.17 마치며

 

CHAPTER 10 파이프라인과 MLOps

10.1 머신러닝 운영

10.2 소프트웨어 파이프라인

10.3 머신러닝 파이프라인

10.4 세이지메이커 파이프라인을 사용한 파이프라인 오케스트레이션

10.5 세이지메이커 파이프라인으로 자동화하기

10.6 더 많은 파이프라인 종류

10.7 휴먼인더루프 워크플로우

10.8 비용 절감 및 성능 향상

10.9 마치며

 

CHAPTER 11 스트리밍 데이터 분석과 머신러닝

11.1 온라인 학습과 오프라인 학습의 비교

11.2 스트리밍 애플리케이션

11.3 스트리밍 데이터용 윈도우 쿼리

11.4 AWS에서 스트리밍 분석 및 머신러닝 구현하기

11.5 아마존 키네시스, AWS 람다, 아마존 세이지메이커를 사용한 실시간 상품 리뷰 분류

11.6 아마존 키네시스 데이터 파이어호스를 사용한 스트리밍 데이터 수집 구현

11.7 스트리밍 분석으로 실시간 상품 리뷰 요약하기

11.8 아마존 키네시스 데이터 애널리틱스 설정

11.9 아마존 키네시스 데이터 애널리틱스 애플리케이션

11.10 아파치 카프카, AWS 람다, 아마존 세이지메이커를 사용한 상품 리뷰 분류

11.11 비용 절감 및 성능 향상

11.12 마치며

 

CHAPTER 12 AWS 보안

12.1 AWS와 사용자 간의 공동 책임 모델

12.2 AWS IAM

12.3 컴퓨팅 및 네트워크 환경 격리

12.4 아마존 S3 데이터 액세스 보호

12.5 저장 시 암호화

12.6 전송 중 암호화

12.7 세이지메이커 노트북 인스턴스 보호

12.8 세이지메이커 스튜디오 보안

12.9 세이지메이커 작업과 모델 보안

12.10 AWS 레이크 포메이션 보호

12.11 AWS 시크릿 매니저를 통한 데이터베이스 자격 증명 보안

12.12 거버넌스

12.13 감사 가능성

12.14 비용 절감 및 성능 향상

12.15 마치며

AWS와 데이터 과학의 완벽한 융합을 통해,

비즈니스 성과를 극대화하는 프로젝트를 구축해보세요!

 

AWS의 다양한 서비스를 활용하여 안정적이고 확장성 있는 데이터 과학 인프라를 구축하는 기업이 많아지고 있습니다. 이 중에는 넷플릭스도 포함되며, EC2, S3, EMR, 레드시프트, 람다 등을 적극적으로 활용하여 비즈니스 성과를 극대화했습니다. 이러한 성과는 다른 기업에게도 큰 영향을 미치게 되었고, 그렇게 AWS 서비스는 데이터 과학 프로젝트에서 필수적인 요소 중 하나로 자리 잡게 되었습니다.

 

하지만 AWS를 활용하여 데이터 과학을 수행하는 방법에 대한 정보를 한곳에 모아둔 자료는 찾아보기 어렵습니다. 이 책은 이러한 아쉬움을 해결하기 위해, AWS를 활용하여 데이터 과학을 수행하고 비즈니스 성과를 높이기 위한 전체 과정을 안내합니다. 또한, AWS 비용 최적화에 대한 팁과 함께 일반적으로 겪을 수 있는 문제와 그 해결책, 그리고 보안에 대한 정보를 제공합니다. 이 책을 읽고 나면 여러분은 성공적인 데이터 과학 프로젝트를 위한 전문적인 기술과 전략을 숙지하여, 현업에서 높은 수준의 성과를 이룰 수 있게 될 것입니다.

 

이 책에서 다루는 AWS 서비스 일부 소개

- 스토리지: Amazon EBS, Amazon EFS, Amazon S3 등

- 데이터베이스: Amazon RDS, Amazon DynamoDB, Amazon Aurora, Amazon QLDB 등

- 컴퓨트: Amazon EC2, AWS Lambda, Amazon ECS, Amazon EKS 등

- 인공지능: Amazon SageMaker, Amazon Lex, Amazon Translate, AWS DeepLens 등

- 보안: AWS IAM, AWS KMS, Amazon Macie, AWS Artifact, AWS Config 등

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

개발을 진행하면서 클라우드 시스템을 많이 고려를 해야합니다. 그중에 aws는 클라우드 시스템을 구축하기에 매우 탁월한 시스템이고, 특히 aws을 기반한 데이터 과학을 매우 중요한 분야입니다.

aws에 대한 것을 거의 모두 다 다루고 있고, 자세한 설명을 통해 독자의 이해도를 높이려는 책입니다.

aws를 고려하고 있으시거나, 머신러닝, 딥러닝을 한다면 꼭 이책을 한번 보시면 좋겠습니다.

aws기반 데이터 과학.jpg

이책은 데이터 과학의 포괄적인 분야를 aws를 통해 필요한 데이터 분석 을 할 수 있도록 하는 책이다.

aws 에서 제공하는 다양한 데이터 과학에 도움이되는 서비스를 활용 하여 데이터 분석을 활용 할 수있다

20230530_212002.jpg

아마존 컴프리헨드 메디컬이라는 헬스케어 api를 손쉽게 활용하는 방법을 다루고 있다.


도서리뷰1.jpg

아마존 컴프리헤드를 활용한 고객리뷰 데이터셋을 훈련 도 할수 있다.

아마존 컴프리헨드는 텍스트 문서를 입력받아, 개체, 핵심 문구, 구문, 감성을 인식한다고 한다.

이처럼 aws는 데이터 과학을 하는데에도 많은 도구들을 제공해주고 있다는 느낌을 받았다.

직접 구현하기 어려운 부분도 aws를 활용하면 많은 부분을 활용 할수 있을것같아

데이터 과학에 있어 필요한 api를 도움받고자 하다면 이책을 공부해볼 필요가 있을 것이다.


"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

AWS 클라우드에서 머신러닝, 워크 플로우, 스트리밍 등 데이터 과학을 위한 서비스를 제공합니다.

 

아마존 세이지메이커, 에어플로우, AutoML, 키네시스 스트리밍 등 AWS 서비스를 사용하면서

 

얼핏 봤던 서비스들인데 과연 어떻게 사용해야할지, 접근하기가 어려웠었어요.

 

간단한 예제와 함께 AWS 데이터 과학 서비스를 어떻게 이용하는지 실습해볼 수 있어서 AWS 기반 데이터 과학 책을 선택했었어요!

 

첫 부분은 GAN, 강화 학습 등의 딥러닝을 어떻게 AWS 서비스로 사용할 수 있을지 소개하는 파트였어요.

 

데이터 분석, 기계 학습과 관련한 AWS 서비스가 적지 않아서 하나 하나 파악하기 쉽지 않았는데, 책으로 간략하게 처음부터 정리하고 가서 이해하기가 훨씬 좋았었어요.

 

데이터 수집을 위한 AWS 서비스, 데이터 탐색하는 AWS 서비스 사용법, AWS 에서 생성한 모델을 훈련하는 법, 대규모로 리소스를 투입하여 훈련하는 법, 모델을 배포하는 법을 차례대로 실습합니다.

 

데이터를 실시간으로 스트리밍 및 머신러닝을 하는 법도 소개합니다.

 

마지막으로는 AWS 보안을 하는 법도 소개해요.  기본적인 AWS IAM, KMS 서비스를 이용한 보안 방법부터 세이지메이커 등의 VPC 설정 등 데이터 과학 AWS 서비스에서도 보안을 하는 법도 알려줍니다.

 

머신러닝과 딥러닝 방식을 공부하시는 분들에게 실제 현업에서 클라우드로 어떻게 조작하고 관리하고 배포하는지 알려주는 귀한 기술 서적 입니다!

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 


아마존 클라우드 컴퓨팅 분야의 베스트셀러인 "AWS 기반 데이터과학" 책을 한빛미디어 서평단으로서 제공받았다. 이 책의 가장 큰 목적은 AWS에서 AI,ML프로젝트를 성공적으로 수행하는 능력을 배양할 수 있다는 것이다. 책의 난이도로 보자면 지식이 전무한 상태로 본다면 굉장히 어렵다. 책의 구성이 굉장히 상세하여, 실무자들에게 많은 도움이 될듯하다

 

aws.png

 

 
안녕하세요 괴짜 개발자 namedboy 입니다.
 
혹시 여러분은 인공지능을 구현하는 방법에 있어서 얼마나 알고 계신가요?
 
인공지능을 구현하는 방법은 여러가지가 있습니다.
구현이 아니라 이미 만들어진 ChatGPT나 Bard 등의 이미 구현된 인공지능을 사용하는 방법도 있고, 직접 인공지능을 구현하는 방법도 있습니다.
 
다만 구현하기가 굉장히 어려운 부분이 있어서 보통은 구현되어 있는 인공지능의 API를 사용하는 경우가 많습니다.
하지만 어쩔 수 없는 상황에선 이미 구현해놓은 것이 아닌 새롭게 구현해야 하는 경우가 있을 것입니다.
 
이런 경우에는 어떻게 해야 할까요?
요즘은 인프라 서비스에서 많은 경우 머신러닝을 하기 위한 서비스를 제공하고 있습니다.
 
그 중에 하나가 바로 AWS 입니다.
사실 머신러닝과 관련해서 특히 생성형 인공지능과 관련해서 가장 쉽게 구현할 수 있는 곳은 MS에서 제공하는 인프라 서비스인 Azure 입니다.
하지만 원론적으로 머신러닝을 구현하는 방식을 생각하고 있다면 각 인프라 서비스들 마다 장단점이 있겠지만 AWS도 활용하기에 훌륭한 서비스라고 생각합니다.
 
만약에 AWS를 생각하고 머신러닝을 구현하고자 한다면 이 책을 추천합니다.
이 책은 데이터 수집, 전처리, 저장, 분석, 시각화 및 기계 학습 모델 구축 등 데이터 과학 프로젝트의 주요 단계를 AWS 서비스와 함께 수행하는 방법을 다룹니다. 예를 들어, Amazon S3를 사용하여 데이터를 저장하고 Amazon Redshift 또는 Amazon Athena를 사용하여 데이터를 쿼리하고 분석할 수 있습니다. 또한, Amazon SageMaker를 사용하여 기계 학습 모델을 구축하고 배포할 수 있습니다.
 
이 책은 데이터 과학 프로젝트를 위한 AWS 서비스를 사용하는 방법을 설명합니다. 이 책을 통해 데이터 과학 프로젝트를 위한 AWS 서비스를 사용하는 방법을 배울 수 있습니다.
 
이 리뷰 내용은 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.  
책의 내용이 궁금하다면 [이곳](https://www.hanbit.co.kr/store/books/look.php?p_code=B6134249359)을 통해 확인할 수 있습니다.
 

AWS(Amazon Web Services)는 아마존에서 제공하는 클라우드 서비스입니다. AWS에서는 단순히 클라우드만 제공하는 것이 아니라 머신러닝 및 인공지능 모델을 개발하고 운영할 수 있는 다양한 서비스를 제공합니다. 'AWS 기반 데이터 과학'은 AWS에서 제공하는 머신러닝 및 인공지능 기능을 활용하여 데이터 과학 파이프라인을 구축하고 모델을 배포하는 방법을 친절하게 설명하는 책입니다. 

타겟 독자 

이 책의 저자는 AWS에서 근무하는 개발자들이고, 그 중 한 명은 실제로 AWS에서 머신러닝과 인공지능 파이프라인을 구축하는 개발자이기 때문에 누구보다도 AWS에서 제공하는 서비스를 가장 잘 아는 사람일 것이라 생각합니다. 

하지만 서비스를 너무 잘 알기 때문인지 초보자에게는 설명이 조금은 불친절하다는 느낌을 받았습니다. AWS의 다양한 서비스들을 설명하면서도 UI를 거의 보여주지 않았고, 처음에 환경 설정을 어떻게 해야 하는지, 어떻게 서비스를 사용해야 하는지에 대한 방법은 거의 생략하고 있었습니다. 이미 서비스를 사용하고 있는 사람들에게 어떻게 해야 더 효율적으로 AWS의 서비스를 사용하는지를 설명하는 내용이 주를 이루기 때문에 초보자보다는 이미 AWS의 세이지 메이커나 키네시스 등을 사용하고 있는 사람, 데이터 과학을 충분히 공부한 데이터 과학자, 데이터 분석가, 데이터 엔지니어, 머신러닝/인공지능 엔지니어, 데브옵스 엔지니어 등에게 유용한 책일 것 같습니다.  

주요 내용

이 책에서는 "인공지능과 머신러닝 실무자가 AWS에서 데이터 과학 프로젝트를 성공적으로 빌드하고 배포하는 방법"을 다루고 있습니다. 총 12개의 장으로 구성된 'AWS 기반 데이터 과학'은 1-3장까지는 AWS 세이지메이커의 포괄적인 사용 방법과 사례를 다루고 4장부터 9장까지 데이터 과학 프로젝트를 빌드하고 배포하는 과정을 다룹니다. 10장에서는 파이프라인을 만드는 법, 11장에서는 실시간 데이터를 다루는 스트리밍 분석, 마지막 12장에서는 보안을 다룹니다.

장점

1. 소스 코드 제공

실제 프로젝트에서 이루어지는 일들을 다루기 때문에 데이터 과학 또는 ML/AI 프로젝트를 실제 배포하는 업무를 처음 담당하는 사람들에게는 큰 도움이 될 수 있는 책입니다. 실제 사례를 기반으로 프로젝트를 설명하고, 소스 코드를 제공해 주기 때문에 실무에 적용할 때 유용할 것 같습니다. 

코드와 결과 제공

2. 이미지와 표 제공

또한 글로만 설명해서는 이해하기 어려운 내용은 이미지나 표로 다시 한번 정리해 주기 때문에 이해가 되지 않을 때는 이미지나 표를 통해 직관적으로 이해할 수 있습니다.

글로 설명한 것을 이미지로 표현

 3. 다양한 실제 사례 제공 

각 장은 실제 사례를 통해 어떻게 서비스를 이용해야 하는지를 설명합니다. 2-3장에서는 다양한 사례를 짧지만 핵심적인 내용을 다루고 있고, 4장부터는 아마존 고객 리뷰라는 하나의 사례를 이어가면서 각 단계에서 세이지메이커를 어떻게 사용하는지를 순차적으로 보여줍니다. 분야가 다른 실무자를 위해서인지 자연어처리의 역사와 BERT를 자세히 설명해 주기도 합니다. 

아마존 리뷰를 BERT 모델로 분류하는 사례

 4. 비용 절감과 성능 향상을 위한 방법 제공

실무자로서는 비용 절감과 성능 향상을 항상 고민할 수 밖에 없습니다. 이 책에서는 매 장마다 실무자로서의 고민인 성능 향상과 비용 절감을 어떻게 할 수 있는지 다양한 방법을 제시해 주기 때문에 실무에 그 방법들을 도입해 보면서 비용 절감과 성능 향상을 모두 꾀할 수 있을 것 같습니다.  

아쉬움

이 책의 타겟이 아닌 처음 AWS 서비스를 이용하려는 사람들에게 이 책의내용은 이해하기 어려울 것 같습니다. 특히 1-3장에서는 이미지보다는 글이 많고, AWS의 서비스 용어가 많기 때문에 이해하기가 쉽지는 않았습니다. 이전에 AWS 관련된 책을 보았기 때문에 이해하기 어렵지 않을 것이라고 생각했지만 충분히 용어와 서비스를 이해하지 못한 저에게는 이해하기 조금 어려웠고, 그로 인해 집중하기 쉽지 않았습니다.

 이 책의 타겟이 초보자가 아닌 실무자이기 때문에 친절하지 않음은 이해할 수 있으나 AWS를 처음 사용하는 실무자를 위해 조금 더 친절하게 설명해 주었으면 어땠을까 하는 생각이 듭니다. 

    "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

실무에서 실시간으로 쌓이는 대용량 데이터를 사용해서 실무 프로젝트를 진행한다면 클라우드 환경을 빼놓고 일하기가 어렵다. 이 책은 여러 클라우드 제품군 중 AWS를 기반으로 쓰여졌다.

데이터과학에 대한 어느정도 기본 이해가 있는 상태에서 AWS제품군을 활용방안을 제시하고 있기 때문에 데이터 과학에 대한 기초 소양이 필요한 책이기도 하다.

현업에서 AWS의 제품군을 활용하여 어떻게 비즈니스를 해야하는지에 대한 구체적인 사례를 함께 제시하고 있다. 단순히 알고리즘 혹은 클라우드 제품에 대한 소개가 아니라 제품군을 활용하여 실제 비즈니스에 어떻게 활용되는지에 대한 사례가 있어야 현업에 어떻게 적용할지 아이디어를 얻을 수 있는데 그런 점에서 이 책이 좋은 가이드 역할을 한다.

AWS는 제품군이 다양하고 복잡해서 콘솔을 열면 어디부터 작업해야할지 난감한데 이 책을 활용하여 데이터 과학 프로젝트를 어떻게 구축하고 배포해야하는지 상세하게 배울 수 있다.

실제 사례를 바탕으로 자연어처리, 컴퓨터 비전, 사기 탐지 등 비즈니스에 접목할 수 있는 예시라 아이디어를 얻기 좋다.

아마존 ML 스택을 통해 세이지메이커 오토파일럿의 AutoML을 사용한 사례를 통해 복잡한 제품군에 대한 활용법을 찾아볼 수 있다. 머신러닝 모델을 반복가능한 MLOps 파이프라인으로 통한합는 방법, 아마존 키네시스와 아파치 카프카용 아마존 관리형 스트리밍을 활용하여 실시간 데이터 스트림에 머신러닝, 이상탐지, 스트리밍 분석을 적용한 사례를 다룬다.

추천시스템, 컴퓨터비전, 사디탐지, 자연어이해, 대화형 디바이스, 인지검색, 고객지원, 산업예측 유지관리, 홈자동화, 사물인터넷 등 적용해 볼 수 있는 다양한 사례를 제공하고 있기 때문에 데이터 과학 프로젝트를 어떻게 활용해야 하는지에 대한 힌트를 얻을 수 있는 책이기도 하다.

데이터 수집 및 분석, 피처 선택 및 엔지니어링, 모델 훈련 및 튜닝, 아마존 세이지메이커, 아마존 아데나, 레드시프트, 일레스틱 맵리듀스(EMR), 텐서플로, 파이토치, 서비리스 아파치 스파크 등 다루는 기술이 방대하고 데이터 과학을 위한 AWS의 대부분의 제품군을 다루고 있다.

AWS 제품군 위주로 다루고 있기는 하지만 비즈니스 사례에 대한 질문을 곳곳에서 적절하게 던져주고 있기 때문에 실제 비즈니스에서 어떤 고민을 하고 활용해야하는지 생각할 지점을 제공해 준다는 점도 좋다.

예를 들어 2015년에 동일한 상품에 대해 2개 이상의 리뷰를 작성한 고객은 누구인가? 각 상품의 평균 별점은 몇 점인가?와 같은 질문을 통해 현업에서 고민할만한 질문을 어떻게 해결해 나가야할지 현업의 고민을 녹이기 위한 노력이 보이는 책이기도 하다. AWS 제품군 활용 뿐만 아니라 이런 질문을 통해 비즈니스 사례에서 어떻게 활용하면 좋을지 함께 고민해 볼 수 있는 책이다.

이 리뷰는 한빛미디어의 나는 리뷰어다 이벤트를 통해 책을 제공받아 작성했습니다.

저자 : 크리스 프레글리, 안비 타르트 지음

옮긴이 : 서진호 , 최미영

"aws 기반 데이터 과학" 책은 AWS를 활용하여 데이터 과학을 수행하는 방법과 AWS의 다양한 서비스를 활용하여 데이터 분석 및 머신러닝 프로젝트를 구축하는 방법에 대해 다루고 있는 도서입니다.

저는 'AWS data analytics 자격증'을 취득하면서 실제 AWS 서비스와 데이터 분석 솔루션이 어떻게

실제로 적용될 지 공부를 많이 했는데, 제가 많이 고민하고 어려웠던 부분에 대한 해답을

쉽고 빠르게 제시해주는 책이였습니다.

가장 기초가 되는 AWS 기초 서비스 시작부터 실제 분석하는데 활용되는 MLOps 파이프라인에 대한ㅅ ㅓㄹ명까지 기초 -> 심화 과정까지 많은 내용을 다루어서 좋았습니다.

그래서 IT 데이터 분석에 대해 관심이 있으신 분들부터 심화된 내용을 원하는 분들까지 모두 읽으시기 좋습니다.

MLOps 라는 방법론을 통해서 기계 학습 프로젝트를 보다 효율적으로 관리하고, 모델의 배포와 운영을 용이하게 만들어주는 내용에 대한 부분이 가장 인상깊었고 실제로 MLOps 구축에 대한 내용을 다뤄주니

엔지니어로서 업무상 많은 도움이 되었습니다. MLops CI/CD (Continuous Integration/Continuous Deployment) 워크플로우를 기계 학습에 적용하여 개발과 배포 사이클을 단축시키고, 지속적인 통합과 배포를 가능하게 하는 부분에 대한 내용이 자세하게 다루어집니다.

또한 Sagemaker를 AWS에서 많이 밀고있는데 이러한 부분을 자세히 다루어주니

초보 엔지니어 입장에서 충분한 지식을 습득하고 활용할 수 있었습니다.

 

데이터 과학은 우리의 삶과 어떠한 연관이 있을까요? 개인화된 경험과 관련 있다 할 수 있습니다. 맞춤형 서비스와 제품은 우리의 선호도, 관심사, 행동 패턴을 분석해 만들어집니다. 모든 산업에 걸쳐 있는 데이터 과학과 관련이 있습니다. 데이터 과학을 잘 알려주는 책을 소개하려 합니다. 소개 해드릴 책은 'AWS 기반 데이터 과학'입니다. 사람들은 AWS에서 제공하는 성공적인 데이터 과학 프로젝트에 관심을 갖습니다. 그 이유는 프로젝트 비용은 줄이고 성능은 최적화하고 싶기 때문입니다. ◆ 여러 산업에서 도입하는 추천 시스템 상품 추천 모범 사례로 아마존 시스템이 많이 언급됩니다. 쇼핑 외에도 스트리밍 서비스, 음악 플랫폼, 소셜 미디어 산업에서도 추천 시스템을 개발합니다. 고객 만족도를 높이면 고객이 대신 홍보해 주면서 매출 증대에도 기여할 수 있습니다. 아마존은 사용자의 구매 이력, 평가, 검색 기록 등을 수집해 사용자에게 필요한 상품을 추천해 줍니다. 내부 알고리즘은 복잡하겠지만 추천 시스템을 잘 만들면 구매 확률과 만족도도 높일 수 있습니다. 기업은 사용자의 관심사 정보를 통해 새로운 전략을 세우고 서비스를 만들게 됩니다. ◆ 비즈니스 전략을 세우는 수요 예측 기업과 조직은 제품과 서비스를 만들기 전 수요를 먼저 조사합니다. 수요 예측을 통해 비즈니스 전략을 수립하는데요. 과거의 패턴과 트렌드를 분석해 미래 수요를 예측하게 됩니다. 예측한 데이터를 토대로 재고관리, 생산계획 마케팅 전략을 최적화할 수 있습니다. 수요 예측 데이터는 여러 산업에서 중요한 의사 결정 도구로 사용하는데요. 소매, 제조, 로지스틱스, 여행, 호텔, 금융 등 다양한 분야에서 수요를 분석합니다. 전략은 계절, 지역, 고객 세분화 등을 고려해 모델을 만들고 모델 데이터를 활용해 판매량을 예측할 수 있습니다. 데이터 과학은 과거 생산 데이터, 시장동향, 경제 지표를 고려해 생산을 최적화하고 비용을 줄이는 역할을 합니다. 세이지메이커는 확장성, 모델 관리, 배포 및 모니터링 등 다양한 장점이 있습니다. 단점으론 아마존 클라우드 플랫폼에 종속되는 건데요. 아마존 환경을 쓰려고 할 경우 클라우드는 초기설정과 구성의 복잡성 추가 비용도 고려해야 합니다. 끝으로 이 책은 아마존 세이지메이커를 사용해 AI 서비스와 Auto ML 활용법을 잘 알려줍니다. 클라우드 기반이므로 편리하고 다양한 AI 서비스를 사용해 볼 수 있습니다. 세이지 메이커는 제조업체에서 제품 품질 관리, 예측 유지보수 등에 기계 학습을 적용합니다. 의료분야에서도 의료 영상분석, 질병 예측 및 생체 신호 분석에 활용됩니다. 금융기관에서도 사기 탐지, 신용 스코어링 등 기계학습을 적용할 수 있습니다. 아마존 클라우드에 관심 있는 분들에게 이 책을 추천합니다. "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

책은 AWS 기반의 AI ML 구현하기 위한 데이터 수집 처리, AutoML, 데이터 스트리밍 분석,배포등의 현장에서 세이지메이커를 활용하여 실질적인 문제를 해결하는 방법을 설명해주는 훌륭한 책입니다.

일단 책은 AWS 대해 기반 지식이 있는 분에게 권장할만한 책이며 AWS기반으로 파이프라인을 구축할려고 시도하는 분들은 반드시 읽어보는 추천해 드립니다.

  

책의 구성은 12개의 장으로 되어 있으며

1장은 AWS기반의 데이터 과학에 대한 개괄적인 내용으로 클라우드 컴퓨팅의 장점, 머신러닝 모델 개발 워크플로우의 단계별 AWS 서비스 소개, 그리고 AWS 운영최적화, 성능,보안, 비용 최적화를 위한 모범 사례를 소개하고 있다.

2장은 실제 사례 관련된 내용으로 미디어, 광고, IoT,제조등과 같은 산업 전반에 걸쳐 아마존 AI ML 스택을 적용하는 내용을 다루고 있다.

3장은 세이지메이커 오토파일럿의 AutoML 사용해서 2장의 사례를 실제로 구현하는 방법에 다루고 있다.

4장부터 9장까지는 데이터의 수집 분석, 피처 선택 엔지니어링, 변환, 모델 훈련 튜닝, 그리고 배포에 대한 내용으로 데이터 과학자나 머신러닝 엔지니어에게 유용한 아마존 아테나, 데이터 분석가에게 유용한 아마존 레드시프트를 사용해 데이터 수집하는 방법, 세이지 메이커를 사용해 데이터 분석 모델 개발, 데이터 처리등을 그리고 피처 엔지니어링 프로세스를 통해 원시 데이터셋을 머신에 사용할 있는 피처로 변환하는   세이지메이커 프로세싱 서비스를 사용했다. 또한 세이지메이커를 사용해 모델을 훈련시키고 최적화하는 방법 실제 서비스를 위한 프로덕션  환경에 모델을 배포하고 모니터링 하는 방법을 다루고 있다.

10장에서는 세이지메이커 파이프라인, AWS스텝함수, 아파치 플로우, 큐브플로우 기타 다양한 오픈 소스를 사용해 엔드투엔드 파이프라인으로 통합 자동화하는 방법을 살펴볼 것이다.

11장에서는 데이터 분석 머신러닝을 스트리밍 데이터로 확장하는 방법에 대해 다루고 있다. BERT기반 세이지메이커 모델을 사용해 요약 통계 예측 분석 작업을 실습을 통해 배우게 것이다.

12장에서는 AWS에서가장 중요한 부분인 보안에 대해서 다루고 있다. AWS 자격증명 액세스 관리(IAM) 서비스, 네트워크 격리,인증 권한부여, 암호화 거버넌스 분야와 감사 가능성 규정 준수 분야의 모범 사례를 소개하고 있다.

 

전반에 걸쳐서 비용을 절감하고 성능을 향상시키는 팁을 제공하고 있다.

 

 

오늘 리뷰할 책은 [AWS 기반 데이터 과학] 입니다. 우선 이 책은 정말 첫 대면부터 놀랍더군요.

 

표지IMG_20230528_182414.jpg

 

 

 

 

 

 

일단 650여 페이지라는 상당한 볼륨, 최근에 본 책중에 두꺼운 편이네요.

 

그리고 수많은 사람들의 추천사도 대단하고, 목차도 엄청 자세히 나온거 같아

 

책을 보는 내내 계속 놀라고 있었습니다.

 

 

 

목차IMG_20230528_184133.jpg

 

 

 

목차를 보는 것도 상당 시간이 걸릴 정도로 이 책은 데이터를 다루는 거의 모든 영역과

 

대부분의 AWS 서비스에 대한 내용을 다루고 있습니다. 과연 이 내용들을 다 이해 할 수 있을까?

 

라는 의문이 들었는데...

 

 

책을 빠르게 보면서 의문은 자연스레 해결이 되네요. 어떤 부분은 자세히 설명이 되어 있지만,

 

또 다른 부분들은 간단하게 핵심만 언급하고 지나가는 부분도 보입니다.

 

이런 부분들은 아마 경험이 있거나 이전에 공부한 사람들이 아니면 도대체 뭔소리인가 넘어갈듯 합니다.

 

책의 분량이 상당함에도 불구하고 방대한 영역을 모두 자세히 설명하는 것은 역시 무리수인거죠.

 

 

 

대략설명IMG_20230528_184232.jpg

 

 

 

또한 이 책의 중반 부터 절반 이상은 머신러닝/딥러닝에 대한 내용을 다루고 있습니다.

 

요즘 유행하는 chatGPT에 대한 내용은 아니지만, 예전에 유명했던 BERT 모델에 대해 주로 설명하고 있습니다.

 

사실 BERT 같은 언어 모델은 개념이 많이 어렵기 때문에 이해 하는게 쉽지 않습니다.

 

당연하거지만 통계나 수학적인 지식이 필요하지만 이 책은 그런 부분은 대부분 생략되어 있습니다.

 

한빛미디어 사이트에 가서 보니 역시나 이 책은 중고급 대상으로 나와 있네요.

 

제가 보기엔 중급자들도 어려울거 같은 느낌.

책의 마지막에는 클라우드에서 역시 중요한 보안과 네트워크에 대해서도 한 챕터를 할당해서 설명이 있습니다.

이 책은 정말 모든 챕터가 대부분 주옥 같은 내용들이라 자세한 설명이 없는 부분에 대해서는

 

다른 책이나 AWS 매뉴얼을 참고 해야 합니다. 특히 제가 개인적으로 관심 있었던

 

추천 시스템, MLOps, mlflow, AutoML 등도 짧게나마 설명이 있어서 좋았습니다.

결론, AWS 를 사용하거나 데이터를 다룬는 직군, 머신러닝/딥러닝을 한다면 꼭 이책을 한번 보시기를 권합니다.

 

다양한 내용을 보면서 자신이 어떤 부분에 취약한지 금방 알 수 있게 해주는 그런 책입니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

요즘 현업에서 AWS Lambda를 작업하며 데이터 엔지니어의 업무를 진행하고 있다. 때마침, 한빛미디어 리뷰 이벤트에 해당 책이 후보에 올라와 있었고 나는 당연히 이 책을 고를 수 밖에 없었다.

 

물론 Lambda 뿐만 아니라 다른 다양한 내용을 포함하고 있겠지만, 당장 내가 사용하는 lambda에 대한 해답을 얻고자 선택한 것도 있었다.

 

먼저 소개에 앞서, 목차부터 소개하고자 한다.

 

목차

CHAPTER 1 AWS 기반 데이터 과학 소개
CHAPTER 2 데이터 과학의 모범 사례
CHAPTER 3 AutoML
CHAPTER 4 클라우드로 데이터 수집하기
CHAPTER 5 데이터셋 탐색하기
CHAPTER 6 모델 훈련을 위한 데이터셋 준비
CHAPTER 7 나의 첫 모델 훈련시키기
CHAPTER 8 대규모 모델 훈련과 최적화 전략
CHAPTER 9 프로덕션에 모델 배포하기
CHAPTER 10 파이프라인과 MLOps
CHAPTER 11 스트리밍 데이터 분석과 머신러닝
CHAPTER 12 AWS 보안
 
크게 위와 같이 12가지 큰 목차로 책의 내용을 풀어가고 있다.
 
큰 챕터들에서는 보이지 않지만, 소제목들에서는 AWS Lambda와 SageMaker 그리고 Glue 등에 대해서 설명들이 주로 이루어졌다.
 
전체적인 파이프라인은 크게 3단계로 나뉘는 것으로 제안하고 있고 아래와 같이 나와있다.
 
1. 데이터 준비
- 데이터 수집
- 데이터 분석
- 데이터 변환
- 데이터 검증
- 훈련데이터 생성

2. 모델 훈련 및 튜닝
- 모델 훈련
- 모델 튜닝

3. 배포와 모니터링
- 배포
- 서빙
- 모니터링
- 로깅


해당 워크플로우를 구현할 수 있도록 여러가지 예시들을 보여주는데, 그 중 airflow도 포함되어 있었다.
(최근 공부중이라 반가운 부분이었다.)
 
그리고, 처음 사용하는 유저들을 위해 미리 앞서 말해주는 부분이 바로 '비용'에 관련된 부분이었다.
 
클라우드 컴퓨팅 및 클라우드 서버를 사용하면 대부분 유료 서비스인 것을 알 수 있다.
(물론, Colab은 아직까지 무료로 제공 되는 부분이 있기는 하지만..)
 
이러한 유료 서비스에서 어떻게 하면 과금이 되는지에 대한 구조에 대해서 설명을 해주었으며, 비용을 절감할 수 있는 효율적인 처리에 대해 간략적인 가이드가 제공되고 있다.
 
모델 파이프라인 관련해서 가장 유용하게 사용되는 AutoML 은 SageMaker에서 사용할 수 있다고 한다.
 
데이터 적재 관련해서는 데이터 레이크를 손쉽게 구축할 수 있는 레이크 포메이션을 소개하고 있으며, 글루를 이용하여 데이터 카탈로그 작업도 가능한 것을 확인할 수 있었다.
 
이와 같이 책 앞에서는 각각 파이프라인 별로 어떠한 기능들을 이용하여 구현할 수 있는지 설명을 해주었다.
 
해당 도서에서 가장 좋았던 점을 느낀것은 바로 모범 사례 파트였다.
 
 
- 아마존 세이지 메이커와 텐서플로를 이용한 추천 시스템 생성하기
- 아마존 세이지 메이커와 아파치 스파크로 추천 시스템 생성하기
 
등 다양한 사례들이 존재했고, 사례 소개 뿐만 아니라 참고할 수 있는 코드까지 같이 내용에 포함되어 너무 좋은 가이드가 될 수 있을 것이라 생각되었다.
 
 
그 이후로는 세이지 메이커로 AutoML 사용하는 법과 아테나를 통한 데이터 적재 등 다양한 코드 기반으로 한 가이드들을 보여주었다.
 
해당 도서는 코드를 기반으로 여러가지 사례들을 안내해주고 가이드로 참고할 수 있는 부분이 많아 초보자 및 실무자들에게 굉장히 좋은 이정표로 쓰일 것으로 기대가 되었다.


"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


 

AWS 기반 데이터 과학

 

이번 5월에 리뷰할 도서는 "AWS 기반 데이터 과학" 입니다.

근래 들어서 AWS 관련 강의나 도서가 점점 많아지고 있는것 같습니다.

많은 분들이 잘 아시겠지만 AWS는 Amazon Web Services의 약자로,

Amazon이라는 회사의 클라우드 컴퓨팅 서비스 입니다.

 

최근에 서버 관련 일이 생겨서 읽어두면 도움이 되지 않을까 싶어 선택하였습니다. (AWS는 아닙니다.)

예전에 한참 클라우드 컴퓨팅이나 서버 관련 인터넷 강의를 들을 때 AWS 관련 부분이 포함된 강의를 들었는데, 

해당 강의에서는 AWS 관련 강의의 길이가 30분에서 40분 사이었던걸로 기억합니다.

이제는 AWS만으로 구성된 책이나 강의가 나올 정도이니 엄청난 인기를 끌고 있는것 같습니다.

 

저는 AWS라는 이름을 들었을때는 클라우드 컴퓨팅, Google의 Colab에 기능이 조금 추가된 정도의 생각이 듭니다.

사실 AWS에는 MLOps부터 AutoML, 컨테이너 등 다양한 서비스가 제공이 되고 있습니다.

 

학습용 피시를 준비하는 것도 좋지만 고성능의 학습을 진행하거나 이제 시작하시는 분들은

AWS나 Colab으로 시작하는게 좋을거라 생각됩니다.

 

이 책의 특징으로는

 

1. AutoML

AutoML에 대한 내용이 포함되어 있습니다.

대부분의 AWS 강의나 도서는 서버 구축이나 클라우드 컴퓨팅 맛보기 정도라면,

이 책에서는 Sage Maker를 이용한 AutoML에 대한 세부적인 내용이 포함되어 있습니다.

 

2. 목적에 충실함

처음 책 제목을 봤을때는 AWS에 대한 내용들만 포함되어 있으니,

데이터 분석, 학습, 수집 등의 내용은 기대하지 않았었습니다.

그러나 데이터 수집부터 전처리, 학습, 최적화까지 잘 구성되어 있었습니다.

(물론 AWS를 활용한 기술에 초점이 맞춰져 있습니다.)

 

3. 예제 코드

AWS에서 예제 코드는 있을지에 대한 의문은 있었습니다.

책을 따라해보면서 예제 코드는 항상 필수로 느끼는 저로써는 가장 중요하게 보는 부분이었는데요.

책 두께가 꽤 있는 만큼 예제 코드도 잘 구성되어 있었습니다.

 

4. 다양한 내용

AWS를 사용한 데이터 사이언스 내용이 다양하게 구성되어 있습니다.

사실상 수집, 분석, 학습, 최적화만 해도 책이 완성되었다고 할 수 있으나,

이 책에서는 AWS MLOps부터 보안, 모델 배포 등 다양한 내용이 있어서 책을 따라가는 재미가 있었습니다.


총평

 

로컬 환경에서 학습이 어려우신 분 (단순한 목적이면 코랩을 추천합니다^^),

새로운 학습환경 및 시스템을 활용하고 싶으신 분,

클라우드 컴퓨팅을 공부하고 싶으신 분에게 추천하는 도서가 되겠습니다.

저는 항상 다양한 도구와 시스템에 관심이 많아서, 이 책을 통해 재미있는 시간을 보냈습니다.

 

지금의 공부나 일이 지루하게 느껴지신다면 한번 읽고 도전해보시면 좋을 것 같습니다^^

 AWS 를 이용해서 어떻게 파이프 라인을 구축하고 사용하는지 공부해보려고 이 책을 읽기 시작했다. 그런데 이책.. 생각보다 읽기가 쉽지 않다. 
  처음에는 챕터 1에서 AWS 기반 데이터 과학에 대한 소개가 이루어지고, 챕터 2에서는 AWS를 활용한 모범사례가 소개되어있다. 그러나 이 부분에서는 다양한 기술과 내용들이 많이 다뤄져서 진도를 나가기가 어려웠다. 특히, AWS에 대한 기반 지식이 부족한 나에게는 쉽게 이해되지가 않았다.
  그래서 생각해 보니 챕터 3부터 시작해서 주요 기술이 자세히 설명되어 있는 부분부터 읽는 것도 좋을것 같았다. 책을 읽으면서 중요한 기술들을 학습하고, 해당 내용을 실습하며 익히다 보면 보다 쉽게 파이프 라인 구축에 도움이 될것이다. 

 

 

 

  이 책을 읽으면서 가장 큰 단점은 이미지나 캡쳐 화면과 같은 시각적인 자료가 부족하다는 점이다. 텍스트로만 설명 되어 있어 설정 값들과 텍스트가 의미하는 것들을 이해하는 데에 어려움이 많았다. 책에 시각적인 자료를 추가하거나 관련된 예시와 함께 설명해 주면 내용을 보다 쉽게 이해할 수 있을 것이다.
  결론적으로, 이 책은 AWS에 대한 기반 지식이 있는 독자들에게 더 유익하게 다가갈 수 있을것이다. 그리고 책을 공부하기 위해서는 먼저 AWS 에 대한 기반 지식을 충분히 습득한 후에 읽는것이 좋을것 같다. 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

도서판매처

리뷰쓰기

닫기
* 도서명 :
AWS 기반 데이터 과학
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
AWS 기반 데이터 과학
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
AWS 기반 데이터 과학
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실