메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

소문난 명강의 : 김도형의 데이터 사이언스 스쿨(수학 편)

파이썬 라이브러리로 배우는 데이터 과학 필수 수학

한빛미디어

집필서

판매중

  • 저자 : 김도형
  • 출간 : 2019-11-20
  • 페이지 : 880 쪽
  • ISBN : 9791162242414
  • 물류코드 :10241
초급 초중급 중급 중고급 고급
4.6점 (10명)
좋아요 : 0

“소문난 명강사 ‘김도형’이 데이터 사이언스 입문자에게 보내는 선물 같은 수학 책

 

선형대수, 미적분, 최적화, 확률론, 검정과 베이즈 추정까지 머신러닝과 딥러닝에  필요한 모든 수학을 한권에!”

 

이 책은 대학에서 수학을 전공하지 않은 인공지능 개발 입문자와 현업 전문가에게 핵심 수학을 알려줍니다. 수식에 많이 사용되는 그리스 알파벳과 고등학교 과정의 수학 기호부터 설명해 누구나 차근차근 수학을 익힐 수 있습니다. 기초부터 출발하지만 데이터 분석과 머신러닝에 필요한 모든 필수 수학을 다루며, 모든 수식은 파이썬 패키지를 활용해 코드로 보여줍니다. 스타트업 파일을 적용한 파이썬 주피터 노트북 실습 환경도 제공합니다.

(알림 : 독자 여러분이 파이썬 언어에 대한 기초적인 지식이 있다고 가정합니다)

 

 

★ 이 책의 특징

[입문자와 비전공자를 위해 기초부터 시작]

대학에서 수학을 전공하지 않은 인공지능 개발 입문자와 현업 전문가에게 핵심 수학을 알려줍니다. 수식에 많이 사용되는 그리스 알파벳과 고등학교 과정의 수학 기호부터 설명해 누구나 차근차근 수학을 익힐 수 있습니다. 기초부터 출발하지만 데이터 분석과 머신러닝에 필요한 모든 필수 수학을 다루며, 모든 수식은 파이썬 패키지를 활용해 코드로 제시합니다.

 

[머신러닝 이해에 필요한 핵심 내용만 선별]

선형대수, 함수론, 미적분, 최적화 등 다양한 수학 분야를 다루지만 데이터 분석과 머신러닝에 꼭 필요한 내용만을 최소한으로 선별했습니다. 핵심 내용만 있으므로 이 책에 실린 내용을 충실히 익히면 데이터 분석과 머신러닝 이론을 효과적이고 깊이 있게 공부하는 데 도움이 됩니다. 이해가 되지 않는 부분은 반복해서 공부하시기 바랍니다.


[파이썬 구현을 통한 이해와 응용]

데이터 분석과 머신러닝은 코드로 알고리즘을 구현하므로 수학 수식만으로 이해해서는 부족합니다. 따라서 이 책의 모든 수식과 알고리즘은 파이썬 코드로 구현합니다. 수학을 코드로 이용하려는 개발자 입장을 고려해 알고리즘 자체를 구현하기보다는 알고리즘이 구현된 넘파이(NumPy), 심파이(SymPy), 사이파이(SciPy), 피지엠파이(pgmpy) 등의 패키지 기능을 잘 이해하고 자유롭게 사용할 수 있도록 하는 것을 목표로 합니다. 

 

[연습 문제 300여 문항]

책에서 설명하는 내용을 제대로 이해하고 있는지 확인하는 연습 문제 300여 개가 있습니다. 모든 연습 문제는 머신러닝의 이론을 설명할 때 나오는 수식의 일부를 미리 풀어보는 문제입니다. 연습 문제를 풀 수 있다면 나중에 나올 복잡한 수식을 쉽게 이해할 수 있습니다.

 

 

★ 이 책에서 다루는 파이썬 패키지

이 책의 코드를 구현하는 데 파이썬 3.7과 다음 패키지를 사용했습니다.

  • 아이파이썬(IPython)
  • 사이킷런(Scikit-Learn)
  • 맷플롯립(matplotlib)
  • 넘파이(NumPy)
  • 시본(seaborn)
  • 사이파이(SciPy)
  • 피지엠파이(pgmpy)

 

★ 이 책의 구성

[0장 파이썬 설치와 사용법]

_ 파이썬과 파이썬 패키지를 설치하고 사용하는 방법을 배웁니다.

_ 데이터 분석에 필요한 파이썬 패키지를 소개합니다.

_ 아이파이썬과 주피터를 사용자에 맞게 설정하는 방법을 알려줍니다. 

 

[1장 수학 기호]

_ 수식에 많이 쓰이는 그리스 알파벳을 읽고 쓰는 법을 배웁니다.

_ 머신러닝 교과서나 논문에 자주 사용되는 수학 기호의 의미를 알아봅니다. 

 

[2장 넘파이(Numpy)로 공부하는 선형대수]

_ 스칼라, 벡터, 행렬, 텐서의 의미와 기호, 넘파이 패키지를 사용하는 방법을 배웁니다.

_ 행렬의 연산과 성질, 그리고 연립방정식을 다룹니다. 

 

[3장 고급 선형대수]

_ 기하학에서 선형대수가 어떻게 쓰이는지 알아봅니다.

_ 고윳값분해, 특잇값분해를 공부하고 어떤 문제에 응용할 수 있는지 알아봅니다.

 

[4장 심파이(SymPy)로 공부하는 미적분]

_ 머신러닝에서 자주 사용되는 함수와 그 특징을 알아봅니다.

_ 미분과 적분 공식을 배우고 심볼연산이 가능한 심파이 패키지를 사용하여 미적분을 하는 법을 익힙니다.

_ 머신러닝에서 자주 사용되는 행렬의 미적분 공식을 공부합니다.

_ 변분법 개념을 소개합니다. 

 

[5장 사이파이(SciPy)로 공부하는 최적화]

_ 최적화 문제와 최대경사법을 사용하여 최적화 문제를 푸는 방법을 알아봅니다.

_ 사이파이 패키지를 사용하여 실제로 최적화 문제를 푸는 법을 익힙니다.

_ 등식 제한조건이나 부등식 제한조건이 있는 최적화 문제를 푸는 라그랑주 승수법을 공부합니다.

_ 머신러닝 이외에도 여러 분야에 널리 쓰이는 LP 문제와 QP 문제를 소개합니다. 

 

[6장 피지엠파이(pgmpy)로 공부하는 확률론]

_ 확률의 수학적 정의와 빈도주의 및 베이지안 관점에서 확률이 가지는 의미를 공부합니다.

_ 확률분포함수가 어떤 과정을 통해 정의되었는지를 소개합니다.

_ 머신러닝에서 사용하는 중요 개념인 조건부 확률과 베이즈 정리를 배웁니다.

_ 피지엠파이 패키지를 사용하여 확률분포를 구현하고 베이즈 추정을 실행하는 법을 익힙니다.

 

[7장 확률변수와 상관관계]

_ 확률변수를 사용한 데이터 모형의 개념을 배웁니다.

_ 표본 데이터의 기댓값, 분산의 의미와 분산의 기댓값이 가지는 특성을 공부합니다.

_ 베르누이분포, 이항분포, 카테고리분포, 다항분포 등의 이산 분포와 가우시안 정규분포, 스튜던트 t분포, 카이제곱분포, F분포 등의 연속 분포의 정의와 특성, 그리고 이 분포들이 어떻게 데이터 분석에 쓰이는지 알아봅니다.

_ 확률모수 모형에 사용되는 베타분포, 디리클레분포, 감마분포를 소개합니다. 

 

[8장 사이파이로 공부하는 확률분포]

_ 여러 확률변수가 가지는 상관관계를 어떻게 정의하는지 소개합니다.

_ 가장 널리 쓰이는 상관관계 모형인 다변수 정규분포 모형에 대해 알아봅니다.

_ 조건부 기댓값의 개념을 소개하고 머신러닝의 가장 큰 응용 분야인 예측에 어떻게 사용되는지 공부합니다. 

 

[9장 추정과 검정]

_ 데이터가 주어졌을 때 데이터에 기반해 판단하는 방법을 공부합니다.

_ 가장 기본적인 데이터 기반 의사결정인 검정의 개념과 사이파이를 사용한 검정 방법을 익힙니다.

_ 가능도의 개념과 최대 가능도 추정법을 사용하여 확률분포의 모수를 추정하는 방법을 알아봅니다.

_ 모수 추정의 불확실성에 대해 공부하고 베이즈 정리에 기반한 베이지안 모수 추정법을 소개합니다.

 

[10장 엔트로피]

_ 엔트로피의 개념을 소개하고 엔트로피가 확률변수가 가진 정보량과 어떤 관계가 있는지 알아봅니다.

_ 크로스 엔트로피와 쿨백 라이블러 발산을 사용하여 확률분포의 유사성을 비교하는 방법을 공부합니다

 

상세이미지_700.jpg

 

 

저자

김도형

KAIST에서 자동 제어와 신호 처리를 공부하여 박사 학위를 받았으나 금융 분야로 진로를 바꾸어 미래에셋대우에서 퀀트로 재직했습니다. 현재는 개인 퇴직연금운용을 위한 핀테크 기술 회사 베라노스 CTO이며 패스트캠퍼스 ‘데이터 사이언스 스쿨’에서 데이터 분석 관련 수학과 머신러닝을 가르칩니다. 2016년부터 ‘데이터 사이언스 스쿨’이라는 웹사이트를 운영하며 데이터 분석에 필요한 프로그래밍, 수학, 머신러닝, 딥러닝 관련 글을 올리고 있습니다.

0장 파이썬 설치와 사용법

__0.1 커맨드 라인 인터페이스 

__0.2 파이썬 설치하기 

__0.3 파이썬 처음 사용하기 

__0.4 파이썬 패키지 설치하기 

__0.5 데이터 분석용 파이썬 패키지 소개 

__0.6 아이파이썬 및 주피터 설정 

__0.7 구글 코랩 사용법 

__0.8 마치며 

 

1장 수학 기호

__1.1 그리스 문자 

__1.2 수열과 집합의 합과 곱 

__1.3 마치며 

 

2장 넘파이(Numpy)로 공부하는 선형대수

__2.1 데이터와 행렬

__2.2 벡터와 행렬의 연산 

__2.3 행렬의 성질 

__2.4 선형 연립방정식과 역행렬 

__2.5 마치며 

 

3장 고급 선형대수

__3.1 선형대수와 해석기하의 기초 

__3.2 좌표와 변환 

__3.3 고윳값분해 

__3.4 특잇값분해 

__3.5 PCA 

__3.6 마치며 

 

4장 심파이(SymPy)로 공부하는 미적분

__4.1 함수 

__4.2 심파이를 사용한 함수 미분 

__4.3 적분 

__4.4 행렬의 미분 

__4.5 변분법 

__4.6 마치며 

 

5장 사이파이(SciPy)로 공부하는 최적화

__5.1 최적화 기초 

__5.2 제한조건이 있는 최적화 문제 

__5.3 선형계획법 문제와 이차계획법 문제 

__5.4 마치며 

 

6장 공부하는 확률론 피지엠파이(pgmpy)로 

__6.1 집합 

__6.2 확률의 수학적 정의와 의미 

__6.3 확률의 성질 

__6.4 확률분포함수 

__6.5 결합확률과 조건부확률 

__6.6 베이즈 정리 

__6.7 마치며 

 

7장 확률변수와 상관관계

__7.1 확률적 데이터와 확률변수 

__7.2 기댓값과 확률변수의 변환 

__7.3 분산과 표준편차 

__7.4 다변수 확률변수 

__7.5 공분산과 상관계수 

__7.6 조건부기댓값과 예측 문제 

__7.7 마치며 

 

8장 사이파이로 공부하는 확률분포

__8.1 사이파이를 이용한 확률분포 분석 

__8.2 베르누이분포와 이항분포 

__8.3 카테고리분포와 다항분포 

__8.4 정규분포와 중심극한정리 

__8.5 스튜던트 t분포, 카이제곱분포, F분포 

__8.6 다변수정규분포 

__8.7 베타분포, 감마분포, 디리클레분포 

__8.8 마치며 

 

9장 추정과 검정

__9.1 확률분포의 추정 

__9.2 최대가능도 추정법 

__9.3 베이즈 추정법 

__9.4 검정과 유의확률 

__9.5 사이파이를 사용한 검정 

__9.6 마치며 

 

10장 엔트로피

__10.1 엔트로피 

__10.2 조건부엔트로피 

__10.3 교차엔트로피와 쿨백-라이블러 발산 

__10.4 상호정보량 

__10.5 마치며 

★ <소문난 명강의>시리즈 소개

이 시리즈는 단기간에 실무 능력을 갖추게 도와줍니다. 유튜브, 블로그, 학원, 대학 등에서 이미 검증된 강의 본연의 장점을 극대화하고 더 체계화해 책으로 담았습니다. 입문자 눈높이에서 설명하고 작고 실용적인 프로젝트를 수행해 실전 능력을 키워줍니다. 빠르게 개발 능력을 배우려는 입문자와 더 다양한 경험을 쌓으려는 기존 개발자에게 유용합니다.

 

★ 이 책의 모태 소문난 명강의 360만 뷰 ‘데이터 사이언스 스쿨’ 소개

저자는 2016년부터 ‘데이터 사이언스 스쿨’(datascienceschool.net)에 데이터 분석과 관련된 글과 자료를 무료로 공개하고 있습니다. 2019년 10월 1일 현재까지 누적 사용자 60만 명 이상, 누적 페이지 뷰 360만 뷰 이상이며 많은 피드백을 받고 있습니다.

 

‘데이터 사이언스 스쿨’ 웹사이트는 데이터 분석에 필요한 A부터 Z까지의 모든 내용을 다루는 것을 목표로 합니다. 끊임없이 내용을 수정/보완하고 있으며 데브옵스, 프로그래밍 언어, 데이터 분석을 위한 수학, 회귀분석과 시계열분석, 머신러닝, 딥러닝을 주제로 다룹니다.

 

이 책은 ‘데이터 사이언스 스쿨’ 웹사이트 중 ‘데이터 분석을 위한 수학’에 해당합니다. 대부분 책 내용은 웹사이트에 게재되어 있습니다. 다른 내용도 책으로 정리하여 출간될 예정입니다. 많은 관심 부탁드립니다.

  • 파이썬 라이브러리로 배우는 데이터 과학 필수 수학

     

    SE-2b783118-e549-47c4-9740-b2b3895d05d7.jpg

     

    이 책은 대학에서 수학을 전공하지 않은 인공지능 개발 입문자와 현업 전문가에게 핵심 수학을 알려줍니다. 수식에 많이 사용되는 그리스 알파벳과 고등학교 과정의 수학 기호부터 설명해 누구나 차근차근 수학을 익힐 수 있습니다.

     

    실로 어마무시한 책

     

    책을 가볍게 들고 찍을 것 처럼 보이지만 전혀 그렇지 않습니다. 이 책은 전체가 850페이지가 넘어가는 어마무시한 책입니다. 전체라 함은 두 권으로 나눠져 있지요. 작은 하나는 문제 해답을 담고 있습니다. 해답지를 빼더라도 이 책은 720페이지가 넘습니다. 하지만 다 이유가 있는 것이지요.

     

    DSC_3223.jpg

     

    SE-12a18af0-7bb6-4ee3-97c1-05ebdcf4881b.jpg

     

    처음은 파이썬 환경 구축을 위한 친절한 가이드가 있고 다음부터 본격적인 수학 지식을 가르칩니다. 처음에 나오는 것이 바로 그리스 문자입니다. 학부 시절에 교수님이 외우라고 하면서 시험도 쳤던 기억이 어렴풋이 났습니다. 도대체 무엇때문에 외우는지 중요성을 몰랐지만 이 책의 처음에 등장하는 것을 보니 중요한 것은 맞겠지요.

     

    SE-c9e14741-0703-48f5-9f26-950bf0f7deed.jpg

     

    그러니까 이 책은 진짜 입문자를 위해 필요한 지식을 차근차근 가르쳐줍니다. 그리고 파이썬이 함께 하지요. 수학적 지식을 파이썬에서 어떻게 나타내는지를 함께 설명합니다. 이 책이 특별한 것은 설명하면서 이 지식이 어떻게 활용되는지도 설명해 준다는 것입니다. 그 지식이 왜 필요한지를 알게 해준다는 것이죠.

     

    SE-a3d1fe3f-6e66-48d8-b656-c7a65694270e.jpg

     

    SE-c711957e-f5b4-4b36-a972-79d90a695c98.jpg

     

    위 사진은 벡터의 선형조합이 어떻게 사용되는지 보여주는 부분입니다. 두 사진을 비율에 따라 섞은 결과가 정말 신기했습니다.

     

    입문자를 위한다고 해도 데이터 사이언스를 위한 수학 지식은 어려운게 사실입니다. 그렇기에 이 책은 더 가치있을 것입니다. 필요한 거의 모든 것을 다루고 있기 때문이죠. 그리고 강의를 듣는 것은 그 시간에 한정 되어있지만 이 책은 언제든 함께 할 수 있습니다. 아! 물론 무게를 감당해야겠지요. ^^;

     

    살짝 아쉬운 것이 있다면

     

    가방에 넣고 다니기에는 상당히 무겁습니다. 두껍고 무거운 이유가 있기에 이해할 수 있지요. 다만 휴대성을 더 좋게 하기 위하여 해답지를 나눈 것 처럼 책도 나누었으면 좋겠다는 생각이 들었습니다.

     

    이 책의 모태 사이트가 있다고!!?

     

    이 책의 저자이신 김도형님께서 운영하고 있는 사이트입니다.(https://datascienceschool.net데이터 분석에 필요한 A부터 Z까지의 모든 내용을 다루는 것이 목표라고 합니다. 데이터 사이언스에 관심이 많은 분들은 꼭 알아두어야 할 사이트일 것입니다.

     

    소문난 명강사 '김도형'이

    데이터 사이언스 입문자에게 보내는

    선물 같은 수학 책

     

    데이터 사이언스의 전망이 밝다는 것은 알지만 어떻게 공부해야할지 막막한 사람들에게 이 책은 분명 단비와 같을 것입니다.

  • 사실은 이 책이 데이터 사이언스에 대한 기초적인 책인줄 알았으나, 수학 관련만 있는 책인줄은 몰랐다. (다들 조심)


    이 책은 확률과 통계, 선형대수에 대한 모든 데이터 사이언스에서 필요로한 수학 지식을 설명하고 있다.


    어떻게 보면, 이 책을 공부하면서 머신러닝, 딥러닝을 공부하는 것이 더 좋지 않을까? 생각하기도 한다.


    물론, 파이썬이란 언어와 주피터, 구글 코랩을 통해서 수학을 공부하는데 이 부분이 좀 생소할 수 있다.


    책의 목차만 봐도 알 수 있는데, 해당 부분이 좀 신선하다. 직접 수학적인 지식을 코드로써 이해하는 분명한 목표가 있다.

     

    데이터 분석이나, 머신러닝, 딥러닝에서 필요로한 모든 수학적인 지식이 담겨져 있고, 챕터별로 구분을 해두었기 때문에, 필요한 부분만 학습이 가능하다.


    솔직히, 책의 양이 방대하기 때문에, 짧은 시간에 보기란 어렵지만, 시간을 두고, 스터디 교재로 쓴다거나 하는 방법이 좋겠다.


  • 데이터를 공부하는 사람이라면 한번쯤은 들어가 봤을법한 사이트인 데이터사이언스스쿨 사이트를 운영하는 김도형 박사님이 쓰신 책이다. 궁금한게 있어서 검색을 하다보면 자주 들어가서 보게 되는 사이트이고 볼 때마다 정리가 꼼꼼해서 도움을 많이 받은 사이트이다.

    이 사이트 내용 그대로 책으로 나와도 되겠다는 생각을 자주 해왔는데 이 사이트의 내용이 정말 책으로 출판되었다. 사이트를 통해 봤던 내용을 정리된 책으로 보니 사이트 만큼이나 친절한 느낌을 받았다.

     

     

    데이터 사이언스 스쿨 사이트 화면으로 데이터를 공부하는 사람들은 누구나 몇 번쯤 들어가 봤을 사이트다.

     

    데이터 분야의 일을 하면서 늘 수학은 어렵고 힘든점이었고 개발자라서 그런지 수학공식보다는 코드로 이해를 하는게 편했었다. 이과생이기는 했지만 수포자였기 때문에 통계, 머신러닝, 딥러닝에서 등장하는 수학공식은 늘 동공지진을 유발했다.

    또, 언제 배웠는지 기억도 나지 않는 로그, 미분, 적분을 마주해야 할 때는 공식보다는 코드를 먼저 봤는데 수학에 뭔가 빚을 진 기분이었다. 이런 기분을 조금이라도 덜어보고자 이 책의 출간을 기다렸는데 마침 기회가 되어 한빛미디어의 <나는 리뷰어다=""> 이벤트로 이 책을 읽게 되었다.

    초반부에 이 책은 도구를 어떻게 만들지가 아니라 어떻게 사용할지를 초점을 두고 만들어졌다고 한다. 나 또한 도구를 만드는 것보다는 수학공식을 사용해서 어떻게 분석이나 머신러닝에 활용할지에 대해 목적을 두고 읽었는데 내 목적에 딱 부합하는 책이었다.

    책의 두께가 상당하기는 하지만 분석에 자주 쓰이는 내용들을 최대한 알려주고자 하는 저자 분의 의도가 느껴지는 책이었다.

    파이썬의 대표적인 라이브러리를 활용해서 설명하고 있으며 수학공식과 함께 어떻게 활용해야 하는지 친절하게 설명이 되어있다. 또 수학적 특징에 따라 어떤 라이브러리를 사용하면 좋을지에 대한 내용을 함께 담고 있어서 활용하고자 하는 의도에 따라 라이브러리를 선택할 수 있도록 도움을 준다.

    이 책에서 가장 인상적이었던 부분이 바로 컴퓨터 사용자에 대한 부분이었다. 가끔 라이브러리 설치로 고생하시는 분들을 도와드리다 보면 컴퓨터의 이름이 한글로 된 분들을 종종 봐 왔다. 사소할 수 있는 부분이지만 컴퓨터 사용자의 한글 이름 때문에 설치와 설정 지옥으로 며칠을 고생하시는 분들을 많이 봐 왔기 때문에 꼭 필요한 내용이 잘 소개가 되어있다는 생각이 들었다.

    주요 라이브러리의 역할을 소개하고 있고 어떻게 사용하면 좋을지에 대한 내용이 적절하게 들어가 있다.

    함수와 역함수도 자주 그리게 되는 그래프 중 하나인데 공식과 함께 잘 설명이 되어있다. 요즘 수학을 사용하며 느끼는 건 중고등학교 때 이렇게 수학을 배웠다면 훨씬 잘 이해할 수 있지 않았을까라는 아쉬움이 든다. 공식만으로는 이해하기 힘든 부분을 시각화를 하게 되면 왜 이런 공식을 써야 하는지 훨씬 잘 와닿게 되는거 같다.

    많이 활용되는 로지스틱 함수도 공식과 그래프를 함께 보면 더 잘 이해할 수 있는거 같다. 회귀 뿐만 아니라 분류에도 잘 쓰이며 머신러닝, 딥러닝 고루 사용되는데 이 책을 통해 그간 그림처럼 봐 왔던 공식을 이해하는데 도움이 되었다.

    해설지도 따로 제공이 되어서 책과 분철할 수 있게 되어 있다. 책 두께가 상당한 편인데 들고 다니면서 볼때 분철하면 좋을 것 같다. 데이터 사이언스 스쿨 사이트의 내용이 상당히 방대한 편인데 제목에 “수학편”이라고 되어 있으니 다른편도 나오지 않을까 기대가 된다.

    이 책의 코드는 아래 깃헙에서 받을 수 있다.

    datascienceschool/math: 데이터 사이언스 스쿨 : 수학편 코드 주피터노트북

    전체적으로 난이도가 좀 있는 책으로 파이썬 코드를 통해 수학 공식을 이해하고자 하거나 머신러닝, 딥러닝 알고리즘을 자주 사용해 왔지만 수학에 빚을 지고 있는 듯한 느낌을 받는 사람이 보면 좋을거 같다.

  •  

    소문난 명강의 김도형의 데이터 사이언스 스쿨 ...

    작가
    김도형
    출판
    한빛미디어
    발매
    2019.11.20.

    리뷰보기

     

    책을 받자마자 두께에 놀랐다. 개발하면서 필요한 수학적 지식을 위해 얇은 수학 개념 서적은 읽어보았지만 이건 전공 책이라고 할만한 정도로 두껍다. 소개를 보면 수학 비전공 인공지능 개발 입문자와 현업 전문가에게 핵심 수학을 알려준다고 되어있다. 한 100여 페이지 정도까지는 납득하며 읽을만한 수준이지만, 그 뒤는 사실 수포자나 문과 출신에게는 꽤 어렵지 않나 싶은 정도의 내용이라고 본다. 컴공 출신이지만 선형대수 성적이 좋지 않아 재수강까지 했었는데, 첫 챕터부터 선형대수가 나온다. 그 뒤로는 미분, 적분에 이어 확률 순서로 나온다. 뭔가 순서가 반대로 되어있지 않나 하는 생각도 들었다.

     

    많은 내용이 들어있고, 파이썬 코드와 라이브러리를 통해 수학적인 모델을 실습해볼 수 있다는 건 참 좋았다. 텐서플로나 파이썬 입문 관련 서적으로 실습할 때 맥북에 파이썬 라이브러리를 설치해서 했었는데, 이 책에서는 코랩을 통한 주피터 노트북을 소개해줘서 간단한 실습은 브라우저 환경에서 가능했다.

     

    텐서플로 입문 같은 책에서는 텐서플로 활용에 대한 설명은 잘 되어있지만, 기반이 되는 수학적 지식에 대한 설명이 부족하다 생각했는데 이 책을 통해 그런 지식을 많이 쌓을 수 있겠다. 최근 들은 이야기로, 머신 러닝, 딥러닝에 있어서 요즘엔 도구나 라이브러리, 구현 모델 등은 거의 다 만들어져 있고, 필요한 건 데이터를 모으고 머신 러닝에 활용할 수 있도록 가공하는 작업이 더 중요하다고 한다. 데이터를 만지려면 아무래도 수학이나 통계에 관한 지식을 쌓아야 할 텐데, 이 책이 큰 도움이 될 거라 생각한다.

     


     

  • 데이터 사이언스 입문자를 위한 수학 기본서라고 할 수 있을 거 같다. 

    필자는 이과지만 수포자이므로 수리 나형( 나이대 유출 )을 보았다. 물론 대학에서 미적분, 선형대수, 이산수학, 확률과 통계를 필수 교양으로 수강하긴 하였다. 정말이지 이해하고 푸는 게 아니라 억지로 외워서 전부다 겨우 B+ 맞았던 것으로 기억한다.

    이러한 입장에서 책을 접하였는데 일단 친절하다.

    솔직하게 한빛미디어 책을 많이 보는 것은 아닌데 19년 하반기 이후의 책들은 보는 책마다 친절한 것 같다.

    무엇이 친절하냐면 일단 눈높이 교육이 제대로 들어간다. 물론 입문자의 눈높이에 맞추어서 집필된 책이어서 그럴 것이다.

    그러나 개인적으로 느끼기에 독자를 고려한 책일지라도 진짜 수포자( 필자 )가 보았을 때 이해하면서 실습하기는 어려울 것이라고 생각했다.

     


     

     

     

    필자는 수학포기 개발자다. 그러나 이 책은 비전공자도 고려한다. 하여 나 같은 수포자라도 접근은 할 수 있다.

     

    시작하기 전에는 아무리 쉽게 썼다고 할지라도 내가 넘을 수 있을까 라는 의문이 가득하였다.

    그러나 개념자체를 쉽게 설명해주고 연습문제를 통하여 수식을 받아들이게 한다.( 수식만 봐도 그냥 눈과 머리가 아픈 게 나 같은 수포자일 것인데 말이다. )

     

    책 서두에 파이썬을 좀 알아야 한다고 적혀있긴 한데 개발자라면 그냥 보아도 무방할 것 같다. 나같은 수포자일 경우 수식 때문에 아무래도 버퍼링이 생기지만 파이썬을 활용하는 부분은 그냥 책만 따라가도 충분하다.

    물론 사용되는 함수 하나하나 이해하고 넘어가고 싶다면 파이썬을 좀 공부해야 될 것이다. 그러나 개인적으로 개발자라면 유추가 가능할 것이고 그래도 부족하다면 모르는 것들만 검색하면서 이해하고 넘어가면 된다고 생각한다.

     

    여차저차 일단 파이썬 설치하고 수학기호를 눈에 익힌다. 여기서 만약 나 같은 수포자임에도 불구하고 수식을 풀어보지 않고 지나간다면 뒤에서 수식을 보았을 때 "이 뭔 개소리야"를 시전할 수 있다. 그러니 풀어보고 넘어가자.

     

    전체적으로 수학적인 부분은 선형대수, 미적분, 확률, 기타 등등로 구분할 수 있겠고 파이썬 모듈사용에 있어서는 심파이, 사이파이, 피지엠파이, 맷플롯립 등등을 사용한다.

     

    매 챕터를 진행할 때마다 기본적으로 용어설명을 자세히 해준다. 어디서 들어보았고 사용해 본 용어일지라도 일단 확인하고 넘어가자. 필자가 알고 있는 용어들과 다른 뜻으로 사용하는 경우가 꽤 많았다.( 필자가 이상한 것일 수도 있다. )

     

    책의 분량이 굉장히 방대하므로 일일이 설명하긴 힘들고 주저리주저리 했는데 위에 언급한 것들이 이 책의 장점이다.

    1. 최근에 윤인성 저자가 가장 설명이 친절하다고 생각하였는데 만만치 않게 친절하다. 그것도 쉽게 친절하다.( 용어설명뿐만 아니라 개념 설명도 )
    2. 정말 비전공자라 할지라도 파이썬 좀 해봤다면 충분히 소화할 수 있다.
    3. 충분한 연습문제들이 있다.

    단점은 방금 말한 방대한 분량인데 챕터별로 잘 분류가 되어 있으니 공부해보고 싶은 챕터를 골라서 공부하면 될 듯하다.

    0장과 1장은 필수지만 그 이후에는 필요한 것부터 봐도 될 것이다. 선형대수가 필요하다면 2장, 3장 미적분이 필요하다면 4장 확률이 필요하다면 6장 ~ 8장 등등 목차만 봐도 어떻게 보면 될지 알 수 있을 것이다.

    또 하나 단점?이라고 하자면 용어설명과 개념 설명은 친절하고 좋은데 거의 모든 게 새로운 용어와 개념들이다.

    그러므로 처음엔 모두 이해하려 하지 말고 그냥 이해한 만큼만 노트에 정리하면서 넘어가자. 그리고 나중에 복기하자.

     

    마지막으로 단기간에 공부하시려는 분들은 위의 단점들을 잘 고려하여 진행하시기 바랍니다. 
    정말 용어, 개념, 분량 다 토나옵니다. 그럼에도 불구하고 읽히는 책입니다.( 그만큼 쉽게 설명한다. )


  • 20191210_140203.jpg

     

    데이터 분석이나 인공지능을 시작했지만 수학에 막혀서 좌절 하셨던 분이나 무엇부터 시작해야 할지 몰라서 고민인 분들이 보시면 좋을 것 같습니다.

     

    수학 기초부터 심화 내용까지 잘 정리되어 있으며, 파이썬을 이용해 데이터를 다뤄보는 부분까지 참 잘 구성되어 있는 책입니다. 데이터 분석 분야의 기본서로 손색없는 좋은 책입니다.

     

    다만, 책의 분량이 많기 때문에 확실한 동기부여를 가지고 시작하시는 것을 권합니다.

     

    본격적으로 데이터 분석을 시작하기 전에 확실하게 기본을 다지고 싶으신 분들에게 이 책을 추천합니다.

     

  • 기능 구현에 초점을 맞추다 보면 기초 수학을 놓치는 경우가 많다. 이미 함수안에 녹아 들어있는 개념들을 굳이 공부하지 않아도 단순히 가져다 쓰면 된다는 생각이 먼저 들기 때문이다. 하지만 조금 더 넓게 그리고 멀리 공부하기 위해서는 언젠가 한번은 마주하게 되는것이 기초 수학이라는 생각이 든다. 딥러닝 네트워크가 제 아무리 저명한 논문들에 의해 발표된걸 가져다 쓰면 된다고 해도 결국 그 내부의 뼈대를 이루는 기초 알고리즘을 이해 해야지만 그 이후에 내 데이터셋에 맞는 최적화가 가능하다. 데이터 사이언티스트를 꿈꾼다면 단언컨대 적어도 이책에 있는 개념들은 모두 알고 있어야 한다. 그리고 이론만 아는 사람이 아닌 실제로 그 이론을 가지고 결과물을 만들어 낼 수 있는 사람을 원하는 요즘 <김도형의 데이터사이언스 스쿨> 은 그 시작 개론서로써 손색이 없다. 내가 파이썬을 이용한 데이터 관련 공부를 시작하고 싶은데 어디서부터 시작해야할지 모르겠다는 분들에게 일단 한 챕터 만이라도 좋으니 이 책을 접해보라고 권하고 싶다.

  •  

    책은 1권, 2권으로 나눌수 있게 되어있는데... 1권은 본책이 2권은 문제풀이가 있어서 쉽게 풀이를 볼 수 있게 되어있다.

     

    머신러닝, 딥러닝을 포함한 데이터분석에서 수학은 피할 수 없고 이해가 떨어지기 때문에 수학은 필요하긴 하다고 생각하고 있었다.

    비록... 이과에 수포자였지만.....ㅠㅠ

    이 책을 딱 넘겨보고는 나에게 넘오 어려운 수학..ㅠㅠ

    그래도 중고등학교 수학을 배우신 분이라면 누구라도 학습할 수 있다고하고, 수학은 도구이기 때문에 빠르게 익혀 필요한 시점에 효율적으로

    사용하는 것이 중요하니 어떻게 사용하는지에 대한 초점을 맞춰 효율적이라 생각된다.

    입문자와 비전공자를 위해 기초부터 구성되어있고, 머신러닝 이해에 필요한 핵심내용만 선별했다고 한다.

     

    여기나오는 모든 수식과 알고리즘은 파이썬 코드로 구현되어있고 파이썬패키지 자유롭게 사용할 수 있고 이해하기 쉽도록 도와주고 있다.

    파이썬이 처음이라도 파이썬설치부터 자세히 나와있기 때문에 처음부터 막히지는 않도록 비입문자도 배려되게 나옴.

    대세는 파이썬인가...

    이책에서 다루는 파이썬3.7과 아이파이썬(IPython), 사이킷런(Scikit-Learn), 맷플롯립(matplotlib), 넘파이(NumPy), 시본(seaborn),

    사이파이(SciPy), 피지엠파이(pgmpy) 7개의 패키지가 사용되었다.


     

    개념을 먼저 정리하고 예제를통해 이해를 한다음 연습문제를 풀면서 실습하게 구성되어있다.

    연습문제가 300여개 정도가 있는데 다 풀어본다면 머신러닝과 딥러닝에서 수학이 필요로 할때 자신있게 분석할 수 있을거 같다.

     

    



  • <나는 리뷰어다> 11월 이벤트 당첨으로 작성한 리뷰 입니다.

    [한줄평]

    머신러닝, 딥러닝에 필요한 수학을 한큐에 해결 할수 있는 책입니다.


    [목차구성]

    0장 파이썬 설치와 사용법
    1장 수학 기호

    2장 넘파이(Numpy)로 공부하는 선형대수
    3장 고급 선형대수

    4장 심파이(SymPy)로 공부하는 미적분

    5장 사이파이(SciPy)로 공부하는 최적화

    6장 공부하는 확률론 피지엠파이(pgmpy)로

    7장 확률변수와 상관관계

    8장 사이파이로 공부하는 확률분포

    9장 추정과 검정

    10장 엔트로피


    [주요 내용]

     대학에서 수학을 전공하지 않은 인공지능 개발 입문자와 협업 전문가에게 핵심 수학을 알려줍니다. 수식에 많이 사용되는 그리스 알파벳과 고등학교 과정의 수학 기호부터 설명해 누구나 차근차근 수학을 익힐 수 있습니다. 기초부터 출발하지만 데이터 분서고가 머신러닝에 필요한 모든 필수 수학을 다루며, 모든 수식은 파이썬 패키지를 활용해 코드로 보여줍니다. 스타트업 파일을 적용한 파이썬 주피터 노트북 실습 환경도 제공합니다.

     

     선형대수, 함수론, 미적분, 최적화 등 다양한 수학 분야를 다루지만 데이터 분석과 머신러닝에 꼭 필요한 내용만을 최소한으로 선별했습니다. 핵심 내용만 있으므로 이 책에 실린 내용을 충실히 익히면 데이터 분석과 머신러닝 이론을 효과적이고 깊이 있게 공부하는 데 도움이 됩니다. 


     데이터 분석과 머신러닝은 코드로 알고리즘을 구현하으므로 수학 수식만으로 이해해서는 부족합니다. 따라서 이 책의 모든 수식과 알고리즘은 파이썬 코드로 구현합니다. 수학을 코드로 이용하려는 개발자 입장을 고려해 알고리즘 자체를 구현하기 보다는 알고리즘이 구현된 넘파이, 심파이, 사이파이, 피지엠파이 등의 패키지 기능을 잘 이해하고 자유롭게 사용할 수 있도록 하는 것을 목표로 합니다.


     책에서 설명하는 내용을 제대로 이해하고 있는지 확인하는 연습문제 300여 개가 있습니다. 모든 연습 문제는 머신러닝의 이론을 설명할 때 나오는 수식의 일부를 미리 풀어보는 문제 입니다. 연습문제를 풀수 있다면 나중에 나올 복잡한 수식을 쉽게 이해할 수 있습니다.


    [이 책의 특징]

    -입문자와 비전공자를 위해 기초부터 시작

    -머신러닝 이해에 필요한 핵심 내용만 선별

    -파이썬 구현을 통한 이해와 응용

    -연습 문제 300여 문항


    [서평]

    머신러닝 혹인 딥러닝 관련 일을 하는분이라면 ‘데이터 사이언스 스쿨’을 알고 있을 것입니다. 저 또한 딥러닝 관련 이슈가 있으면 데이터 사이언스 스쿨에서 많은 도움을 받았습니다. 이책의 저자인 김도형님은 ‘데이터 사이언스 스쿨’에서 데이터 분석 관련 수학과 머신러닝을 강의 하고 있어 믿고 볼수 있는 책이라 생각합니다. 


    이책은 러신머닝과 딥러닝, 인공지능등 배울때 꼭필요한 수학 지식을 입문자와 비전공자를 위해 기초 이론 부터 자세하게 알려 주고 있습니다. 


    데이터 분석과 머신러닝을 하려면 수학을 필수적으로 배워야 합니다. 그리고 수학 수식 만으로는 코드로 알고리즘을 구현하기 어렵습니다. 그래서 이 책에서는 모든 수식과 알고리즘을 파이썬 코드로 구현합니다. 그리고 파이썬에서 제공하는 수학 라이브러리인 넘파이, 심파이, 사이파이, 피지엠파이등 패키지 기능을 이해하고 자유롭게 사용할 수 있도록 도와 주고 있습니다. 


    마지막으로 각 장 마다 책의 내용을 잘 이해하고 있는지 확인하는 연습 문제가 300여 개가 있습니다. 이론을 학습하고 연습문제를 다 풀수 있다면 나중에 복잡한 수식이 나와도 응용력이 생겨 해결하는데 많은 도움이 될것입니다.

     

  • 처음 이 책을 받았을 때, 데이터 사이언스 스쿨 어디서 많이 들어봤는데라는 생각이 들었습니다. 

     

    아니나 다를까, https://datascienceschool.net/ 항상 모르는 게 있으면 구글링을 통해 들어가 보는 

     

    유명한 사이트 중에 하나 더군요.

     

    사이트에서도 많은 도움 받았는데, 저자분의 책을 이렇게 서평 하게 돼서 영광입니다. 

     

    이 책의 특징으로는 크게 4가지가 있습니다. 

     

    1. 수학을 전공하지 않는 입문자와 비전공자를 위해 기초부터 시작

     

    2. 반복되는 실습 환경설정을 스타트업 파일로 한 번에 해결

     

    3. 6자기 데이터 사이언스용 파이썬 라이브러리 사용

     

    4. 300여 연습 문제 제공

     

    개발환경으로는 파이썬3.7버전을 기준으로 하며, 패키지로는 

     

    IPython, Scikit-Learn, Jupyter Notebook, matplotlib, Numpy, Seaborn, Scipy, Pgmpy 를 사용했습니다.

     

    ★ 이 책의 구성

     

    [0장 파이썬 설치와 사용법]

     

    [1장 수학 기호]

     

    [2장 넘파이(Numpy)로 공부하는 선형대수]

     

    [3장 고급 선형대수]

     

    [4장 심파이(SymPy)로 공부하는 미적분]

     

    [5장 사이파이(SciPy)로 공부하는 최적화]

     

    [6장 피지엠파이(pgmpy)로 공부하는 확률론]

     

    [7장 확률변수와 상관관계]

     

    [8장 사이파이로 공부하는 확률분포]

     

    [9장 추정과 검정]

     

    [10장 엔트로피]

     

     

    교과서처럼 '학습목표'로 시작하는게 인상적이다!

    개념 정의 부터 시작 한 뒤

    예제를 통해 적용 한뒤, 연습문제를 통해 제대로 알고 있나 확인한다.

    마지막 정리및 다음차시 예고 까지

    어려운 수학 개념들에는 그림을 이용하여 학습자의 이해를 도왔다.


    특히 10장 엔트로피 부분은 수학을 전공하는 사람들에게도 필수로 읽어봐야 한다고 생각한다.
     
    왜냐면 KL-divergence 나 정보 이론의 경우 배운 경험이 없기 때문에, 이러한 부분이 논문에 나오게 
     
    되면 교수님도 모르는 진풍경이 일어나기도 한다.(저가 경험해봤습니다 ㅠㅠ)
     
    상호정보량 같은 정보 이론을 내가 어찌알겠는가? 
     
    하지만 이 책에서는 이렇게 쉽게 설명해주어서 적어도 논문을 읽거나 수식이 필요한 부분에 있어 
     
    큰 도움을 받을 수 있다고 생각한다. 
     
    빅데이터, AI 분야로의  진학을 희망하는 모든 사람들에게 이 책을 추천한다. 

부록/예제소스
자료명 등록일 다운로드
DOWNLOAD 예제소스 2019-11-19 다운로드
결재하기
• 문화비 소득공제 가능
• 배송료 : 0원배송료란?

배송료 안내

  • 책, 아이템 등 상품을 3만원 이상 구매시 무료배송
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 도서명 :
소문난 명강의 : 김도형의 데이터 사이언스 스쿨(수학 편)
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
소문난 명강의 : 김도형의 데이터 사이언스 스쿨(수학 편)
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
소문난 명강의 : 김도형의 데이터 사이언스 스쿨(수학 편)
구입처*
구입일*
부가기호*
부가기호 안내

* 회원가입후 도서인증을 하시면 마일리지 500점을 드립니다.

* 한빛 웹사이트에서 구입한 도서는 자동 인증됩니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한됩니다.

* 절판도서, eBook 등 일부 도서는 도서인증이 제한됩니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실