메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

소문난 명강의 : 김도형의 데이터 사이언스 스쿨(수학 편)

파이썬 라이브러리로 배우는 데이터 과학 필수 수학

한빛미디어

집필서

판매중

  • 저자 : 김도형
  • 출간 : 2019-11-20
  • 페이지 : 880 쪽
  • ISBN : 9791162242414
  • 물류코드 :10241
  • 초급 초중급 중급 중고급 고급
4.6점 (15명)
좋아요 : 2

“소문난 명강사 ‘김도형’이 데이터 사이언스 입문자에게 보내는 선물 같은 수학 책

 

선형대수, 미적분, 최적화, 확률론, 검정과 베이즈 추정까지 머신러닝과 딥러닝에  필요한 모든 수학을 한권에!”

 

이 책은 대학에서 수학을 전공하지 않은 인공지능 개발 입문자와 현업 전문가에게 핵심 수학을 알려줍니다. 수식에 많이 사용되는 그리스 알파벳과 고등학교 과정의 수학 기호부터 설명해 누구나 차근차근 수학을 익힐 수 있습니다. 기초부터 출발하지만 데이터 분석과 머신러닝에 필요한 모든 필수 수학을 다루며, 모든 수식은 파이썬 패키지를 활용해 코드로 보여줍니다. 스타트업 파일을 적용한 파이썬 주피터 노트북 실습 환경도 제공합니다.

(알림 : 독자 여러분이 파이썬 언어에 대한 기초적인 지식이 있다고 가정합니다)

 

 

★ 이 책의 특징

[입문자와 비전공자를 위해 기초부터 시작]

대학에서 수학을 전공하지 않은 인공지능 개발 입문자와 현업 전문가에게 핵심 수학을 알려줍니다. 수식에 많이 사용되는 그리스 알파벳과 고등학교 과정의 수학 기호부터 설명해 누구나 차근차근 수학을 익힐 수 있습니다. 기초부터 출발하지만 데이터 분석과 머신러닝에 필요한 모든 필수 수학을 다루며, 모든 수식은 파이썬 패키지를 활용해 코드로 제시합니다.

 

[머신러닝 이해에 필요한 핵심 내용만 선별]

선형대수, 함수론, 미적분, 최적화 등 다양한 수학 분야를 다루지만 데이터 분석과 머신러닝에 꼭 필요한 내용만을 최소한으로 선별했습니다. 핵심 내용만 있으므로 이 책에 실린 내용을 충실히 익히면 데이터 분석과 머신러닝 이론을 효과적이고 깊이 있게 공부하는 데 도움이 됩니다. 이해가 되지 않는 부분은 반복해서 공부하시기 바랍니다.


[파이썬 구현을 통한 이해와 응용]

데이터 분석과 머신러닝은 코드로 알고리즘을 구현하므로 수학 수식만으로 이해해서는 부족합니다. 따라서 이 책의 모든 수식과 알고리즘은 파이썬 코드로 구현합니다. 수학을 코드로 이용하려는 개발자 입장을 고려해 알고리즘 자체를 구현하기보다는 알고리즘이 구현된 넘파이(NumPy), 심파이(SymPy), 사이파이(SciPy), 피지엠파이(pgmpy) 등의 패키지 기능을 잘 이해하고 자유롭게 사용할 수 있도록 하는 것을 목표로 합니다. 

 

[연습 문제 300여 문항]

책에서 설명하는 내용을 제대로 이해하고 있는지 확인하는 연습 문제 300여 개가 있습니다. 모든 연습 문제는 머신러닝의 이론을 설명할 때 나오는 수식의 일부를 미리 풀어보는 문제입니다. 연습 문제를 풀 수 있다면 나중에 나올 복잡한 수식을 쉽게 이해할 수 있습니다.

 

 

★ 이 책에서 다루는 파이썬 패키지

이 책의 코드를 구현하는 데 파이썬 3.7과 다음 패키지를 사용했습니다.

  • 아이파이썬(IPython)
  • 사이킷런(Scikit-Learn)
  • 맷플롯립(matplotlib)
  • 넘파이(NumPy)
  • 시본(seaborn)
  • 사이파이(SciPy)
  • 피지엠파이(pgmpy)

 

★ 이 책의 구성

[0장 파이썬 설치와 사용법]

_ 파이썬과 파이썬 패키지를 설치하고 사용하는 방법을 배웁니다.

_ 데이터 분석에 필요한 파이썬 패키지를 소개합니다.

_ 아이파이썬과 주피터를 사용자에 맞게 설정하는 방법을 알려줍니다. 

 

[1장 수학 기호]

_ 수식에 많이 쓰이는 그리스 알파벳을 읽고 쓰는 법을 배웁니다.

_ 머신러닝 교과서나 논문에 자주 사용되는 수학 기호의 의미를 알아봅니다. 

 

[2장 넘파이(Numpy)로 공부하는 선형대수]

_ 스칼라, 벡터, 행렬, 텐서의 의미와 기호, 넘파이 패키지를 사용하는 방법을 배웁니다.

_ 행렬의 연산과 성질, 그리고 연립방정식을 다룹니다. 

 

[3장 고급 선형대수]

_ 기하학에서 선형대수가 어떻게 쓰이는지 알아봅니다.

_ 고윳값분해, 특잇값분해를 공부하고 어떤 문제에 응용할 수 있는지 알아봅니다.

 

[4장 심파이(SymPy)로 공부하는 미적분]

_ 머신러닝에서 자주 사용되는 함수와 그 특징을 알아봅니다.

_ 미분과 적분 공식을 배우고 심볼연산이 가능한 심파이 패키지를 사용하여 미적분을 하는 법을 익힙니다.

_ 머신러닝에서 자주 사용되는 행렬의 미적분 공식을 공부합니다.

_ 변분법 개념을 소개합니다. 

 

[5장 사이파이(SciPy)로 공부하는 최적화]

_ 최적화 문제와 최대경사법을 사용하여 최적화 문제를 푸는 방법을 알아봅니다.

_ 사이파이 패키지를 사용하여 실제로 최적화 문제를 푸는 법을 익힙니다.

_ 등식 제한조건이나 부등식 제한조건이 있는 최적화 문제를 푸는 라그랑주 승수법을 공부합니다.

_ 머신러닝 이외에도 여러 분야에 널리 쓰이는 LP 문제와 QP 문제를 소개합니다. 

 

[6장 피지엠파이(pgmpy)로 공부하는 확률론]

_ 확률의 수학적 정의와 빈도주의 및 베이지안 관점에서 확률이 가지는 의미를 공부합니다.

_ 확률분포함수가 어떤 과정을 통해 정의되었는지를 소개합니다.

_ 머신러닝에서 사용하는 중요 개념인 조건부 확률과 베이즈 정리를 배웁니다.

_ 피지엠파이 패키지를 사용하여 확률분포를 구현하고 베이즈 추정을 실행하는 법을 익힙니다.

 

[7장 확률변수와 상관관계]

_ 확률변수를 사용한 데이터 모형의 개념을 배웁니다.

_ 표본 데이터의 기댓값, 분산의 의미와 분산의 기댓값이 가지는 특성을 공부합니다.

_ 베르누이분포, 이항분포, 카테고리분포, 다항분포 등의 이산 분포와 가우시안 정규분포, 스튜던트 t분포, 카이제곱분포, F분포 등의 연속 분포의 정의와 특성, 그리고 이 분포들이 어떻게 데이터 분석에 쓰이는지 알아봅니다.

_ 확률모수 모형에 사용되는 베타분포, 디리클레분포, 감마분포를 소개합니다. 

 

[8장 사이파이로 공부하는 확률분포]

_ 여러 확률변수가 가지는 상관관계를 어떻게 정의하는지 소개합니다.

_ 가장 널리 쓰이는 상관관계 모형인 다변수 정규분포 모형에 대해 알아봅니다.

_ 조건부 기댓값의 개념을 소개하고 머신러닝의 가장 큰 응용 분야인 예측에 어떻게 사용되는지 공부합니다. 

 

[9장 추정과 검정]

_ 데이터가 주어졌을 때 데이터에 기반해 판단하는 방법을 공부합니다.

_ 가장 기본적인 데이터 기반 의사결정인 검정의 개념과 사이파이를 사용한 검정 방법을 익힙니다.

_ 가능도의 개념과 최대 가능도 추정법을 사용하여 확률분포의 모수를 추정하는 방법을 알아봅니다.

_ 모수 추정의 불확실성에 대해 공부하고 베이즈 정리에 기반한 베이지안 모수 추정법을 소개합니다.

 

[10장 엔트로피]

_ 엔트로피의 개념을 소개하고 엔트로피가 확률변수가 가진 정보량과 어떤 관계가 있는지 알아봅니다.

_ 크로스 엔트로피와 쿨백 라이블러 발산을 사용하여 확률분포의 유사성을 비교하는 방법을 공부합니다

 

상세이미지_700.jpg

 

 

김도형 저자

김도형

 카이스트에서 자동 제어와 신호 처리를 전공했고 박사 학위를 받았다. 박사 학위 과정 중에 처음 파이썬을 접했으며 시간이 날 때마다 파이썬을 활용했다. LG전자와 대우증권에서 파생 상품 프라이싱 시스템, 금융 정보 모니터링 시스템, 알고리즘 트레이딩 시스템 등을 파이썬으로 구현했다. 현재는 파이썬 기반 금융 분석, 최적 집행용 소프트웨어와 서비스를 만들고 있으며, 금융 분석 분야에서 파이썬이 더 널리 퍼질 수 있게 도울 수 있는 징검다리가 되고자 강의를 하고 있다. 

0장 파이썬 설치와 사용법

__0.1 커맨드 라인 인터페이스 

__0.2 파이썬 설치하기 

__0.3 파이썬 처음 사용하기 

__0.4 파이썬 패키지 설치하기 

__0.5 데이터 분석용 파이썬 패키지 소개 

__0.6 아이파이썬 및 주피터 설정 

__0.7 구글 코랩 사용법 

__0.8 마치며 

 

1장 수학 기호

__1.1 그리스 문자 

__1.2 수열과 집합의 합과 곱 

__1.3 마치며 

 

2장 넘파이(Numpy)로 공부하는 선형대수

__2.1 데이터와 행렬

__2.2 벡터와 행렬의 연산 

__2.3 행렬의 성질 

__2.4 선형 연립방정식과 역행렬 

__2.5 마치며 

 

3장 고급 선형대수

__3.1 선형대수와 해석기하의 기초 

__3.2 좌표와 변환 

__3.3 고윳값분해 

__3.4 특잇값분해 

__3.5 PCA 

__3.6 마치며 

 

4장 심파이(SymPy)로 공부하는 미적분

__4.1 함수 

__4.2 심파이를 사용한 함수 미분 

__4.3 적분 

__4.4 행렬의 미분 

__4.5 변분법 

__4.6 마치며 

 

5장 사이파이(SciPy)로 공부하는 최적화

__5.1 최적화 기초 

__5.2 제한조건이 있는 최적화 문제 

__5.3 선형계획법 문제와 이차계획법 문제 

__5.4 마치며 

 

6장 공부하는 확률론 피지엠파이(pgmpy)로 

__6.1 집합 

__6.2 확률의 수학적 정의와 의미 

__6.3 확률의 성질 

__6.4 확률분포함수 

__6.5 결합확률과 조건부확률 

__6.6 베이즈 정리 

__6.7 마치며 

 

7장 확률변수와 상관관계

__7.1 확률적 데이터와 확률변수 

__7.2 기댓값과 확률변수의 변환 

__7.3 분산과 표준편차 

__7.4 다변수 확률변수 

__7.5 공분산과 상관계수 

__7.6 조건부기댓값과 예측 문제 

__7.7 마치며 

 

8장 사이파이로 공부하는 확률분포

__8.1 사이파이를 이용한 확률분포 분석 

__8.2 베르누이분포와 이항분포 

__8.3 카테고리분포와 다항분포 

__8.4 정규분포와 중심극한정리 

__8.5 스튜던트 t분포, 카이제곱분포, F분포 

__8.6 다변수정규분포 

__8.7 베타분포, 감마분포, 디리클레분포 

__8.8 마치며 

 

9장 추정과 검정

__9.1 확률분포의 추정 

__9.2 최대가능도 추정법 

__9.3 베이즈 추정법 

__9.4 검정과 유의확률 

__9.5 사이파이를 사용한 검정 

__9.6 마치며 

 

10장 엔트로피

__10.1 엔트로피 

__10.2 조건부엔트로피 

__10.3 교차엔트로피와 쿨백-라이블러 발산 

__10.4 상호정보량 

__10.5 마치며 

★ <소문난 명강의>시리즈 소개

이 시리즈는 단기간에 실무 능력을 갖추게 도와줍니다. 유튜브, 블로그, 학원, 대학 등에서 이미 검증된 강의 본연의 장점을 극대화하고 더 체계화해 책으로 담았습니다. 입문자 눈높이에서 설명하고 작고 실용적인 프로젝트를 수행해 실전 능력을 키워줍니다. 빠르게 개발 능력을 배우려는 입문자와 더 다양한 경험을 쌓으려는 기존 개발자에게 유용합니다.

 

★ 이 책의 모태 소문난 명강의 360만 뷰 ‘데이터 사이언스 스쿨’ 소개

저자는 2016년부터 ‘데이터 사이언스 스쿨’(datascienceschool.net)에 데이터 분석과 관련된 글과 자료를 무료로 공개하고 있습니다. 2019년 10월 1일 현재까지 누적 사용자 60만 명 이상, 누적 페이지 뷰 360만 뷰 이상이며 많은 피드백을 받고 있습니다.

 

‘데이터 사이언스 스쿨’ 웹사이트는 데이터 분석에 필요한 A부터 Z까지의 모든 내용을 다루는 것을 목표로 합니다. 끊임없이 내용을 수정/보완하고 있으며 데브옵스, 프로그래밍 언어, 데이터 분석을 위한 수학, 회귀분석과 시계열분석, 머신러닝, 딥러닝을 주제로 다룹니다.

 

이 책은 ‘데이터 사이언스 스쿨’ 웹사이트 중 ‘데이터 분석을 위한 수학’에 해당합니다. 대부분 책 내용은 웹사이트에 게재되어 있습니다. 다른 내용도 책으로 정리하여 출간될 예정입니다. 많은 관심 부탁드립니다.

요즘에는 통계에서 데이터 분석을 접근하는 책, 또는 싸이킷런과 같은 파이썬 라이브러리 등을 기본으로 데이터 분석을 배우는 책은 많이 나와있어서 '데이터 분석을 위한 통계', '데이터 분석을 위한 프로그래밍'은 통계, 컴퓨터공학 비 전공자라도 데이터 분석을 위해서 어느 선까지 알아야 하는지 파악이 가능하다.

하지만 데이터 분석을 위한 수학을 주제로 접근하는 책은 많지 않아서 아쉬웠는데 마침 수학이 제일 아쉬울 때 이 책을 접하게 되어 기뻤다.

 

수학기호 읽는 법부터 시작해서 수열의 합과 곱을 기호 및 공식과 함께 이해하는 것부터 시작된다. 저자가 꼭 직접 써보고 연습문제 풀어가면서 공부하라고 강조하고 있는데 착실한 학생이 된 기분으로 그렇게 따라가면서 했더니 실제로 내가 모르는데 대충대충 이해하고 넘어가고 있었구나 하는 생각이 들었다.

실제로 빤한 연습문제 같지만 제법 틀리는 것 보고 충격을 좀 받았다.

연습문제 풀이를 따로 분책해서(직접 잘라서) 볼 수 있도록 되어 있는 점은 좋은 아이디어인 듯.

이참에 데이터 분석에 관한 수학은 마스터해야겠다는 생각을 가진 사람은 연습문제 노트에 꼭 풀어가면서 공부하는 것이 좋을 것 같다.

 

matplotlib(맷플롯립), pgmpy(피지엠파이)와 같은 패키지 이름도 처음 접하는 사람들에게는 한글로 어떻게 읽어야 할지 헷갈리는 경우가 많은데 이러한 새로운 패키지명 등 꼭 읽기를 알고 넘어가야 하는 용어들은 읽기 표기도 항상 언급하고 있다. 정말 저자가 기초부터 차근차근 가르치려고 하고 있구나 하는 생각이 들었다.

 

numpy와 선형대수, sympy와 미적분 등 데이터 분석 필수 패키지와 수학 이론들을 매핑해서 둘 다 동시에 익힐 수 있도록 한 구성도 마음에 든다.

 

스크린샷 2019-12-16 오후 2.02.02.png

 

 

참고로 이 책은 데이터 사이언스 스쿨의 여러 강좌 중 "수학"에 해당하는 내용이 거의 그대로 옮겨져 있다.

책을 꼭 사지 않더라도 홈페이지 강의 내용을 차근차근 보고 공부해도 될 것 같다.

하지만 나처럼 공부할 때는 뭔가 책에 긁적거리며 공부하는 타입인 사람들에게는 책 구매가 좋은 선택이 될 것 같다.

4차산업혁명의 파고가 거세게 몰아 치고 있는 요즘 시대에 '데이터'의 중요성은 날이 갈수록 커지고 있다. 데이터는 지금 이 순간에도 끊임 없이 생성되고 있으며 어디에서든 만들어지고 가공 되고 있다. 가공 된 데이터를 통해 가치를 창출해 내고 그것을 서비스로 연결 시켜 비즈니스를 영위하는 기업이 있으며 국가 또한 데이터를 활용해 정책을 입안하고 양질의 행정 서비스를 국민에게 제공한다. 그렇기에 데이터는 4차산업혁명 시대의 원유이며 원석이라고 할 수 있다. 

 

도처에서 수집한 데이터를 가공하고 처리하기 위해서는 다양한 기술들이 요구 된다. 데이터를 수집하는데에 있어서도 여러 다양한 방법들이 동원 됨은 두말하면 잔소리. 수집 된 데이터를 어떻게 해야 정제 되어 가치 있는 '정보'로 승화 시킬 수 있을까? 데이터 과학이란 분야가 바로 데이터의 생애 주기(수집-가공-활용)를 다루는 학문이며 데이터 과학의 세계에서 '데이터'는 곧 숫자와 떼려야 뗄 수 없는 관계에 놓이게 된다. 모든 데이터는 수치화 될 수 있고 수치 화 된 자료를 바탕으로 분석은 시작 된다. 

 

데이터 과학을 제대로 하기 위해서는 다양한 수학 이론과 지식이 필요한데, 그것들을 일일이 개별적으로 학습 해 나가는 것 만큼 어려운 일이 또 있을까? 또한 다양한 수학적 개념들을 프로그래밍과 연계하여 처리할 수 있는 방법은 없을까? 여기 바로 그러한 물음에 대한 답을 제공하고 있는 책이 있으니 이름하여 '소문난 명강의 김도형의 데이터 사이언스 스쿨 수학 편'이라는 굉장히 긴 제목의 서적을 소개한다. 

 

이 서적은 데이터 과학을 일반인에게 누구 보다 쉽게 알려 주는 곳으로 정평이 나있는 '데이터 스쿨'의 터줏대감인 김동형 저자가 저술한 결과물이다.

 

이 책은 한마디로 데이터 과학을 하기 위해 반드시 알아야 할 수학 지식을 집대성한 교과서이자 훌륭한 가이드이다. 

아래는 책의 겉표지로서 깔끔하게 디자인 되어 있는 모습을 확인할 수 있다.

 

 

 

또한 2권으로 분권화 되어 있으며 2번째 내용물은 1권의 연습 문제에 대한 해답만 제공하고 있다.

 

 

 

각 챕터별 학습 목표를 제시하여 어떠한 흐름으로 내용이 전개 될지에 대한 개략적인 방향을 엿볼 수 있다. 

 

 

 

내용 중간에 연습문제가 제공 되어 있어 독자로 하여금 스스로 문제를 풀게 하는 기회가 주어진다. 

 

 

아래는 2번째 내용물의 겉표지이다. 

 

 

 

아래 그림에서 볼 수 있듯이 2번째 내용물은 오직 '해답'만 제공한다.

 

 

해당 서적은 데이터 과학을 위해 필수적인 수학적 개념과 이론들을 학습하기 위한 도구로서 '파이썬'을 채택하여 직접 코딩한 결과물들을 바로 확인할 수 있게끔 구성 되어 있다. 데이터 과학에서 결코 빼 놓을 수 없을 정도로 강력한 기능을 제공하고 있는 '파이썬'을 이용하기 때문에 이 책을 통해 학습해 나가기 위해서는 기본적인 파이썬 프로그래밍 실력을 갖추고 있음을 전제로 한다. 

 

이 책은 파이썬과 관련 된 여러 도구 들을 설치하는 것을 시작으로 하여 여러 가지 수학 기호들에 대한 개념 정리를 짚고 넘어가며 Numpy 라이브러리를 통해 선형 대수와 고급 선형 대수에 대한 주제를 다루고 있다. 또한 Scipy와 pgmpy를 통해 최적화 및 확률론을 학습하게 되며 확률분포 및 추정과 검정과 엔트로피에 대한 지식을 배우게 된다. 

 

데이터 과학에 반드시 필요한 수학들을 다루고 있긴 하지만 각 챕터에서 다루는 수학적 지식과 개념이 사실 호락호락한 것들이 아니라 비전공자 혹은 한때 수포자였던 사람들이 책을 정말 제대로 공부하기 위해서는 고등학교 수학 서적을 다시 집어 들어 공부를 해야하지 않을까 싶다. 수학과 친하지 않았던 사람들이 이 책으로 학습해 나가는 것은 결코 쉬운 일이 아님을 다시 한번 강조한다. 한번 더 강조하면 고등학교 레벨의 수학과 파이썬 기본 코딩 실력을 온전히 갖춘 상태에서 이 책을 통해 학습해 나간다면 분명 한층 더 업그레이드 된 자신과 마주할 것이다. 나 역시 이 책을 제대로 공부하기 위해 다시 고등학교 수학 책을 집어 들 것이며 수학적 베이스가 완성 된 상태에서 이 책과 재회했을 때 분명 또 다른 느낌을 경험하고 싶다. 어찌 되었든 이 책을 통해 데이터 과학에 필요한 핵심 수학 개념과 지식들에 대한 흐름을 알 수 있었고 어떠한 부분을 좀 더 세밀하게 공부해야할지에 대한 감을 잡을 수 있었다. 

 

P.S :   
한빛미디어 '나는 리뷰어' 이벤트에 당첨 되어 제공 받은 도서를 바탕으로 작성된 후기입니다


인공지능이 점차 산업 현장에서 늘어나고 있는데요. 

최근 보안 분야에서 머신러닝을 기술을 활용해서 프로젝트를 하고 있습니다. 


딥러닝을 사용하기에는 리스크가 크기 때문에 잘 사용하지 않습니다.

리스크는 계산식들을 직접 설계하고 연산하는 과정에 대해서 이해가 있어야 하는데 수학적인 지식이 부족해서

클라이언트나 청중들에게 설득하기엔 아직 역부족이라고 생각합니다. 


수학적인 지식을 채우기 위해서 책을 찾아봤는데요.

최근 한빛미디어에서 엄청 두꺼운 수학책을 내놨습니다.


그 책은 바로 '소문난 명강의 김도형의 데이터 사이언스 스쿨 수학 편'입니다. 

데이터 사이언스 스쿨을 운영하시는 김도형 분석가님이 낸 책인데요. 

제가 원하는 '수학식에 관련돼 파이썬으로 쉽게 풀어써 져 있습니다. 


그럼 몇 가지 내용을 요약해보도록 하겠습니다.


파이썬2.jpeg

 

 

1) 파이썬 라이브러리 

파이썬을 사용해보면서 넘파이, 판다스를 주로 사용했습니다.


파이썬 설치와 사용법은 많이 해봐서 익숙합니다.


넘파이를 해보면서도 선형대수를 공부하면서 수학이 관련이 많다는 것을 느꼈습니다.


수학 시간에 배운 행렬도 사회에 나가면 쓸 일이 있을까 했었는데요.

행렬이 넘파이를 사용하려면 더 필요하단 것을 알 수 있었습니다.


넘파이를 사용해 역행렬계산도 구할 수 있습니다. 


수학이 데이터 분석에 활용되는 것을 알 수 있었습니다.


파이썬.jpeg

 

 

2) 고급 선형대수 

수학을 배우다 보면 고급 선형대수도 배웁니다.


기하학에서 선형대수가 어떻게 쓰이는지도 알아볼 수 있습니다.


선형대수를 숫자 데이터 계산하는 데만 사용된다 생각하시는 분 계실 겁니다.


선형과 관련된 걸 살펴보면 직선, 화살표를 다루는데 선형대수는 중요한 역할을 합니다.


선형대수의 연산을 어떻게 사용하고 기하학적으로 어떤 의미 인지 볼 수 있습니다.


벡터와 행렬 연산도 알아야 직선의 방정식을 벡터 연산으로 표현이 가능합니다.


고급 선형대수 편을 보면서 선형대수가 필요하단 것을 느끼게 됐습니다.


PS.

피지엠파이 등 사용해보지 않는 패키지들도 사용해보면서 수학적인 감을 잡기 좋았습니다. 

저자가 쥬비터 노트북으로 친절하게 파이썬과 수학을 설명해 놔서 일거양득을 할 수 있는 책이기 때문이죠. 

이 책은 파이썬과 수학을 공부를 병행해서 하실 분에 강력히 추천해 드립니다. 

책 제목 : 김도형의 데이터 사이언스 스쿨(수학 편)

저자 : 김도형

출판년도 : 2019.11.20

 

 

 

 

 

요즘 데이터 사이언스 라는 학문이 한창 붐을 일으키고 있다.

예전부터 빅데이터, 머신러닝, 인공지능등에 관심이 있었는데

최근에 데이터 사이언스라는 학문이 각광받으면서 이 분야를 한번 보고 싶었는데

기회가 생겨 해당 학문을 조금 살펴보게 되었다.


책은 무척 두껍고 두권의 책으로 구성되어 있다.

두꺼운 첫번째 책은 데이터 사이언스 주 내용이 담긴 책이며 두번째 얇은 책은

첫번째 책에 나오는 문제의 해답지다.

해답지만으로 이정도의 두께라 수학이라는 이름에 공포를 느끼는 사람이라면

조금 꺼려질것 같지만 데이터 사이언스는 결국 수학을 기반으로 해야 하는 학문이라

수학과 친해질 수 밖에 없다.

 

 

책 자체는 입문자와 비전공자를 위해 기초부터 시작 하여 머신러닝의 이해와 파이썬을 

활용한 구현에 초점을 두고 있다.

 

 

 

책의 내용...

책은 0~10장 으로 되어 있다.

보통 1장이 시작인데 이 책은 0장이 시작이다.

 

0장은 비전공자를 위해 파이썬 설치와 사용법에 대해 설명한다.

파이썬을 설치하고 데이터 분석을 위한 파이썬 패키지와 아이파이썬, 주피터에 대해설명한다.

1장부터는 책의 본 내용인 수학에 대한 소개가 나온다.

수식에 많이 쓰이는 그리스 알파벳을 읽고 쓰는 법과 머신러닝 교과서나 논문에

자주 사용되는 수학기호의 의미에 대해 설명한다.

그 후로는 데이터사이언스에 필요한 선형대수, 행렬에 대해 설명한다.

이 부분부터 비전공자에게 난관이지 않을까 싶다.

 

4장에서는 머신러닝에서 자주 사용되는 함수와 특징에 대해 설명하고

미분과 적분에 대해 설명한후 이를 심파이 패키지를 이용하여 미적분 하는 법을 익힌다.

함수와 역함수, 그리고 데이터 분석에 많이 쓰이는 함수들을 알아보고

함수의 미분공식을 이용하여 함수의 도함수를 구하는 방법을 알아본다.

 

5장에서는 원하는 것을 최소의 비용으로 찾기 위한 최적화에 대해 설명한다.

몇가지 최적화 방법에 대해 설명하고 사이파이 패키지로 최적화 문제를

푸는 방법에 대해 설명해 준다.

 

6장에서는 확률 기초(확률에 의미, 확률분포함수 등)에 대해 설명하고

7장~10장까지는에서는 6장에서 정의한 내용을 실제로 사용하는 방법을 설명한다.

 

 

책을 읽고나서...

입문서이긴 하지만 다루는 주제는 데이터 사이언스며 그를 위해서는 사실

어느정도 수학과 프로그래밍이 우선되어야 하는것 같다.

그런 면에서 이 책은 입문서이긴 하지만 어느정도 선행지식을 필요로 한다.

수학에 대한 기본적인 지식이 없이는 이 책을 완독하는데 많은 어려움이 따른다.

프로그래밍 지식역시 마찬가지라 생각한다.

이 책은 프로그래밍 기초도서가 아니기 때문에 프로그래밍을 다루더라도

문법같은 걸 다루지는 않는다.

만약 고등수학에 큰 부담이 없고 프로그래밍의 지식이 있다면 이책은 데이터 사이언스라는

학문에 입문하기 위한 좋은 지침이 될 거라고 생각한다.

 

 

링크

데이터 사이언스 스쿨 

예제 압축파일 

책소개 

 

책을 처음 받았을 때의 느낌은 생각보다 책이 두껍다라는 생각을 했다. 해답까지 포함을 하면 800 페이지가 넘는 책이니 두꺼운것은 당연하긴 한데 최근에 읽었던 책중에는 가장 두꺼웠다. (다 읽지는 못했다.)

 

내가 생각한 이 책에 대한 장,단점은 다음과 같다.

 

장점.

정말 정말 넓은 범위의 수학을 접해볼 수 있다. 설명도 있고 예제도 있고 연습문제도 있고. 마치 고등학교때 봤던 수학의 정석책을 보는 느낌이다. 

 

단점.

개인적인 생각으로는 이 책을 읽으려면 준비가 필요하다는 느낌이 들었다. 어떤 준비인가. 바로 수학 지식에 대한 준비이다. 내가 너무 어려워 하는건지는 모르겠지만 일단 수식이 반이상인 이책을 아무리 차근차근 읽어도 처음부터 막히는 부분들이 많다. 그렇기에 책을 읽어가려면 수학적 기본 지식들이 좀더 뒷받침 되어야 할것 같았다. 설명이 자세히 나와있긴 하지만 그 설명을 이해하려면 또다른 무언가가 나에게는 필요했다.

 

사람들이 여행을 하기 전에 여행 할 곳에 대해서 많이 공부를 하면 그만큼 많은 것을 볼수 있다고 말한다. 그것과 마찬가지로 이 책은 데이터사이선스에 대해서 좀더 준비된 독자에게는 정말 기초를 탄탄하게 만들어줄 수 있는 책인것 같다.


https://blusky10.tistory.com/419

 

파이썬 라이브러리로 배우는 데이터 과학 필수 수학

 

SE-2b783118-e549-47c4-9740-b2b3895d05d7.jpg

 

이 책은 대학에서 수학을 전공하지 않은 인공지능 개발 입문자와 현업 전문가에게 핵심 수학을 알려줍니다. 수식에 많이 사용되는 그리스 알파벳과 고등학교 과정의 수학 기호부터 설명해 누구나 차근차근 수학을 익힐 수 있습니다.

 

실로 어마무시한 책

 

책을 가볍게 들고 찍을 것 처럼 보이지만 전혀 그렇지 않습니다. 이 책은 전체가 850페이지가 넘어가는 어마무시한 책입니다. 전체라 함은 두 권으로 나눠져 있지요. 작은 하나는 문제 해답을 담고 있습니다. 해답지를 빼더라도 이 책은 720페이지가 넘습니다. 하지만 다 이유가 있는 것이지요.

 

DSC_3223.jpg

 

SE-12a18af0-7bb6-4ee3-97c1-05ebdcf4881b.jpg

 

처음은 파이썬 환경 구축을 위한 친절한 가이드가 있고 다음부터 본격적인 수학 지식을 가르칩니다. 처음에 나오는 것이 바로 그리스 문자입니다. 학부 시절에 교수님이 외우라고 하면서 시험도 쳤던 기억이 어렴풋이 났습니다. 도대체 무엇때문에 외우는지 중요성을 몰랐지만 이 책의 처음에 등장하는 것을 보니 중요한 것은 맞겠지요.

 

SE-c9e14741-0703-48f5-9f26-950bf0f7deed.jpg

 

그러니까 이 책은 진짜 입문자를 위해 필요한 지식을 차근차근 가르쳐줍니다. 그리고 파이썬이 함께 하지요. 수학적 지식을 파이썬에서 어떻게 나타내는지를 함께 설명합니다. 이 책이 특별한 것은 설명하면서 이 지식이 어떻게 활용되는지도 설명해 준다는 것입니다. 그 지식이 왜 필요한지를 알게 해준다는 것이죠.

 

SE-a3d1fe3f-6e66-48d8-b656-c7a65694270e.jpg

 

SE-c711957e-f5b4-4b36-a972-79d90a695c98.jpg

 

위 사진은 벡터의 선형조합이 어떻게 사용되는지 보여주는 부분입니다. 두 사진을 비율에 따라 섞은 결과가 정말 신기했습니다.

 

입문자를 위한다고 해도 데이터 사이언스를 위한 수학 지식은 어려운게 사실입니다. 그렇기에 이 책은 더 가치있을 것입니다. 필요한 거의 모든 것을 다루고 있기 때문이죠. 그리고 강의를 듣는 것은 그 시간에 한정 되어있지만 이 책은 언제든 함께 할 수 있습니다. 아! 물론 무게를 감당해야겠지요. ^^;

 

살짝 아쉬운 것이 있다면

 

가방에 넣고 다니기에는 상당히 무겁습니다. 두껍고 무거운 이유가 있기에 이해할 수 있지요. 다만 휴대성을 더 좋게 하기 위하여 해답지를 나눈 것 처럼 책도 나누었으면 좋겠다는 생각이 들었습니다.

 

이 책의 모태 사이트가 있다고!!?

 

이 책의 저자이신 김도형님께서 운영하고 있는 사이트입니다.(https://datascienceschool.net데이터 분석에 필요한 A부터 Z까지의 모든 내용을 다루는 것이 목표라고 합니다. 데이터 사이언스에 관심이 많은 분들은 꼭 알아두어야 할 사이트일 것입니다.

 

소문난 명강사 '김도형'이

데이터 사이언스 입문자에게 보내는

선물 같은 수학 책

 

데이터 사이언스의 전망이 밝다는 것은 알지만 어떻게 공부해야할지 막막한 사람들에게 이 책은 분명 단비와 같을 것입니다.

사실은 이 책이 데이터 사이언스에 대한 기초적인 책인줄 알았으나, 수학 관련만 있는 책인줄은 몰랐다. (다들 조심)


이 책은 확률과 통계, 선형대수에 대한 모든 데이터 사이언스에서 필요로한 수학 지식을 설명하고 있다.


어떻게 보면, 이 책을 공부하면서 머신러닝, 딥러닝을 공부하는 것이 더 좋지 않을까? 생각하기도 한다.


물론, 파이썬이란 언어와 주피터, 구글 코랩을 통해서 수학을 공부하는데 이 부분이 좀 생소할 수 있다.


책의 목차만 봐도 알 수 있는데, 해당 부분이 좀 신선하다. 직접 수학적인 지식을 코드로써 이해하는 분명한 목표가 있다.

 

데이터 분석이나, 머신러닝, 딥러닝에서 필요로한 모든 수학적인 지식이 담겨져 있고, 챕터별로 구분을 해두었기 때문에, 필요한 부분만 학습이 가능하다.


솔직히, 책의 양이 방대하기 때문에, 짧은 시간에 보기란 어렵지만, 시간을 두고, 스터디 교재로 쓴다거나 하는 방법이 좋겠다.


데이터를 공부하는 사람이라면 한번쯤은 들어가 봤을법한 사이트인 데이터사이언스스쿨 사이트를 운영하는 김도형 박사님이 쓰신 책이다. 궁금한게 있어서 검색을 하다보면 자주 들어가서 보게 되는 사이트이고 볼 때마다 정리가 꼼꼼해서 도움을 많이 받은 사이트이다.

이 사이트 내용 그대로 책으로 나와도 되겠다는 생각을 자주 해왔는데 이 사이트의 내용이 정말 책으로 출판되었다. 사이트를 통해 봤던 내용을 정리된 책으로 보니 사이트 만큼이나 친절한 느낌을 받았다.

 

 

데이터 사이언스 스쿨 사이트 화면으로 데이터를 공부하는 사람들은 누구나 몇 번쯤 들어가 봤을 사이트다.

 

데이터 분야의 일을 하면서 늘 수학은 어렵고 힘든점이었고 개발자라서 그런지 수학공식보다는 코드로 이해를 하는게 편했었다. 이과생이기는 했지만 수포자였기 때문에 통계, 머신러닝, 딥러닝에서 등장하는 수학공식은 늘 동공지진을 유발했다.

또, 언제 배웠는지 기억도 나지 않는 로그, 미분, 적분을 마주해야 할 때는 공식보다는 코드를 먼저 봤는데 수학에 뭔가 빚을 진 기분이었다. 이런 기분을 조금이라도 덜어보고자 이 책의 출간을 기다렸는데 마침 기회가 되어 한빛미디어의 <나는 리뷰어다=""> 이벤트로 이 책을 읽게 되었다.

초반부에 이 책은 도구를 어떻게 만들지가 아니라 어떻게 사용할지를 초점을 두고 만들어졌다고 한다. 나 또한 도구를 만드는 것보다는 수학공식을 사용해서 어떻게 분석이나 머신러닝에 활용할지에 대해 목적을 두고 읽었는데 내 목적에 딱 부합하는 책이었다.

책의 두께가 상당하기는 하지만 분석에 자주 쓰이는 내용들을 최대한 알려주고자 하는 저자 분의 의도가 느껴지는 책이었다.

파이썬의 대표적인 라이브러리를 활용해서 설명하고 있으며 수학공식과 함께 어떻게 활용해야 하는지 친절하게 설명이 되어있다. 또 수학적 특징에 따라 어떤 라이브러리를 사용하면 좋을지에 대한 내용을 함께 담고 있어서 활용하고자 하는 의도에 따라 라이브러리를 선택할 수 있도록 도움을 준다.

이 책에서 가장 인상적이었던 부분이 바로 컴퓨터 사용자에 대한 부분이었다. 가끔 라이브러리 설치로 고생하시는 분들을 도와드리다 보면 컴퓨터의 이름이 한글로 된 분들을 종종 봐 왔다. 사소할 수 있는 부분이지만 컴퓨터 사용자의 한글 이름 때문에 설치와 설정 지옥으로 며칠을 고생하시는 분들을 많이 봐 왔기 때문에 꼭 필요한 내용이 잘 소개가 되어있다는 생각이 들었다.

주요 라이브러리의 역할을 소개하고 있고 어떻게 사용하면 좋을지에 대한 내용이 적절하게 들어가 있다.

함수와 역함수도 자주 그리게 되는 그래프 중 하나인데 공식과 함께 잘 설명이 되어있다. 요즘 수학을 사용하며 느끼는 건 중고등학교 때 이렇게 수학을 배웠다면 훨씬 잘 이해할 수 있지 않았을까라는 아쉬움이 든다. 공식만으로는 이해하기 힘든 부분을 시각화를 하게 되면 왜 이런 공식을 써야 하는지 훨씬 잘 와닿게 되는거 같다.

많이 활용되는 로지스틱 함수도 공식과 그래프를 함께 보면 더 잘 이해할 수 있는거 같다. 회귀 뿐만 아니라 분류에도 잘 쓰이며 머신러닝, 딥러닝 고루 사용되는데 이 책을 통해 그간 그림처럼 봐 왔던 공식을 이해하는데 도움이 되었다.

해설지도 따로 제공이 되어서 책과 분철할 수 있게 되어 있다. 책 두께가 상당한 편인데 들고 다니면서 볼때 분철하면 좋을 것 같다. 데이터 사이언스 스쿨 사이트의 내용이 상당히 방대한 편인데 제목에 “수학편”이라고 되어 있으니 다른편도 나오지 않을까 기대가 된다.

이 책의 코드는 아래 깃헙에서 받을 수 있다.

datascienceschool/math: 데이터 사이언스 스쿨 : 수학편 코드 주피터노트북

전체적으로 난이도가 좀 있는 책으로 파이썬 코드를 통해 수학 공식을 이해하고자 하거나 머신러닝, 딥러닝 알고리즘을 자주 사용해 왔지만 수학에 빚을 지고 있는 듯한 느낌을 받는 사람이 보면 좋을거 같다.

 

소문난 명강의 김도형의 데이터 사이언스 스쿨 ...

작가
김도형
출판
한빛미디어
발매
2019.11.20.

리뷰보기

 

책을 받자마자 두께에 놀랐다. 개발하면서 필요한 수학적 지식을 위해 얇은 수학 개념 서적은 읽어보았지만 이건 전공 책이라고 할만한 정도로 두껍다. 소개를 보면 수학 비전공 인공지능 개발 입문자와 현업 전문가에게 핵심 수학을 알려준다고 되어있다. 한 100여 페이지 정도까지는 납득하며 읽을만한 수준이지만, 그 뒤는 사실 수포자나 문과 출신에게는 꽤 어렵지 않나 싶은 정도의 내용이라고 본다. 컴공 출신이지만 선형대수 성적이 좋지 않아 재수강까지 했었는데, 첫 챕터부터 선형대수가 나온다. 그 뒤로는 미분, 적분에 이어 확률 순서로 나온다. 뭔가 순서가 반대로 되어있지 않나 하는 생각도 들었다.

 

많은 내용이 들어있고, 파이썬 코드와 라이브러리를 통해 수학적인 모델을 실습해볼 수 있다는 건 참 좋았다. 텐서플로나 파이썬 입문 관련 서적으로 실습할 때 맥북에 파이썬 라이브러리를 설치해서 했었는데, 이 책에서는 코랩을 통한 주피터 노트북을 소개해줘서 간단한 실습은 브라우저 환경에서 가능했다.

 

텐서플로 입문 같은 책에서는 텐서플로 활용에 대한 설명은 잘 되어있지만, 기반이 되는 수학적 지식에 대한 설명이 부족하다 생각했는데 이 책을 통해 그런 지식을 많이 쌓을 수 있겠다. 최근 들은 이야기로, 머신 러닝, 딥러닝에 있어서 요즘엔 도구나 라이브러리, 구현 모델 등은 거의 다 만들어져 있고, 필요한 건 데이터를 모으고 머신 러닝에 활용할 수 있도록 가공하는 작업이 더 중요하다고 한다. 데이터를 만지려면 아무래도 수학이나 통계에 관한 지식을 쌓아야 할 텐데, 이 책이 큰 도움이 될 거라 생각한다.

 


 

데이터 사이언스 입문자를 위한 수학 기본서라고 할 수 있을 거 같다. 

필자는 이과지만 수포자이므로 수리 나형( 나이대 유출 )을 보았다. 물론 대학에서 미적분, 선형대수, 이산수학, 확률과 통계를 필수 교양으로 수강하긴 하였다. 정말이지 이해하고 푸는 게 아니라 억지로 외워서 전부다 겨우 B+ 맞았던 것으로 기억한다.

이러한 입장에서 책을 접하였는데 일단 친절하다.

솔직하게 한빛미디어 책을 많이 보는 것은 아닌데 19년 하반기 이후의 책들은 보는 책마다 친절한 것 같다.

무엇이 친절하냐면 일단 눈높이 교육이 제대로 들어간다. 물론 입문자의 눈높이에 맞추어서 집필된 책이어서 그럴 것이다.

그러나 개인적으로 느끼기에 독자를 고려한 책일지라도 진짜 수포자( 필자 )가 보았을 때 이해하면서 실습하기는 어려울 것이라고 생각했다.

 


 

 

 

필자는 수학포기 개발자다. 그러나 이 책은 비전공자도 고려한다. 하여 나 같은 수포자라도 접근은 할 수 있다.

 

시작하기 전에는 아무리 쉽게 썼다고 할지라도 내가 넘을 수 있을까 라는 의문이 가득하였다.

그러나 개념자체를 쉽게 설명해주고 연습문제를 통하여 수식을 받아들이게 한다.( 수식만 봐도 그냥 눈과 머리가 아픈 게 나 같은 수포자일 것인데 말이다. )

 

책 서두에 파이썬을 좀 알아야 한다고 적혀있긴 한데 개발자라면 그냥 보아도 무방할 것 같다. 나같은 수포자일 경우 수식 때문에 아무래도 버퍼링이 생기지만 파이썬을 활용하는 부분은 그냥 책만 따라가도 충분하다.

물론 사용되는 함수 하나하나 이해하고 넘어가고 싶다면 파이썬을 좀 공부해야 될 것이다. 그러나 개인적으로 개발자라면 유추가 가능할 것이고 그래도 부족하다면 모르는 것들만 검색하면서 이해하고 넘어가면 된다고 생각한다.

 

여차저차 일단 파이썬 설치하고 수학기호를 눈에 익힌다. 여기서 만약 나 같은 수포자임에도 불구하고 수식을 풀어보지 않고 지나간다면 뒤에서 수식을 보았을 때 "이 뭔 개소리야"를 시전할 수 있다. 그러니 풀어보고 넘어가자.

 

전체적으로 수학적인 부분은 선형대수, 미적분, 확률, 기타 등등로 구분할 수 있겠고 파이썬 모듈사용에 있어서는 심파이, 사이파이, 피지엠파이, 맷플롯립 등등을 사용한다.

 

매 챕터를 진행할 때마다 기본적으로 용어설명을 자세히 해준다. 어디서 들어보았고 사용해 본 용어일지라도 일단 확인하고 넘어가자. 필자가 알고 있는 용어들과 다른 뜻으로 사용하는 경우가 꽤 많았다.( 필자가 이상한 것일 수도 있다. )

 

책의 분량이 굉장히 방대하므로 일일이 설명하긴 힘들고 주저리주저리 했는데 위에 언급한 것들이 이 책의 장점이다.

  1. 최근에 윤인성 저자가 가장 설명이 친절하다고 생각하였는데 만만치 않게 친절하다. 그것도 쉽게 친절하다.( 용어설명뿐만 아니라 개념 설명도 )
  2. 정말 비전공자라 할지라도 파이썬 좀 해봤다면 충분히 소화할 수 있다.
  3. 충분한 연습문제들이 있다.

단점은 방금 말한 방대한 분량인데 챕터별로 잘 분류가 되어 있으니 공부해보고 싶은 챕터를 골라서 공부하면 될 듯하다.

0장과 1장은 필수지만 그 이후에는 필요한 것부터 봐도 될 것이다. 선형대수가 필요하다면 2장, 3장 미적분이 필요하다면 4장 확률이 필요하다면 6장 ~ 8장 등등 목차만 봐도 어떻게 보면 될지 알 수 있을 것이다.

또 하나 단점?이라고 하자면 용어설명과 개념 설명은 친절하고 좋은데 거의 모든 게 새로운 용어와 개념들이다.

그러므로 처음엔 모두 이해하려 하지 말고 그냥 이해한 만큼만 노트에 정리하면서 넘어가자. 그리고 나중에 복기하자.

 

마지막으로 단기간에 공부하시려는 분들은 위의 단점들을 잘 고려하여 진행하시기 바랍니다. 
정말 용어, 개념, 분량 다 토나옵니다. 그럼에도 불구하고 읽히는 책입니다.( 그만큼 쉽게 설명한다. )


20191210_140203.jpg

 

데이터 분석이나 인공지능을 시작했지만 수학에 막혀서 좌절 하셨던 분이나 무엇부터 시작해야 할지 몰라서 고민인 분들이 보시면 좋을 것 같습니다.

 

수학 기초부터 심화 내용까지 잘 정리되어 있으며, 파이썬을 이용해 데이터를 다뤄보는 부분까지 참 잘 구성되어 있는 책입니다. 데이터 분석 분야의 기본서로 손색없는 좋은 책입니다.

 

다만, 책의 분량이 많기 때문에 확실한 동기부여를 가지고 시작하시는 것을 권합니다.

 

본격적으로 데이터 분석을 시작하기 전에 확실하게 기본을 다지고 싶으신 분들에게 이 책을 추천합니다.

 

기능 구현에 초점을 맞추다 보면 기초 수학을 놓치는 경우가 많다. 이미 함수안에 녹아 들어있는 개념들을 굳이 공부하지 않아도 단순히 가져다 쓰면 된다는 생각이 먼저 들기 때문이다. 하지만 조금 더 넓게 그리고 멀리 공부하기 위해서는 언젠가 한번은 마주하게 되는것이 기초 수학이라는 생각이 든다. 딥러닝 네트워크가 제 아무리 저명한 논문들에 의해 발표된걸 가져다 쓰면 된다고 해도 결국 그 내부의 뼈대를 이루는 기초 알고리즘을 이해 해야지만 그 이후에 내 데이터셋에 맞는 최적화가 가능하다. 데이터 사이언티스트를 꿈꾼다면 단언컨대 적어도 이책에 있는 개념들은 모두 알고 있어야 한다. 그리고 이론만 아는 사람이 아닌 실제로 그 이론을 가지고 결과물을 만들어 낼 수 있는 사람을 원하는 요즘 <김도형의 데이터사이언스 스쿨> 은 그 시작 개론서로써 손색이 없다. 내가 파이썬을 이용한 데이터 관련 공부를 시작하고 싶은데 어디서부터 시작해야할지 모르겠다는 분들에게 일단 한 챕터 만이라도 좋으니 이 책을 접해보라고 권하고 싶다.

 

책은 1권, 2권으로 나눌수 있게 되어있는데... 1권은 본책이 2권은 문제풀이가 있어서 쉽게 풀이를 볼 수 있게 되어있다.

 

머신러닝, 딥러닝을 포함한 데이터분석에서 수학은 피할 수 없고 이해가 떨어지기 때문에 수학은 필요하긴 하다고 생각하고 있었다.

비록... 이과에 수포자였지만.....ㅠㅠ

이 책을 딱 넘겨보고는 나에게 넘오 어려운 수학..ㅠㅠ

그래도 중고등학교 수학을 배우신 분이라면 누구라도 학습할 수 있다고하고, 수학은 도구이기 때문에 빠르게 익혀 필요한 시점에 효율적으로

사용하는 것이 중요하니 어떻게 사용하는지에 대한 초점을 맞춰 효율적이라 생각된다.

입문자와 비전공자를 위해 기초부터 구성되어있고, 머신러닝 이해에 필요한 핵심내용만 선별했다고 한다.

 

여기나오는 모든 수식과 알고리즘은 파이썬 코드로 구현되어있고 파이썬패키지 자유롭게 사용할 수 있고 이해하기 쉽도록 도와주고 있다.

파이썬이 처음이라도 파이썬설치부터 자세히 나와있기 때문에 처음부터 막히지는 않도록 비입문자도 배려되게 나옴.

대세는 파이썬인가...

이책에서 다루는 파이썬3.7과 아이파이썬(IPython), 사이킷런(Scikit-Learn), 맷플롯립(matplotlib), 넘파이(NumPy), 시본(seaborn),

사이파이(SciPy), 피지엠파이(pgmpy) 7개의 패키지가 사용되었다.


 

개념을 먼저 정리하고 예제를통해 이해를 한다음 연습문제를 풀면서 실습하게 구성되어있다.

연습문제가 300여개 정도가 있는데 다 풀어본다면 머신러닝과 딥러닝에서 수학이 필요로 할때 자신있게 분석할 수 있을거 같다.

 





<나는 리뷰어다> 11월 이벤트 당첨으로 작성한 리뷰 입니다.

[한줄평]

머신러닝, 딥러닝에 필요한 수학을 한큐에 해결 할수 있는 책입니다.


[목차구성]

0장 파이썬 설치와 사용법
1장 수학 기호

2장 넘파이(Numpy)로 공부하는 선형대수
3장 고급 선형대수

4장 심파이(SymPy)로 공부하는 미적분

5장 사이파이(SciPy)로 공부하는 최적화

6장 공부하는 확률론 피지엠파이(pgmpy)로

7장 확률변수와 상관관계

8장 사이파이로 공부하는 확률분포

9장 추정과 검정

10장 엔트로피


[주요 내용]

 대학에서 수학을 전공하지 않은 인공지능 개발 입문자와 협업 전문가에게 핵심 수학을 알려줍니다. 수식에 많이 사용되는 그리스 알파벳과 고등학교 과정의 수학 기호부터 설명해 누구나 차근차근 수학을 익힐 수 있습니다. 기초부터 출발하지만 데이터 분서고가 머신러닝에 필요한 모든 필수 수학을 다루며, 모든 수식은 파이썬 패키지를 활용해 코드로 보여줍니다. 스타트업 파일을 적용한 파이썬 주피터 노트북 실습 환경도 제공합니다.

 

 선형대수, 함수론, 미적분, 최적화 등 다양한 수학 분야를 다루지만 데이터 분석과 머신러닝에 꼭 필요한 내용만을 최소한으로 선별했습니다. 핵심 내용만 있으므로 이 책에 실린 내용을 충실히 익히면 데이터 분석과 머신러닝 이론을 효과적이고 깊이 있게 공부하는 데 도움이 됩니다. 


 데이터 분석과 머신러닝은 코드로 알고리즘을 구현하으므로 수학 수식만으로 이해해서는 부족합니다. 따라서 이 책의 모든 수식과 알고리즘은 파이썬 코드로 구현합니다. 수학을 코드로 이용하려는 개발자 입장을 고려해 알고리즘 자체를 구현하기 보다는 알고리즘이 구현된 넘파이, 심파이, 사이파이, 피지엠파이 등의 패키지 기능을 잘 이해하고 자유롭게 사용할 수 있도록 하는 것을 목표로 합니다.


 책에서 설명하는 내용을 제대로 이해하고 있는지 확인하는 연습문제 300여 개가 있습니다. 모든 연습 문제는 머신러닝의 이론을 설명할 때 나오는 수식의 일부를 미리 풀어보는 문제 입니다. 연습문제를 풀수 있다면 나중에 나올 복잡한 수식을 쉽게 이해할 수 있습니다.


[이 책의 특징]

-입문자와 비전공자를 위해 기초부터 시작

-머신러닝 이해에 필요한 핵심 내용만 선별

-파이썬 구현을 통한 이해와 응용

-연습 문제 300여 문항


[서평]

머신러닝 혹인 딥러닝 관련 일을 하는분이라면 ‘데이터 사이언스 스쿨’을 알고 있을 것입니다. 저 또한 딥러닝 관련 이슈가 있으면 데이터 사이언스 스쿨에서 많은 도움을 받았습니다. 이책의 저자인 김도형님은 ‘데이터 사이언스 스쿨’에서 데이터 분석 관련 수학과 머신러닝을 강의 하고 있어 믿고 볼수 있는 책이라 생각합니다. 


이책은 러신머닝과 딥러닝, 인공지능등 배울때 꼭필요한 수학 지식을 입문자와 비전공자를 위해 기초 이론 부터 자세하게 알려 주고 있습니다. 


데이터 분석과 머신러닝을 하려면 수학을 필수적으로 배워야 합니다. 그리고 수학 수식 만으로는 코드로 알고리즘을 구현하기 어렵습니다. 그래서 이 책에서는 모든 수식과 알고리즘을 파이썬 코드로 구현합니다. 그리고 파이썬에서 제공하는 수학 라이브러리인 넘파이, 심파이, 사이파이, 피지엠파이등 패키지 기능을 이해하고 자유롭게 사용할 수 있도록 도와 주고 있습니다. 


마지막으로 각 장 마다 책의 내용을 잘 이해하고 있는지 확인하는 연습 문제가 300여 개가 있습니다. 이론을 학습하고 연습문제를 다 풀수 있다면 나중에 복잡한 수식이 나와도 응용력이 생겨 해결하는데 많은 도움이 될것입니다.

 

처음 이 책을 받았을 때, 데이터 사이언스 스쿨 어디서 많이 들어봤는데라는 생각이 들었습니다. 

 

아니나 다를까, https://datascienceschool.net/ 항상 모르는 게 있으면 구글링을 통해 들어가 보는 

 

유명한 사이트 중에 하나 더군요.

 

사이트에서도 많은 도움 받았는데, 저자분의 책을 이렇게 서평 하게 돼서 영광입니다. 

 

이 책의 특징으로는 크게 4가지가 있습니다. 

 

1. 수학을 전공하지 않는 입문자와 비전공자를 위해 기초부터 시작

 

2. 반복되는 실습 환경설정을 스타트업 파일로 한 번에 해결

 

3. 6자기 데이터 사이언스용 파이썬 라이브러리 사용

 

4. 300여 연습 문제 제공

 

개발환경으로는 파이썬3.7버전을 기준으로 하며, 패키지로는 

 

IPython, Scikit-Learn, Jupyter Notebook, matplotlib, Numpy, Seaborn, Scipy, Pgmpy 를 사용했습니다.

 

★ 이 책의 구성

 

[0장 파이썬 설치와 사용법]

 

[1장 수학 기호]

 

[2장 넘파이(Numpy)로 공부하는 선형대수]

 

[3장 고급 선형대수]

 

[4장 심파이(SymPy)로 공부하는 미적분]

 

[5장 사이파이(SciPy)로 공부하는 최적화]

 

[6장 피지엠파이(pgmpy)로 공부하는 확률론]

 

[7장 확률변수와 상관관계]

 

[8장 사이파이로 공부하는 확률분포]

 

[9장 추정과 검정]

 

[10장 엔트로피]

 

 

교과서처럼 '학습목표'로 시작하는게 인상적이다!

개념 정의 부터 시작 한 뒤

예제를 통해 적용 한뒤, 연습문제를 통해 제대로 알고 있나 확인한다.

마지막 정리및 다음차시 예고 까지

어려운 수학 개념들에는 그림을 이용하여 학습자의 이해를 도왔다.


특히 10장 엔트로피 부분은 수학을 전공하는 사람들에게도 필수로 읽어봐야 한다고 생각한다.
 
왜냐면 KL-divergence 나 정보 이론의 경우 배운 경험이 없기 때문에, 이러한 부분이 논문에 나오게 
 
되면 교수님도 모르는 진풍경이 일어나기도 한다.(저가 경험해봤습니다 ㅠㅠ)
 
상호정보량 같은 정보 이론을 내가 어찌알겠는가? 
 
하지만 이 책에서는 이렇게 쉽게 설명해주어서 적어도 논문을 읽거나 수식이 필요한 부분에 있어 
 
큰 도움을 받을 수 있다고 생각한다. 
 
빅데이터, AI 분야로의  진학을 희망하는 모든 사람들에게 이 책을 추천한다. 

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 도서명 :
소문난 명강의 : 김도형의 데이터 사이언스 스쿨(수학 편)
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
소문난 명강의 : 김도형의 데이터 사이언스 스쿨(수학 편)
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
소문난 명강의 : 김도형의 데이터 사이언스 스쿨(수학 편)
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실