나에게 필요한 지식과 기술을 검색해 보세요.

대표이미지

머신러닝을 위한 알고리즘(with 파이썬)

Mastering Machine Learning Algorithms using Python

강사

마나스 다스굽타

강의

108강

시간

28h 35m

수강기간

6개월

레벨

중급

정가

166,000

판매가

33,200

총 결제 금액

80%

33,200

평생교육이용권 사용안내

이 강의는 평생교육바우처로 결제할 수 있습니다.

기초 통계부터 딥러닝 프로젝트까지, 파이썬 머신러닝의 모든 알고리즘을 하나의 코스로


머신러닝을 위한 알고리즘(with 파이썬)
기초 통계부터 딥러닝 입문까지 완전 정복

파이썬 기초부터 데이터 분석·통계·머신러닝 핵심 알고리즘까지 한 번에.
Lending Club, 통신사 이탈, 중고차 가격 예측 등 실제 비즈니스 데이터로 실무 워크플로우를 그대로 학습합니다.
전처리 → EDA → 모델링 → 튜닝 → 해석까지, “현업형 머신러닝”을 완성하세요.

한 번에 끝내는 머신러닝 실전 로드맵 

이 강의는 “개념 이해”에서 끝나지 않습니다.
데이터 수집/정제 → 탐색(EDA) → 피처 엔지니어링 → 모델 학습/평가 → 성능 개선(튜닝) → 결과 해석까지, 머신러닝 프로젝트 전 과정을 따라가며 실전 역량을 체득합니다.
통계적 사고(가설검정·분포·P-value)를 기반으로, 모델의 결과를 설명 가능한 형태로 해석하는 방법까지 학습합니다.

주요 학습 내용 

  • 파이썬 기초 문법(변수/제어문/함수/람다)과 자료구조(List, Tuple, Dict, Set) 실습
  • NumPy·Pandas로 데이터 핸들링(정제/병합/결측치 처리/형변환/인코딩)
  • 통계 기초(기술통계, 확률, 정규분포, 중심극한정리, 가설검정, P-value)
  • EDA(단변량/이변량 분석, 상관관계, 이상치 탐지, 시각화 기반 인사이트 도출)
  • 지도학습: 회귀/분류 핵심 알고리즘 및 평가(Confusion Matrix, ROC/AUC 등)
  • 모델 최적화: 과적합 방지, 교차검증(CV), GridSearch 기반 하이퍼파라미터 튜닝
  • 비지도학습: K-Means 클러스터링, 차원축소(PCA)로 데이터 이해 확장
  • 딥러닝 입문: ANN 구조 이해 및 TensorFlow/Keras로 간단한 이미지 분류 실습

이 강의가 특별한 이유 

💡혜택 1. 기초부터 실전까지 ‘올인원’

파이썬·통계·EDA·모델링·튜닝·해석까지 하나의 흐름으로 학습합니다.
“왜 이 과정을 해야 하는지”까지 이해하며 실무형 사고를 갖춥니다.

💡혜택 2. 실제 비즈니스 데이터로 프로젝트 수행

Lending Club, 통신사 이탈, 중고차 가격 예측 등 현실 데이터로 실습합니다.
전처리와 피처 엔지니어링부터 성능 개선까지 단계별로 경험합니다.

💡혜택 3. 모델 성능을 ‘올리는’ 방법까지

과적합 제어, 편향-분산 트레이드오프, 교차검증, GridSearch 튜닝을 통해
“돌려본 모델”이 아니라 “개선된 모델”을 만들 수 있습니다.

이 강의로 만들 수 있는 실제 결과물 

📊 EDA 인사이트 리포트
결측/이상치 처리, 분포·상관관계 분석, 시각화 기반 문제 정의 문서
🚗 중고차 가격 예측 회귀 모델
선형회귀·변수선택(RFE)·잔차 분석 기반 성능 개선 파이프라인
📉 통신사 고객 이탈 예측 분류 모델
로지스틱 회귀, Confusion Matrix, ROC/AUC로 성능 평가 및 해석
🌳 트리/앙상블 기반 예측 시스템
Decision Tree·Random Forest로 성능 비교, Feature Importance 분석
🧩 고객 세분화 클러스터링
K-Means + Elbow/Silhouette로 최적 군집 탐색 및 해석
🧠 딥러닝 입문 프로젝트
TensorFlow/Keras로 Fashion MNIST 이미지 분류 모델 구현
🔧 모델 튜닝 레시피
교차검증(CV) + GridSearch로 하이퍼파라미터 최적화 실전 템플릿
📁 포트폴리오용 프로젝트 코드 묶음
최소 7개 이상 프로젝트(분석·모델·평가·해석 포함)로 구성된 Git/Notebook 결과물

3단계 학습 로드맵 

  1. 기초 구축 — Python·NumPy·Pandas + 통계 핵심 개념 완성
  2. 실전 분석 — EDA, 전처리, 피처 엔지니어링으로 데이터 이해/문제 정의
  3. 모델링/최적화 — 회귀·분류·비지도학습·딥러닝 입문 + 튜닝/해석까지 마무리

※ 각 단계는 “설명 → 실습 → 프로젝트 적용” 구조로 진행되며, 결과물을 포트폴리오로 바로 활용할 수 있도록 구성되어 있습니다.

사용하는 실무 기술 스택 

🐍 언어: 파이썬 3.x — 데이터 분석 및 모델링 구현
🧪 개발 환경: Anaconda, Jupyter Notebook — 실습 및 재현 가능한 워크플로우
🧱 데이터 핸들링: NumPy, Pandas — 전처리/정제/변환
📈 시각화: Matplotlib, Seaborn — EDA 및 결과 시각화
🤖 머신러닝: Scikit-learn, Statsmodels — 모델 학습/평가/해석
🧠 딥러닝 입문: TensorFlow, Keras — 기본 신경망 구현

이런 분들께 추천합니다

  • 입문자/비전공자: 머신러닝을 “처음부터 제대로” 시작하고 싶은 분
  • 개발자: 파이썬 문법은 알지만 데이터 분석·모델링 실전 적용이 막막한 분
  • 대학생/취준생: 통계 기반 분석 역량과 포트폴리오 프로젝트가 필요한 분
  • 현업 실무자: 실제 데이터를 활용해 예측 모델을 만들고 성능 개선까지 하고 싶은 분

선수 지식 (Prerequisites)

  • 특별한 선수 지식이 필요하지 않습니다.
  • 강의 초반부에서 파이썬 기초와 통계 기초(평균/표준편차/정규분포/가설검정 등)를 충분히 다룹니다.
  • 컴퓨터 활용 능력(파일 관리, 기본 실행/설치)이면 수강 가능합니다.

학습 로드맵 (4단계)

1단계. 파이썬 & 실습 환경 세팅

• 파이썬 기초 문법(변수, 자료형, 조건문, 반복문, 함수) 이해
• 자료구조(List, Tuple, Dict, Set) 및 기본 활용 패턴
• Anaconda 설치 및 Jupyter Notebook 실습 환경 구성
• 노트북 기반 실습 워크플로우(데이터 로드 → 실험 → 결과 확인) 익히기

결과물: 실습 환경이 세팅된 머신러닝 노트북 템플릿(기초 코드 포함)
기술: 파이썬 3.x, Anaconda, Jupyter Notebook

2단계. 데이터 핸들링 & 통계 기초

• NumPy 배열 연산과 브로드캐스팅 기반 계산 패턴
• Pandas DataFrame/Series 조작(정렬, 필터링, 그룹화, 조인/머지)
• 결측치/이상치 처리 및 데이터 정제 실습
• 기술통계, 확률, 정규분포, 중심극한정리, 가설검정(P-value) 이해

결과물: 전처리/통계 분석 노트북(지표 계산 + 시각화 포함)
기술: NumPy, Pandas, 기초 통계

3단계. EDA & 피처 엔지니어링 (실전 데이터 분석)

• EDA 기본 흐름(문제 정의 → 데이터 이해 → 가설 수립 → 검증)
• 단변량/이변량 분석과 시각화(분포, 박스플롯, 산점도, 카테고리 비교)
• 상관관계 분석 및 인사이트 도출(Heatmap 등)
• 피처 엔지니어링(스케일링, 원-핫 인코딩, 파생 변수) 실습

결과물: Lending Club 기반 EDA 리포트 노트북(인사이트/시각화 포함)
기술: Matplotlib, Seaborn, Feature Engineering

4단계. 모델링 & 최적화 (머신러닝 핵심 알고리즘 완성)

• 지도학습: 회귀(선형회귀) / 분류(로지스틱 회귀, Naive Bayes, 트리, 랜덤 포레스트, SVM)
• 평가 지표 이해 및 해석(Confusion Matrix, ROC/AUC, Precision-Recall 등)
• 과적합 방지 및 성능 개선(교차검증, GridSearch 기반 하이퍼파라미터 튜닝)
• 비지도학습/차원축소(K-Means, PCA) 및 딥러닝 입문(ANN, Keras 실습) 맛보기

결과물: 회귀/분류/군집 프로젝트 포트폴리오(튜닝/해석 포함) + 딥러닝 입문 실습
기술: Scikit-learn, Statsmodels, TensorFlow/Keras

수강 후 기대 효과 

  • 데이터 전처리 역량: 결측치/스케일링/인코딩 등 모델 학습 가능한 형태로 가공
  • 데이터 스토리텔링: 시각화·통계 기반 분석으로 인사이트 도출 및 보고서 작성
  • 모델 설계·최적화: 문제에 맞는 알고리즘 선택, 튜닝으로 성능 개선
  • 포트폴리오 완성: 최소 7개 이상 실전 프로젝트 코드를 결과물로 보유

자주 묻는 질문 (FAQ)

Q. 완전 초보도 수강할 수 있나요?
A. 가능합니다. 강의 초반에 파이썬 기초 문법부터 시작하고, Jupyter Notebook/Anaconda 환경 세팅까지 단계별로 안내합니다. 기본적인 컴퓨터 활용 능력만 있으면 따라올 수 있도록 구성되어 있습니다.
Q. 수학이나 전공 지식이 꼭 필요한가요?
A. 필수는 아닙니다. 머신러닝에 필요한 통계(평균/분산/정규분포/가설검정 등)는 강의에서 실습 중심으로 설명합니다. 복잡한 수학 전개보다 “어떻게 적용하고 해석하는지”에 초점을 둡니다.
Q. 어떤 실습 환경에서 진행하나요?
A. Anaconda와 Jupyter Notebook을 기본 환경으로 사용합니다. 윈도우/맥 모두에서 실습 가능하며, 필요한 설치 및 설정 가이드를 제공해 처음 설치하시는 분도 따라올 수 있습니다.
Q. 프로젝트 실습은 어떤 방식으로 진행되나요?
A. “개념 설명 → 코드 실습 → 프로젝트 적용” 흐름으로 진행됩니다. 전처리/EDA/피처 엔지니어링/모델링/평가/튜닝까지 한 사이클을 반복하며, 각 단계에서 왜 그렇게 하는지와 결과를 어떻게 해석하는지까지 함께 다룹니다.
Q. 딥러닝도 심화까지 다루나요?
A. 본 과정은 딥러닝 “입문” 범위를 다룹니다. 인공신경망(ANN) 구조, 손실 함수, 옵티마이저 개념을 이해하고 TensorFlow/Keras로 간단한 분류 실습을 수행합니다. 딥러닝 심화(예: CNN/RNN/Transformer)는 별도 심화 과정에서 확장하는 것을 권장합니다.
Q. 수강 후 어떤 결과물을 남길 수 있나요?
A. EDA 리포트, 회귀/분류/클러스터링 모델, 성능 평가 및 튜닝 결과 등 최소 7개 이상의 실전 프로젝트 코드(노트북 기반)를 포트폴리오로 정리할 수 있습니다.

강사

마나스 다스굽타

마나스 다스굽타

마나스 다스굽타(Manas Dasgupta)는 인도 벵갈루루(Bangalore)를 기반으로 활동하는 AI 전문가로, 영국 리버풀 존 무어스 대학교(Liverpool John Moores University)에서 AI 석사(MSc) 학위를 취득했습니다.

 

20년 이상 IT 업계에서 경력을 쌓았으며, 특히 금융 서비스 분야에서 풍부한 경험을 보유하고 있습니다. 주요 전문 분야는 생성형 AI(Generative AI), 머신러닝(Machine Learning), 데이터 사이언스(Data Science)이며, LangChain과 LlamaIndex를 활용한 RAG 기반 애플리케이션 개발에 강점을 갖고 있습니다. 또한 지도 학습과 비지도 학습 기법을 실제 프로젝트에 적용해 온 경험도 폭넓습니다.

 

마나스는 Teksands의 창립자로, 그의 팀은 인재 관리 영역에서 활용되는 최첨단 생성형 AI 솔루션을 개발하고 있습니다. 또한 유데미, 코세라(Coursera) 등 글로벌 교육 플랫폼에 다수의 강의를 출간했으며, 이를 통해 전 세계 수천 명의 학습자를 교육해 왔습니다.

커리큘럼

1-1차시 강의 소개

13:57

02

1-2차시 머신러닝 소개

11:45

03

1-3차시 머신러닝 용어

13:36

04

1-4차시 머신러닝의 역사

16:36

05

1-5차시 머신러닝 활용 사례 및 유형

21:13

06

1-6차시 머신러닝에서 데이터의 역할

06:17

07

1-7차시 머신러닝의 도전 과제

19:12

08

1-8차시 머신러닝 생애 주기 및 파이프라인

19:55

09

1-9차시 회귀 문제

10:29

10

1-10차시 회귀 모델 및 성능 지표

11:55

11

1-11차시 분류 문제 및 성능 지표

13:15

12

1-12차시 분류 지표 최적화

09:25

13

1-13차시 편향과 분산

09:03

14

2-1차시 통계 및 실험

19:17

15

2-2차시 데이터 유형 및 기술 통계

19:29

16

2-3차시 확률 변수와 정규 분포

06:03

17

2-4차시 히스토그램과 정규 근사

18:29

18

2-5차시 중심극한정리

16:56

19

2-6차시 확률 이론

12:12

20

2-7차시 이항 이론 - 기대값과 표준 오차

18:28

21

2-8차시 가설 검정

22:19

22

3-1차시 파이썬 소개

08:19

23

3-2차시 주피터 노트북으로 파이썬 시작하기

10:49

24

3-3차시 파이썬 변수와 조건

22:45

25

3-4차시 파이썬 반복문 1

13:18

26

3-5차시 파이썬 반복문 2

09:44

27

3-6차시 파이썬 리스트

14:27

28

3-7차시 파이썬 튜플

17:09

29

3-8차시 파이썬 딕셔너리 1

13:44

30

3-9차시 파이썬 딕셔너리 2

04:50

31

3-10차시 파이썬 집합 1

23:46

32

3-11차시 파이썬 집합 2

01:54

33

3-12차시 넘파이 배열 1

13:37

34

3-13차시 넘파이 배열 2

14:04

35

3-14차시 넘파이 배열 3

12:58

36

3-15차시 판다스 시리즈 1

14:17

37

3-16차시 판다스 시리즈 2

17:01

38

3-17차시 판다스 시리즈 3

16:45

39

3-18차시 판다스 시리즈 4

14:24

40

3-19차시 판다스 데이터프레임 1

14:34

41

3-20차시 판다스 데이터프레임 2

13:53

42

3-21차시 판다스 데이터프레임 3

12:58

43

3-22차시 판다스 데이터프레임 4

13:20

44

3-23차시 판다스 데이터프레임 5

20:45

45

3-24차시 판다스 데이터프레임 6

14:49

46

3-25차시 파이썬 사용자 정의 함수

14:03

47

3-26차시 파이썬 람다 함수

18:32

48

3-27차시 파이썬 람다 함수 및 날짜-시간 연산

16:42

49

3-28차시 파이썬 문자열 연산

12:16

50

4-1차시 탐색적 데이터 분석

16:10

51

4-2차시 EDA의 도구 및 프로세스

16:25

52

4-3차시 EDA 프로젝트 1

17:06

53

4-4차시 EDA 프로젝트 2

15:40

54

4-5차시 EDA 프로젝트 3

09:37

55

4-6차시 EDA 프로젝트 4

19:16

56

4-7차시 EDA 프로젝트 5

15:47

57

4-8차시 EDA 프로젝트 6

18:15

58

4-9차시 EDA 프로젝트 7

27:11

59

5-1차시 선형 회귀 소개

18:34

60

5-2차시 훈련 및 비용 함수

23:36

61

5-3차시 비용 함수 및 경사 하강법

13:22

62

5-4차시 선형 회귀 - 실용적 접근

16:07

63

5-5차시 특성 스케일링 및 비용 함수

12:24

64

5-6차시 OLS 가정 및 검정

18:41

65

5-7차시 자동차 가격 예측

14:21

66

5-8차시 데이터 준비 및 분석 1

13:57

67

5-9차시 데이터 준비 및 분석 2

15:30

68

5-10차시 데이터 준비 및 분석 3

18:53

69

5-11차시 모델 구축

16:16

70

5-12차시 모델 평가 및 최적화

15:29

71

5-13차시 모델 최적화

03:30

72

6-1차시 로지스틱 회귀 소개

14:44

73

6-2차시 로짓 모델

26:05

74

6-3차시 통신 이탈 사례 연구

17:51

75

6-4차시 데이터 분석 및 특성 공학

23:28

76

6-5차시 로지스틱 모델 구축

12:29

77

6-6차시 모델 평가 - AUC-ROC

24:42

78

6-7차시 모델 최적화 1

15:26

79

6-8차시 모델 최적화 2

14:01

80

7-1차시 나이브 베이즈 확률 모델

15:23

81

7-2차시 나이브 베이즈 확률 계산

16:33

82

7-3차시 직원 이탈 사례 연구

16:54

83

7-4차시 모델 구축 및 최적화

16:15

84

8-1차시 결정 트리 - 모델 개념

14:57

85

8-2차시 결정 트리 - 학습 단계

20:22

86

8-3차시 지니 지수 및 엔트로피 측정

15:34

87

8-4차시 가지치기 및 하이퍼파라미터 조정

10:36

88

8-5차시 아이리스 데이터셋 사례 연구

17:55

89

8-6차시 그리드 서치 교차 검증을 통한 모델 최적화

16:23

90

9-1차시 앙상블 기법 - 배깅 및 랜덤 포레스트

17:30

91

9-2차시 랜덤 포레스트 단계 - 가지치기 및 최적화

20:44

92

9-3차시 그리드 서치 CV를 이용한 모델 구축 및 하이퍼파라미터 조정

18:37

93

9-4차시 최적화 계속

09:33

94

10-1차시 서포트 벡터 머신 개념

18:26

95

10-2차시 서포트 벡터 머신 지표 및 다항 SVM

13:46

96

10-3차시 서포트 벡터 머신 프로젝트 1

13:37

97

10-4차시 서포트 벡터 머신 예측

04:17

98

10-5차시 서포트 벡터 머신 - 다항 데이터 분류

09:41

99

11-1차시 주성분 분석 - 개념

18:14

100

11-2차시 주성분 분석 - 계산 1

19:52

101

11-3차시 주성분 분석 - 계산 2

11:44

102

11-4차시 주성분 분석 - 실습

14:29

103

12-1차시 비지도 학습 - K-평균 군집화

15:27

104

12-2차시 K-평균 군집화 계산

28:44

105

12-3차시 K-평균 군집화 최적화

08:29

106

12-4차시 K-평균 - 데이터 준비 및 모델링

16:17

107

12-5차시 K-평균 - 모델 최적화

14:13

108

13-1차시 딥러닝 소개

1:10:18

수강 후기

첫번째 리뷰어가 되어주세요.

소중한 후기가 다른 분들께 도움이 될 거에요.

166,000

80%

33,200