메뉴 바로가기 검색 및 카테고리 바로가기

한빛미디어

혼자 공부하는 데이터 분석 with 파이썬

1:1 과외하듯 배우는 데이터 분석 자습서

한빛미디어

집필서

판매중

  • 저자 : 박해선
  • 출간 : 2023-01-02
  • 페이지 : 496 쪽
  • ISBN : 9791169210287
  • 물류코드 :11028
초급 초중급 중급 중고급 고급
5점 (2명)
좋아요 : 12




혼자 해도 충분하다! 1:1 과외하듯 배우는 데이터 분석 자습서

이 책은 독학으로 데이터 분석을 배우는 입문자가 ‘꼭 필요한 내용을 제대로 학습’할 수 있도록 구성했습니다. 뭘 모르는지조차 모르는 입문자의 막연한 마음에 십분 공감하여 과외 선생님이 알려주듯 친절하게, 핵심적인 내용만 콕콕 집어 줍니다. 책의 첫 페이지를 펼쳐서 마지막 페이지를 덮을 때까지, 혼자서도 충분히 데이터 분석을 배울 수 있다는 자신감과 확신이 계속될 것입니다!

 

베타리더 검증으로, ‘함께 만든’ 입문자 맞춤형 도서

베타리더와 함께 입문자에게 맞는 난이도, 분량, 학습 요소 등을 고민하고 이를 적극 반영했습니다. 어려운 용어와 개념은 한 번 더 풀어쓰고, 복잡한 설명은 눈에 잘 들어오는 그림으로 풀어냈습니다. ‘혼자 공부해 본’ 여러 입문자의 초심과 눈높이가 책 곳곳에 반영된 것이 이 책의 가장 큰 장점입니다.

 

 

누구를 위한 책인가요?

  • 데이터 분석을 어떻게 시작할지 막막한 비전공자
  • 파이썬을 배운 다음 의미 있는 실습을 해 보고 싶은 파이썬 입문자
  • 프로그래밍은 알지만, 분석(통계)에 대한 이해가 필요한 개발자
  • 데이터에서 유의미한 결과를 도출해 이를 기획이나 마케팅에 적용해 보고 싶은 직장인
  • 데이터 분석가, 데이터 사이언티스트라는 직업에 관심 있는 모든 사람

 

 

혼자_공부하는_데이터_분석_with_파이썬_상세이미지(700).jpg

박해선 저자

박해선

기계공학을 전공했으나 졸업 후에는 줄곧 코드를 읽고 쓰는 일을 했다. 지금은 머신러닝과 딥러닝에 관한 책을 집필하고 번역하면서 소프트웨어와 과학의 경계를 흥미롭게 탐험하고 있다. 『혼자 공부하는 머신러닝+딥러닝』(한빛미디어, 2020)과 『Do it! 딥러닝 입문』(이지스퍼블리싱, 2019)을 집필했고, 『케라스 창시자에게 배우는 딥러닝(개정 2판)』(길벗, 2022), 『핸즈온 머신러닝(2판)』(한빛미디어, 2020)을 포함한 다수의 머신러닝 책을 우리말로 옮겼다.

 

Chapter 01 데이터 분석을 시작하며


01-1 데이터 분석이란

__데이터 분석과 데이터 과학

__데이터 분석가

__데이터 분석을 위한 도구

[좀 더 알아보기] 데이터 마이닝과 머신러닝

[3가지 키워드로 정리하는 핵심 포인트]

[학습에 꼭 필요한 핵심 패키지]

[확인 문제]

 

01-2 구글 코랩과 주피터 노트북

__구글 코랩

__노트북

[좀 더 알아보기] 마크다운 서식

[5가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 텍스트 셀 툴바]

[확인 문제]

 

01-3 이 도서가 얼마나 인기가 좋을까요?

__도서 데이터 찾기

__코랩에서 데이터 확인하기

__파이썬으로 CSV 파일 출력하기

__데이터프레임 다루기: 판다스

__[문제 해결 과정] 적절한 데이터를 찾아서 업로드하고 읽기

[좀 더 알아보기] 공개 데이터 세트 대표 사이트와 유명 포럼

[5가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

 

 

Chapter 02 데이터 수집하기


02-1 API 사용하기

__API란

__파이썬에서 JSON 데이터 다루기

__파이썬에서 XML 데이터 다루기

__API로 20대가 가장 좋아하는 도서 찾기

__[문제 해결 과정] 공개 API로 웹에서 데이터 가져오기

[4가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

 

02-2 웹 스크래핑 사용하기

__도서 쪽수를 찾아서

__검색 결과 페이지 가져오기

__HTML에서 데이터 추출하기: 뷰티플수프

__전체 도서의 쪽수 구하기

__웹 스크래핑할 때 주의할 점

__[문제 해결 과정] 웹 스크래핑으로 HTML 수집하기

[좀 더 알아보기] merge() 함수의 매개변수

[2가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

 


Chapter 03 데이터 정제하기


03-1 불필요한 데이터 삭제하기

__열 삭제하기

__행 삭제하기

__중복된 행 찾기

__그룹별로 모으기

__원본 데이터 업데이트하기

__[문제해결 과정] 일괄 처리 함수 만들기

[6가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

 

03-2 잘못된 데이터 수정하기

__데이터프레임 정보 요약 확인하기

__누락된 값 처리하기

__정규 표현식

__잘못된 값 바꾸기

__누락된 정보 채우기

__[문제해결 과정] 데이터를 이해하고 올바르게 정제하기

[2가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

 

 

Chapter 04 데이터 요약하기

 

04-1 통계로 요약하기

__기술통계 구하기

__평균 구하기

__중앙값 구하기

__최솟값, 최댓값 구하기

__분위수 구하기

__분산 구하기

__표준편차 구하기

__최빈값 구하기

__[문제해결 과정] 데이터프레임에서 기술통계 구하기

[좀 더 알아보기] 넘파이의 기술통계 함수

[6가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

 

04-2 분포 요약하기

__산점도 그리기

__히스토그램 그리기

__상자 수염 그림 그리기

__[문제해결 과정] 통계량을 시각적으로 표현하기

[좀 더 알아보기] 판다스의 그래프 함수

[6가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

 

 

Chapter 05 데이터 시각화하기


05-1 맷플롯립 기본 요소 알아보기

__Figure 객체

__rcParams 객체

__여러 개의 서브플롯 출력하기

[5가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

 

05-2 선 그래프와 막대 그래프 그리기

__연도별 발행 도서 개수 구하기

__주제별 도서 개수 구하기

__선 그래프 그리기

__막대 그래프 그리기

__[문제 해결 과정] 맷플롯립으로 선 그래프와 막대 그래프 그리기

[좀 더 알아보기(1)] 이미지 출력하고 저장하기

[좀 더 알아보기(2)] 그래프를 이미지로 저장하기

[2가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

 

 

Chapter 06 복잡한 데이터 표현하기


06-1 객체지향 API로 그래프 꾸미기

__pyplot 방식과 객체지향 API 방식

__그래프에 한글 출력하기

__출판사별 발행 도서 산점도 그리기

__[문제 해결 과정] 맷플롯립의 다양한 기능으로 그래프 개선하기

[3가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

 

06-2 맷플롯립의 고급 기능 배우기

__실습 준비하기

__하나의 피겨에 여러 개의 선 그래프 그리기

__하나의 피겨에 여러 개의 막대 그래프 그리기

__원 그래프 그리기

__여러 종류의 그래프가 있는 서브플롯 그리기

__[문제 해결 과정] 맷플롯립으로 복잡한 그래프 그리기

[좀 더 알아보기] 판다스로 여러 개의 그래프 그리기

[5가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

 

 

Chapter 07 검증하고 예측하기


07-1 통계적으로 추론하기

__모수검정이란

__표준점수 구하기

__중심극한정리 알아보기

__모집단의 평균 범위 추정하기: 신뢰구간

__통계적 의미 확인하기: 가설검정

__정규분포가 아닐 때 가설 검증하기: 순열검정

[문제 해결 과정] 표본 데이터에서 의사 결정 도출하기

[6가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

 

07-2 머신러닝으로 예측하기

__알아 두면 좋은 머신러닝 용어

__모델 훈련하기

__훈련된 모델을 평가하기: 결정계수

__연속적인 값 예측하기: 선형회귀

__카테고리 예측하기: 로지스틱 회귀

__[문제 해결 과정] 도서권수로 대출건수 예측하기

[좀 더 알아보기] 평균제곱오차와 평균절댓값오차로 모델 평가하기

[8가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

 

 

부록 A 한발 더 나아가기: 데이터베이스와 SQL

부록 B 이 책에서 배운 함수와 메서드

부록 C 에필로그

 

__확인 문제 정답

__찾아보기

도서 특징


하나, ‘입문자 맞춤형 7단계 구성’을 따라가며 체계적으로 반복하는 탄탄한 학습 설계!

이 책은 데이터 분석의 핵심 내용을 7단계에 걸쳐 반복 학습하면서 자연스럽게 머릿속에 기억되도록 구성했습니다. [핵심 키워드]와 [시작하기 전에]에서 각 절의 주제에 대한 대표 개념을 워밍업하고, 이론과 실습을 거쳐 마무리에서는 [핵심 포인트]와 [확인 문제]로 한번에 복습합니다. ‘혼자 공부할 수 있는’ 커리큘럼을 그대로 믿고 끝까지 따라가다 보면 데이터 분석 공부가 난생 처음인 입문자도 무리 없이 책을 끝까지 마칠 수 있습니다!

 

둘, 실제로 일어날 법한 흥미로운 스토리에 담긴 문제를 직접 해결하며 익히는 ‘진짜’ 데이터 분석!

현장감 넘치는 스토리를 통해 데이터를 다루는 방법을 알려 주어 ‘파이썬’과 ‘데이터’가 낯설어도 몰입감 있는 학습을 할 수 있도록 구성했습니다. 이 책에서는 API와 웹 스크래핑을 통해 실제 도서관 데이터와 온라인 서점 웹사이트에서 데이터를 가져오는 등 내 주변에 있는 데이터를 직접 수집할 수 있는 방법을 가이드합니다. 또한 판다스, 넘파이, 맷플롯립 등 데이터 분석에 유용한 각종 파이썬 라이브러리를 활용해 보며 코딩 감각을 익히고, 핵심 통계 지식으로 기본기를 탄탄하게 다질 수 있습니다. 마지막에는 분석을 바탕으로 미래를 예측하는 머신러닝까지 맛볼 수 있어 데이터 분석의 처음부터 끝까지 제대로 배울 수 있습니다.

 

셋, ‘혼공’의 힘을 실어줄 동영상 강의와 혼공 학습 사이트 지원!

책으로만 학습하기엔 여전히 어려운 입문자를 위해 저자 직강 동영상도 지원합니다. 또한 학습을 하며 궁금한 사항은 언제든지 저자에게 질문할 수 있도록 학습 사이트를 제공합니다. 저자가 질문 하나하나에 직접 답변을 달아 주는 것은 물론, 관련 최신 기술과 정보도 얻을 수 있습니다. 게다가 혼자 공부하고 싶지만 정작 혼자서는 자신 없는 사람들을 위해 혼공 학습단을 운영합니다. 혼공 학습단과 함께하면 마지막까지 포기하지 않고 완주할 수 있을 것입니다.

https://hongong.hanbit.co.kr

https://github.com/rickiepark/hg-da

 

넷, 언제 어디서든 가볍게 볼 수 있는 혼공 필수 [용어 노트] 제공!

꼭 기억해야 할 핵심 개념과 용어만 따로 정리한 [용어 노트]를 제공합니다. 처음 공부하는 사람들이 프로그래밍을 어려워하는 이유는 낯선 용어 때문입니다. 그러나 어려운 것이 아니라 익숙하지 않아서 헷갈리는 것이므로, 용어나 개념이 잘 생각나지 않을 때는 언제든 부담 없이 [용어 노트]를 펼쳐 보세요.  제시된 용어 외에도 새로운 용어를 추가하면서 자신만의 용어 노트를 완성해가는 과정도 또 다른 재미가 될 것입니다.

 

 

먼저 읽은 베타리더들의 한 마디

  • 실제 데이터 분석 과정대로 이야기를 풀어나가니 쉽게 읽히고, 가상의 사례가 설정되어 있어 읽는 재미도 있었습니다. _김진형 님
  • 데이터 분석에 어떤 방법을 사용하는지 쉽게 알려 주어서 좋았습니다. 간단한 것은 스스로 만들어서 적용해 보고 싶을 정도로 설명과 예시가 잘 되어 있습니다. _도윤 님
  • API, JSON, 웹 스크래핑까지 설명하고 있어 다른 도서와 차별성이 있고, 예제가 실제 환경에서 사용하기 좋습니다. _김형훈 님
  • 친절하고 쉬운 설명, 직관적인 도해가 있어 초보자도 쉽게 해낼 수 있다는 것을 경험할 수 있었습니다. _이종원 님
  • 절마다 키워드와 함수가 요약되어 있어 지금까지 학습한 내용을 복기하고 기초를 탄탄하게 쌓을 수 있습니다. _전지민 님
  • 꼭 필요한 용어와 개념, 비주얼한 설명, 간단한 손코딩 코드로 파이썬 데이터 분석을 익힐 수 있습니다. _홍창수 님

혼자 공부하는 데이터 분석 with 파이썬

(박해선 지음, 한빛미디어)

 

 

 

데이터 분석을 어떻게 시작할지 막막할 때

 

실생활 데이터로 기초를 다지고 싶을 때

 

데이터에서 의미 있는 결과를 얻고 싶을 때

 

 

원글 : https://it4edu.tistory.com/250

 

혼공데이터1.jpg

 

 

데이터 분석과 파이썬은 요즘 저에게 가장 강력한 관심사입니다. 앞으로를 살아가는 데 있어서 데이터가 가지는 힘과 중요성을 늘 생각해오고 있고, 거기에 파이썬, 기초 통계학 등은 저 스스로도 공부하고 싶은, 그리고 학생들에게도 교육적으로 다가가고 싶은 아주 매력적인 주제입니다.

 

 

 

그래서 평소에도 데이터 분석 관련 책들을 꾸준히 찾아서 보는 편입니다. 여러 출판사의 다양한 책들을 읽어보았습니다. 그런데 이번에 기대하고 있던 책이 나온다는 소식을 들었습니다. 믿고 보는 "혼자 공부하는 시리즈"에서 데이터 분석과 파이썬 관련 책이 나온다는 것이었습니다. 게다가 저자가 머신 러닝, 딥러닝 분야의 책을 읽어봤다면 한 번쯤을 들어보았을만한 전문가 "박해선" 님이라는 것이었습니다.

 

 

 

 

우연한 기회에 이 책이 발간되기 전 베타 리더를 모집한다는 소식을 접했습니다. 혹시나 하는 마음에 베터 리딩을 신청했다가 덜컥 선정되어서 남들보다 빠르게 책을 읽어볼 수 있는 기회를 얻었습니다. 

 

 

 

혼공데이터2.jpg

 

 

 

 

"초보자의 눈높이에 맞춘 훌륭한 데이터 분석 입문서입니다. 파이썬을 설치할 필요 없이 코랩 환경에서 쉽고 빠르게 시작할 수 있고, 부담스럽지 않은 수준의 코드를 단계별로 몇 줄 입력하다 보니 어느새 1개 장이 금방 끝나버렸습니다. 오류가 발생할 수 있는 상황에 대해 원인과 그에 대한 적절한 해결 방법도 알려 주어 실제 데이터 분석의 과정을 경험해 볼 수 있어서 좋았습니다."

 

 

 

제가 쓴 베타 리딩 후기입니다. 지금 다시 읽어봤는데 생각보다 잘 쓴 것 같습니다. 제가 하고 싶었던 이야기를 잘 요약해서 적었다는 생각이 듭니다.

 

 

 

 

혼자 공부하는 시리즈는 말 그대로 독학 하기에 잘 구성된 책입니다. 이미 여러 종류의 책들을 읽어봤고 혼공단(한빛미디어 출판사에서 1년에 두 번 정도 진행하는 스터디 활동) 활동도 몇 차례 진행하면서 이건 보증할 수 있습니다. 제목은 혼자공부하는 시리즈 인데, 혼공단 활동으로 함께 공부하면 시너지가 아주 큽니다!! 이번에도 혼공단 활동을 진행하고 있는 중인데 다른 급한 공부를 먼저 하느라 SQL 책으로 시작했는데, 다음 기회에는 이 책으로 조금 더 꼼꼼히 복습할 계획입니다.

 

 

 

그리고 파이썬을 내 컴퓨터 환경에 설치하는 것이 어떤 사람에게는 큰 일이 아닐 수도 있지만 또 어떤 사람에게는 까다로운 일일 수도 있습니다. 이 책에서는 코랩 환경을 소개하고 있습니다. 온라인이 연결된 환경이면 파이썬 설치 없이 연습해볼 수 있는 도구인데, 코랩 사용법도 자세하게 나와 있어 따라하기 좋았습니다.

 

 

 

혼공데이터3.jpg

 

 

 

 

단계별로 입력해야 할 코드들도 복잡하지 않게 소개되어 있습니다. 입력하고 결과 확인하고, 또 입력하고 결과 확인하고를 몇 번 반복하다보면 어느새 한 장(chapter)이 끝나 있습니다. 코드 안에 주석처럼 코드의 의미도 적혀 있어서 코드를 이해하는데 큰 어려움이 없었습니다.

 

 

 

혼공데이터4.jpg

 

 

 

 

보통 데이터 분석 책들은 데이터를 수집해서, 가공하고, 그래프 그려서 분석하는 부분까지 소개를 합니다. 그런데 이 책은 저자님이 머신러닝 전문가 답게 기초적인 머신러닝으로 데이터를 분석하는 부분도 소개해줍니다. 

 

 

 

혼공데이터5.jpg

 

 

 

 

심지어 부록에는 데이터베이스, SQL 까지 언급해 주셨습니다. 초보자를 위한 책이지만 참 많은 걸 소개해주고 싶으셨구나라는 생각이 들었습니다.

 

 

 

혼공데이터6.jpg

 

 

 

 

마지막으로! 저자님과의 활발한 소통이 가능한 것도 아주 큰 장점이라고 할 수 있습니다. 유튜브 강의를 통해서도 도움을 많이 받을 수 있고, 저자님과의 오픈 채팅방을 통해 질의 응답도 가능합니다.

 

 

 

혼공데이터7.jpg

 

 

 

 

 

데이터 분석에 관심이 생겨서 처음 공부하시는 분들이라면 이 책 강력하게 추천합니다.

 

 

데이터 분석 공부를 어디부터 시작해야 될지 모른다면 이 책으로 시작하는 것도 좋겠습니다. 데이터 분석에 필요한 기초를 쉽고 넓게 다루었기 때문에 학습하기에 좋은 책입니다. 각 챕터 마지막의 마무리와 확인 문제를 활용하시면 배운 내용을 확인하고 활용하는데 더 도움이 될 듯 합니다. 유투브 강의나 Q&A사이트, 카카오톡 오프채팅도 지원되니 같이 활용해보세요.

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

도서판매처

리뷰쓰기

닫기
* 도서명 :
혼자 공부하는 데이터 분석 with 파이썬
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
혼자 공부하는 데이터 분석 with 파이썬
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
혼자 공부하는 데이터 분석 with 파이썬
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실