메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

오래된 내 정보 속 옥의 티를 찾아라(2022.9.22~12.31) / 회원정보 UPDATE하고 선물도 받고!

어쩌다 데이터 분석 with 파이썬

판다스로 시작하는 효율적인 데이터 분석 및 시각화

한빛미디어

집필서

판매중

  • 저자 : 김유지(Clary K)
  • 출간 : 2022-09-29
  • 페이지 : 412 쪽
  • ISBN : 9791169210317
  • 물류코드 :11031
초급 초중급 중급 중고급 고급
0점 (0명)
좋아요 : 6

파이썬 데이터 분석은 처음EASY?

판다스 핵심 레시피와 예제로 익히는 파이썬 데이터 분석 기초!

 

이 책은 파이썬 데이터 분석을 위해 반드시 알아야 하는 판다스, 넘파이, 맷플롯립, 시본 등 파이썬 핵심 라이브러리를 사용해서 효과적으로 데이터를 분석하고 시각화하는 방법에 대해 다루고 있다. 파이썬 데이터 분석 입문자를 위해 일반적인 데이터 분석 과정으로 내용을 구성했으며 데이터 분석을 위한 중요한 핵심 함수와 처리 과정을 쉽고 간결하게 설명하고 있다. 마지막으로 넷플릭스 데이터셋으로 실무에 적용 가능한 데이터 전처리 및 시각화 과정을 실습해본다.

 

 

상세이미지_어쩌다 데이터 분석 with 파이썬.jpg

 

김유지(Clary K) 저자

김유지(Clary K)

동덕여대에서 미디어 디자인, 국민대 테크노디자인대학원에서 인터랙션 디자인을 전공했다. UX 컨설팅 회사, 외국계 IT 기업, IT 스타트업 등 다양한 환경에서 일해온 UX/UI 기획자로 적응력이 빠르고 새로운 도전을 좋아한다. 몇 년 전 자기계발 및 업무 역량 성장을 위해 파이썬 프로그래밍과 데이터 분석 스터디를 시작했고 정부 R&D 과제 및 금융 서비스 프로젝트에도 참여했다. 현업에 데이터 분석 결과를 다양한 관점으로 적용하기 위해 부단히 노력 중이다. 온라인에서 Clary K라는 필명으로 활동하고 있으며 취미로 블로그에 파이썬 지식과 데이터 시각화 관련 포스팅을 하고 있다.

 

블로그: blog.naver.com/youji4ever

1장. 데이터 분석 준비

1.1 데이터 분석의 세계

1.2 아나콘다 설치 및 주피터 노트북 실행

1.3 파이썬 핵심 정리

1.4 파이썬 데이터 분석 주요 라이브러리

1.5 데이터셋

 

2장. 데이터 분석 기본

2.1 넘파이 기본

2.2 판다스 기본

2.3 데이터 로드와 저장

2.4 데이터 확인

2.5 데이터프레임의 컬럼을 다루는 테크닉

2.6 데이터 인덱싱(데이터프레임의 값 선택)

 

3장. 데이터 정제와 응용

3.1 데이터 필터링과 정렬 테크닉 

3.2 결측값 처리

3.3 이상값 처리

3.4 문자열 데이터 처리

3.5 카테고리 데이터 처리

3.6 람다를 활용한 데이터 처리 응용 예제

 

4장. 데이터 병합과 재형성

4.1 데이터 병합

4.2 데이터 재형성과 피벗

4.3 데이터 병합 후 처리

 

5장. 데이터 집계와 그룹 연산

5.1 그룹 연산의 이해 

5.2 피벗 테이블과 크로스탭 활용

 

6장. 날짜시간 데이터 처리

6.1 날짜시간 데이터 타입

6.2 날짜시간 데이터 인덱스

6.3 Time/Date 컴포넌트

 

7장. 데이터 시각화

7.1 맷플롯립 데이터 시각화

7.2 시본 데이터 시각화

 

8장. 데이터 분석: EDA 실습

8.1 데이터 첫 탐색

8.2 데이터 전처리

8.3 데이터 시각화 기초

8.4 데이터 시각화 고급

8.5 실습을 마치며

개발 환경 준비 + 판다스 핵심 기능 + 데이터 시각화 + EDA 실습

 

판다스는 파이썬 환경에서 데이터를 분석하기에 최적화 된 오픈소스 라이브러리이다. 이 책은 파이썬 데이터 분석을 위한 준비 과정과 알아야 하는 개념 그리고 판다스 핵심 기능과 데이터 시각화 기초까지 다룬다. 또한 파이썬 데이터 분석에 필요한 핵심 레시피를 익힌 뒤 넷플릭스 데이터셋으로 실무도 경험해본다. 현업에 적용할 수 있는 EDA를 실습하고 데이터 간 유의미한 상관관계를 분석하며 데이터 분석 역량을 기를 수 있도록 도와준다.

 

 

★ 이 책의 구성

 

STEP1 데이터 분석 준비 & 기본

  • 개발 환경 구축하기
  • 파이썬 기본 내용 
  • 파이썬 핵심 라이브러리 소개 및 기능 설명

STEP2 데이터 정제와 응용

  • 데이터 필터링/정렬 테크닉
  • 결측값/이상값 확인 및 처리

STEP3 데이터 병합/그룹 연산

  • 데이터 병합
  • 테이블 형식 데이터 재배치/피벗
  • groupby를 활용한 그룹별 요약 및 집계
  • 피벗 테이블과 크로스탭 활용

STEP4 시계열 데이터 처리

  • 날짜시간 데이터 타입
  • 날짜시간 데이터 인덱스

STEP5 데이터 시각화

  • 맷플롯립 기본 핵심
  • 많이 활용되는 시본의 주요 그래프

STEP6 실전 연습

  • EDA 실습: 넷플릭스 데이터셋
  • 데이터 전처리 기법 적용 및 데이터 시각화 작업

 

1장_데이터 분석 준비

데이터 분석이 무엇이고 어떻게 진행되며 어떤 역량이 필요한지 살펴본다. 그리고 파이썬 데이터 분석을 실행하기 위한 개발 환경을 구축한 뒤 이 책을 읽는 데 필요한 파이썬 기본 내용과 핵심 라이브러리에 대해 알아본다.

 

2장_데이터 분석 기본

파이썬에서 데이터 분석을 하기 위해 가장 필수적으로 알아야 할 라이브러리인 넘파이

와 판다스의 기본 사용법을 학습한다. 데이터를 불러오고, 생성하고, 선택하고, 골라내고, 삭제하고 새로운 모양으로 변경하는 등 기초적인 데이터 처리 방법을 배운다.

 

3장_데이터 정제와 응용

데이터를 처리하고 가공하는 다양한 방법을 몇 가지 카테고리로 분류해서 배운다. 먼저 상세한 조건으로 데이터를 추출하거나 다른 함수를 활용하여 데이터를 필터링하는 기법과 정렬 테크닉을 알아본다. 그다음 결측값이 생기는 원인과 판다스로 결측값을 확인하고 처리하는 방법에 대해 익힌 뒤 이상값을 확인하고 처리하는 방법을 살펴본다.

 

4장_데이터 병합과 재형성

서로 다른 데이터프레임을 연결하고, 합쳐진 데이터프레임을 다시 다른 모양으로 변경하는 학습을 한다. 판다스의 함수를 통해 흩어져 있는 데이터를 연결하고 병합하는 방법을 익힌다. 그리고 테이블 형식의 데이터를 다양한 방식과 기준으로 데이터를 재배치하거나 피벗하는 방법을 학습한다. 마지막으로 데이터 병합이나 재형성 후의 처리 방법에 대해 다룬다.

 

5장_데이터 집계와 그룹 연산

판다스의 groupby 개념과 활용법을 배우고 데이터를 그룹별로 나누어 요약 및 집계를 해본다.

또한 판다스에서 피벗 테이블과 그룹 빈도를 계산하는 크로스탭을 활용한 분석에 대해서 알아본다.

 

6장_날짜시간 데이터 처리

판다스에서 사용하는 시계열 데이터 종류인 datetime과 관련하여 날짜와 시간에 대한 기초

지식을 학습한다. 날짜시간 데이터를 다룰 때 기초적으로 알고 있어야 할 데이터 타입에 대해 배우고 인덱스와 관련있는 몇 가지 주요 처리 방법에 대해 익힌다.

 

7장_데이터 시각화

대표적인 파이썬 데이터 시각화 라이브러리인 맷플롯립과 시본을 알아본다. 먼저 파이썬으로 데이터 시각화를 할 때 필수적으로 알아야 할 맷플롯립의 핵심을 학습한다. 그다음 많이 활용되는 시본의 주요 그래프에 대해 배워본다.

 

8장_데이터 분석: EDA 실습

앞에서 배운 기술을 어떻게 사용하고 응용되는지 익히기 위해 데이터 분석 실습 과정을 진행한다. 분석하려는 데이터의 특징을 파악하여 적합한 전처리 기법을 적용한 후 데이터를 더 잘 이해할 수 있도록 다양한 시각화 작업을 해본다.

 

 

★ 대상 독자

 

이 책은 파이썬을 이용한 데이터 분석에 대해 관심 있는 입문자를 대상으로 한다. 기본적으로 파이썬 기초를 알고 있다는 전제하에 설명하고 있으나 파이썬을 접해보지 못한 독자를 위해 파이썬 핵심 기본 내용을 수록했다. 

 

 

★ 예제 소스

 

https://github.com/claryk0520/bumping-into-data-analysis 

 

 

추천사

 

요즘은 데이터 분석 전문가가 아니더라도 자기 분야의 데이터 분석을 스스로 하는 시대이다. 다만 일반인도 처음부터 따라 하기만 하면 데이터 분석의 기초를 갖출 수 있는 책이 많지 않아 아쉬움이 있었다. 이 책은 파이썬과 데이터 분석을 처음 접하는 입문자가 기본서로 삼아 공부하기에 적합한 내용으로 구성되어 있으며 비전문가의 눈높이에 맞는 적절한 예제로 쉽게 설명하고 있다. 특히 공식 문서에는 나오지 않지만 알아두면 좋은 팁과 초보자가 하기 쉬운 실수에 대한 조언이 가득 담겨 있다는 것이 이 책의 가장 큰 장점이다.

김정용 - SK하이닉스 | AI 엔지니어

 

개발, 마케팅 등의 업무를 담당하는 사람뿐 아니라 일반인도 데이터를 다뤄야 하는 시대이다. 이 책은 초보자도 쉽게 데이터 분석에 입문할 수 있도록 도와주는 백과사전이다. 데이터 분석을 위한 환경 구성부터 기초 및 고급 지식을 습득할 수 있는 다양한 예제가 마련되어 있으며, 마지막 장의 EDA 실습을 통해 실전에 빠르게 적용할 수 있도록 도와준다. 데이터 분석의 기초를 최대한 빠르게 습득함과 동시에 실전에 적용하고자 하는 독자에게 이 책을 강력히 추천한다.

남상구 - 인텔 | 소프트웨어 엔지니어 

 

파이썬을 이용한 데이터 분석과 머신러닝을 배우기 시작하면 어렵게 느껴지는 고비가 몇 군데 있다. 그중 하나가 판다스를 사용해 데이터를 다룰 때이다. 처음엔 판다스를 사용해 데이터를 읽고 쓰면서 그 편리함과 예쁜 표로 시각화된 모습을 보며 신세계를 만난 기분이 들지만 본격적으로 데이터를 가공하고 집계하다 보면 데이터 앞에서 작아지는 자신을 보게 된다. 판다스는 짧은 시간 동안 집중해서 익히는 라이브러리가 아니다. 다루는 데이터에 따라 각기 다른 대응법을 끊임없이 배워야 하는 존재이다. 이 책은 판다스의 중요한 기능이 적절한 예제에 함께 간결하게 정리되어 있다. 판다스를 빨리 익혀야 한다는 조바심은 잠시 내려두고 이 책을 통해 판다스의 필요한 기능을 하나씩 배워보기 바란다.

이제현 - 한국에너지기술원 플랫폼연구센터 | 선임연구원

 

데이터 분석, 어디서부터 어떻게 무엇을 배워야 할지 참 막막하게 느껴질 것이다. 이런 고민을 가지고 있는 독자에게 알맞은 설루션으로 이 책을 추천한다. 입문자에게 파이썬 핵심 라이브러리 사용법을 비롯하여 필요한 것만 알려주어 학습 시간을 아껴주고, 쉽게 설명하고 있어 데이터 분석의 진입 장벽을 조금이나마 낮춰준다. 책을 덮을 즈음에는 데이터 분석에 대한 자신감이 생기게 될 것이며, 이 책이 데이터 분석가라는 초행길의 믿음직스러운 길잡이가 되어줄 것이다.

하송미 - (주)네피리티 | 데이터 분석 엔지니어

 

프런트엔드 개발자로 성장하고자 하는 독자라면 한 권쯤 꼭 가지고 있으면 좋을 안내서이다. 개발자라는 긴 여정을 시작하는 초심자를 위해 개발 환경 설정부터 현업에서 주로 사용하는 데이터 형태와 타입 그리고 분석 기법을 군더더기 없이 단계별로 예제와 함께 풀어주고 있다. 이 책에서 안내하는 단계별 여정대로 잘 따라간다면 길을 잃을 일 없이 어느새 자연스럽게 데이터 분석을 하고 있는 자신을 볼 수 있을 것이다.

조준호 - 한국고용정보원 | 데이터 분석가

 

이 책은 한 마디로 판다스 기초 백과사전이라고 할 수 있다. 상세한 설명과 다양한 예제를 통해 데이터 분석 초심자가 데이터프레임을 활용한 분석 과정에서 막힐 수 있는 부분을 자세하게 설명해주고 있기 때문에 처음 데이터 분석을 시작하려는 독자에게 추천한다. 또한 다양한 데이터프레임 사용 방법을 숙지할 수 있고 다시 한번 기초를 다지는 기회가 될 수 있기 때문에 데이터 분석을 경험한 독자에게도 많은 도움이 될 것이다.

이단비 - (주)이팝콘 | 데이터 분석가

  • 첫번째 리뷰어가 되어주세요.
  • 부록/예제소스
    자료명 등록일 다운로드
    DOWNLOAD 예제소스 2022-09-30 다운로드
    결제하기
    • 문화비 소득공제 가능
    • 배송료 : 2,000원배송료란?

    배송료 안내

    • 20,000원 이상 구매시 도서 배송 무료
    • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

    무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

    닫기

    리뷰쓰기

    닫기
    * 도서명 :
    어쩌다 데이터 분석 with 파이썬
    * 제목 :
    * 별점평가
    * 내용 :

    * 리뷰 작성시 유의사항

    글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

    1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
    2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

    오탈자 등록

    닫기
    * 도서명 :
    어쩌다 데이터 분석 with 파이썬
    * 구분 :
    * 상품 버전
    종이책 PDF ePub
    * 페이지 :
    * 위치정보 :
    * 내용 :

    도서 인증

    닫기
    도서명*
    어쩌다 데이터 분석 with 파이썬
    구입처*
    구입일*
    부가기호*
    부가기호 안내

    * 인터넷 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

    * 한빛 웹사이트에서 구입한 도서는 자동 인증됩니다.

    * 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

    * 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

    닫기

    해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
    장바구니로 이동하시겠습니까?

    자료실