메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

개발의 즐거운이 가득한 곳! DEVGROUND 2019 (6월 27일(목), 28일(금))

좋은 선택, 나쁜 선택

합리적인 선택을 위한 데이터 바로 읽기

한빛미디어

집필서

판매중

  • 저자 : 최희탁
  • 출간 : 2019-02-01
  • 페이지 : 172 쪽
  • ISBN : 9791162241400
  • 물류코드 :10140
초급 초중급 중급 중고급 고급
4.3점 (6명)
좋아요 : 5

데이터는 거짓말을 하지 않는다. 

하지만, 거짓말쟁이는 데이터를 말한다. 

 

상대의 주장을 반박하는 논거로 데이터 만한 것은 없다.  

아무리 강하게 자신의 주장을 고수하던 사람이라도 스스로의 논리로는 설명할 수 없는 수치로 가득한 데이터 앞에 서게 되면 순간적이나마 그 기세를 잃고 괜스레 좌우를 둘러보며 딴소리를 하기 마련이다.

 

이렇게 행동하는 이유는 우리가 '데이터는 가치 중립적'이라고 생각하기 때문이다. 그런데, 우리가 생각하는 것처럼 데이터는 정말 가치 중립적일까? 

우리는 주장의 근거로 사용되는 데이터가 이미 주장을 뒷받침하는 것으로 선별되었다는 것을 인지해야 한다.

 

이 책은 데이터에 기반한 선택에서 가장 중요한 '데이터 바로 읽기'를 제안한다.

  • 어떤 주장에 대해 그 논거가 일화적 증거라면 그것에 의거하여 판단을 내리면 안 된다. 
  • 숫자, 특히 통계 수치를 받아들일 때 복잡하고 길면 길수록 이것의 의미를 다시금 확인해 볼 필요가 있다. 
  • 표본에 대한 조사만으로도 전체 모집단의 특성을 알아낼 수 있다는 것은 통계학이 우리에게 준 축복이다.  하지만 표본 추출은 매우 어려운 일이다. 
  • 과거와 현재를 아무리 잘 설명하는 모델이라고 해서 미래가 그에 맞춰 움직인다고 생각하면 안 된다. 
  • 사람이 하는 일이면 그 어떤 경우에도 자기의 이익을 위한 의도가 있을 것이라고 간주하고 접근하자.

이제, 좋은 선택을 해보자.

 

어떤 독자를 위한 책인가?

  • 데이터에 기반한 보고서, 기안서, 제안서를 작성하고자 하는 기획자, 마케터, 개발자
  • 데이터에 기반한 선택, 의사결정을 하고자 하는 관리자(팀장, 부서장), 경영자(본부장, 임원)
  • 직관에 의한 선택이 아니라 데이터에 기반한 선택, 의사결정을 하고자 하는 모두

 

10140_details.jpg

 

저자

최희탁

서울대학교에서 수학을 공부하였으며 티맥스소프트에서 룰 엔진과 웹 애플리케이션 서버 개발에 참여했다. 현재는 NAVER에서 밴드 서비스 개발을 책임지고 있다. 어렸을 때부터 활자라면 종류를 가리지 않고 읽기를 즐겼으며 그 결과, 사마천의 『사기』와 『은하수를 여행하는 히치하이커를 위한 안내서』 시리즈가 뒤죽박죽 섞여있는 책장을 이고 지고 살고 있다.

 

 
Part 1. 좋은 선택은 무엇이고, 나쁜 선택은 무엇인가?

 

__Chapter 1. 데이터에 기반한 선택이 좋은 선택이다

____1만 시간의 법칙

____데이터로 보는 미래

____경험에 기반한 선택

____개연성에 기반한 선택

____지도자의 영도에 따르는 선택

____다수의 선택에 따르는 선택

____데이터에 기반한 선택

 

 

Part 2. 좋은 선택을 위한 데이터 바로 읽기

__Chapter 2. 우리의 수치에 대한 직관은 믿을 만하지 않다

____정량화, 수치화

____대가족은 범죄의 온상

____천생 연분

____스포츠카와 염소

____일어나지 않을 법한 일

____블라인드 테스트

 

__Chapter 3. 확률과 통계의 함정

____독립 사건

____큰 수의 법칙

____이항 분포

____정규 분포, 중심극한정리

____평균 회귀

 

__Chapter 4. 데이터 수치가 말하지 않는 것

____정확도와 재현율

____미안합니다, 양성입니다

____모집단을 대표하는 표본 추출

____선택 편향과 필터 버블

____살아남는 자가 강한 자다

 

__Chapter 5. 거짓말은 아닙니다.

____윤리적으로 문제없는 데이터

____차원 이동으로 부풀리기

____정밀한 숫자와 정확한 값

____귀무가설과 검정

____셋 중 하나는 재현이 안 된다

____간절함의 결과, P-값 해킹

 

__Chapter 6. 숫자로 쌓아 올린 신기루

____ 10월 19일

____자연 치유

____위대한 기업을 만드는 것

____화물 숭배

____끌어당김의 법칙

 

 

Part 3. 합리적인  선택을 위해 해야 할 일

__Chapter 7. 선택을 해봅시다

____엘리베이터에서 배우자 고르기

____뷔풍의 바늘

____바늘 문제에 대한 접근 1- 정석적 접근

____바늘 문제에 대한 접근 2- 또 다른 접근

____바늘 문제에 대한 접근 3- 속 편하고 성실한 접근

 

__Chapter 8. 합리적인 선택을 위해 해야 할 일

____데이터 시각화

____합리적인 선택을 위하여

____데이터 분석 도구

 

Appendix. 수학기호

  • 나는 매주 로또를 산다. 45개의 숫자를 가지고 그중 6개의 숫자를 선택을 한 후에 한주를 기다린다. 숫자를 선택 할 때에는 그저 손이 가는데로 선택을 한다. 한줄은 이렇게 또 다른 한줄은 저렇게. 그리고 나서 토요일 저녁 경건한 마음으로 숫자를 맞춰보지만 3줄을 사서 내가 맞춘 숫자는 몇개 되지 않는다. 그런데 놀랍게도 매주 로또는 10명 이상 당첨자들이 꾸준히 나온다. 어떻게 이럴수 있을까?? 

     

    로또가 당첨될 확률은 800만이 넘는다. 매년 판매되는 숫자는 다르겠지만. 당첨될 확률보다 훨씬 많은 수량이 팔리기 때문에 기대값이 약 8이 된다고 한다. (2016년 기준) 그렇기 때문에 매주 8명 정도는 당첨자가 나올수 있다는 것이다. 

     

    우리가 어떤 선택을 할 때에 이와 같이 데이터와 수치를 가지고 분석을 해 본다면 좀더 나은 선택을 할수 있지 않을까라는 생각을 하게 된다. 이 책에서는 이렇게 우리가 알수 있는 수치와 데이터를 가지고 어떠한 선택이 좋은 선택인지 또는 나쁜 선택인지 찾아보는 내용을 담고 있다. 

     

    수치에 대한 내용을 다루기 때문에 이 책에는 여러가지 수식들이 나온다. 기초적인 계산이나 쉬운 내용들은 보는데 무리가 없었다. 하지만 특정 기호나 공식에 대해서는 푸는 방법에 대해서 중간중간 찾아보는 노력이 필요했다. 이런 데이터나 수치에 대한 내용의 책들을 읽을 때에 내용 이해를 위해서는 피할수 없는 부분인것 같다. 

     

    그리고 선택한 주제들 자체가 무겁지 않은 우리가 일상 생활에서 자주 접할수 있는 내용들이어서 좋았다. "그냥 그렇겠지" 라고만 생각했던 나의 일상들이 수치화 해서 표현하는 순간 나에게 보여주는 결과물 들이 전혀 예상치 못했던 것들을 보고 "오~~ 그렇구나" 라고 고개를 끄덕이게 해주었다. 

     

    책 표지에 써있듯이 합리적인 선택을 위해서 데이터를 읽는 방법을 알고 싶은 독자들에게 충분히 재미있고 도움이 될수 있는 책이라고 생각한다. 

     

    https://blusky10.tistory.com/390

  • IMG_8752.JPG

     

     

    이 책의 전반적인 내용이 사실, 어떤 사례 기반에서의 확률을 소개하는데, 어떤 이에게는 재미가 있는 이야기가 되거나 어떤 이에게는 지루한 느낌으로 다가 올 것 같다는 생각이 들었다. 어느 정도 요약하면, 카지노의 룰렛 게임은 게임 참가자가 이익을 얻을 확률은 47.4%였던가? 그리고 나머지 확률로 딜러가 이긴다.

    그럼 결국, 카지노는 대량의 돈을 이용해 큰수의 법칙을 이용하는 셈이다. 막대한 부를 창출하는 카지노가 고작 5.2%의 이익률을 기반으로 많은 돈을 번다는 사실이다. 아 물론, 다른 카지노 게임들은 딜러가 이길 확률이 대개 높긴 하다. 아마 블랙잭 같은 경우도 딜러가 이길 가능성이 훨씬 높은 걸로 알고 있다. 그런데, 천재들의 무리들이 카드 카운팅이라는 기억력 기반으로 이기는 것도 가능하다. 그럼에도 결국 막대한 부를 가진 카지노를 상대로 완전히 이기는 것은 불가능하다. 그 이유는 큰 수의 법칙이 작용하기 때문인데, 이는 책에서도 나오지만 내가 이해한 바는 불완전하다고 이해를 했다.

    그리고 또 하나 재밌던 점은 로또 복권의 관한 이야기인데, 이 이야기는 진짜 재밌게 읽었다. 그래서 다른 사람들도 이 부분은 재밌게 읽지 않을까? 하는 생각이 들었다.

    물론, 제목은 좋은 선택, 나쁜 선택인데, 내용과는 좀 먼 제목이지 않았나?라는 생각을 했다. 그래서 어떻게 데이터를 올바르게 선정을 해야 하는가? 라는 질문이 남았다. 책에 나온 수 많은 사례들이 아, 그렇구나 하면서도 이렇게 하면 되는걸까? 어떻게 해야 하는 걸까? 라는 고민을 남기게 했다.

     

  •  


    우리는 어떤 주장을 펼칠 때 아무런 논리적 근거 없이 그냥 우기는 사람을 많이 본다.

    또한, 근거라고 내세우는 통계는 자신의 입맛에 맞게 가공되었거나 아무런 객관적 근거가 없는 통계치를 사용하는 경우도 많이 본다. 그런 면에서 이 책은 좋은 선택을 하기 위해 어떻게 데이터를 바로 봐야 하는지 제시를 하고 있다.

     

    이 책은 크게 세 단계로 구성되어 있다.

     

    • 어떤 선택이 좋은 선택인가. 
    • 데이터 바로 읽기 
    •  합리적인 선택을 위해 해야할 일

     

     

    어떤 선택이 좋은 선택인가

     

    선택은 경험에 기반한 선택, 개연성에 기반한 선택, 지도자의 영도에 따르는 선택, 다수의 선택에 따르는 선택 그리고 마지막으로 데이터에 기반한 선택이 있다고 한다.

    이 모든 선택의 근거는 다 장단점이 있다. 하지만, 객관적 근거를 제시하기에는 데이터만 한 것이 없다. 데이터 기반으로 선택을 하게 되면 그 판단에 동의를 하지 않을 수 없게 된다.

     

    데이터 바로 읽기

     

    확률과 통계에는 함정이 있다. 자신에게 유리하게 확률을 계산할 수 있으며 통계를 조작하고 산출 할 수 있는지 설명을 하고 있다. 마크 트레인은 자신의 자서전에서 "거짓말에는 세 가지 종류가 있다. 그럴 듯한 거짓말, 새빨간 거짓말, 그리고 통계" 라고 말했다. 저자는 여러가지 조작 기법을 설명하면서 우리로 하여금 데이터를 바로 읽을 수 있게 안내를 하고 있다.

     

     

    합리적인 선택을 위해 해야할 일

     

    이 책의 백미는 바로 이 세번째 파트라고 생각한다. 이 파트에서 저자는 데이터를 바로 읽기 위해서는 5가지를 제안했다. 

     

    그 중에서 두가지는

     

    ● 과거와 현재를 아무리 잘 설명하는 모델이라고 해서 미래가 그에 맞춰 움직인다고 생각하면 안된다.

    ● 사람이 하는 일이면 그 어떤 경우에도 자기의 이익을 위한 의도가 있을 것이라고 간주하고 접근하자.

     

    오늘 날 우리는 4차 산업 혁명과 인공 지능 시대에 살고 있다. 이 큰 흐름에 있어서 데이터는 가장 중요하다. 하지만 우리가 어떤 데이터를 이용하느냐에 따라 결과도 달라 질 것이다. 그런 의미에서 이 책에서 다루는 주제는 의미가 있다고 생각한다.

     

     

     

     

  • 좋은선택나쁜선택01.png

     

    undefined

     

     

    #좋은선택 #나쁜선택 #합리적선택 #데이터읽기

    수학을 전공한 저자가 선택에 대한 글을 써야겠다고 결심한 것은 두 권의 책 때문이라고 합니다. 그 두 권의 책중 한 권은 짐 콜린스가 쓴 "Good to great (좋은 기업을 넘어 위대한 기업으로, 2002)" 입니다. 다른 한 권 역시 짐 콜린스의 저서로, 앞서의 책에서 위대한 기업으로 선정했던 기업들이 몰락한 상황에 대하여 그 요인을 찾았다면 쓴 책 "How to mighty fall (위대한 기업은 다 어디로 갔을까, 2010)" 입니다.

    짐 콜린스는 세계에서 가장 영향력 있는 경영학자중 한사람입니다. 하지만, 저자의 눈에 걸린 이 두 권의 책은 ... 적어도 첫번째 책 "Good to great"은 데이터에 기반한 과학적이고 실증적인 연구 결과물을 얻기 위해 필요한 여러 전제 조건을 생략하거나 무시한 채 자신의 주장을 속단하는 오류를 범하고 있다고 합니다. '데이터 바로 읽기'를 올바르게 했다면 그러한 오류는 피할 수 있었다는 것이죠.

    데이터가 말하는 것과 말하지 않는 것을 꿰뚫어 보는 것이 '데이터 바로 읽기' 입니다. 데이터를 옳바를게 읽는 방법을 알아야 하는 이유는 '데이터'에 기반한 선택이 좋은 선택이기 때문입니다. 저자는 경험이나 개연성, 지도자의 영도, 다수의 결정과 같은 우리가 선택의 상황을 만나게 될 때 자연스럽게 의지하는 몇몇 선택의 기반에 대하여 짧게 논의 합니다. 그리고는 어느 누가 보아도 동일한 판단을 할 수 있으며 모두가 그 판단에 동의할 수 있도록 하는 선택의 기반은 바로 '데이터에 기반한 선택'이어야 한다라고 결론짓습니다.

    데이터에 기반한 분석은 해석하고자 하는 사건이 가지고 있는 여러 속성을 수치, 즉 속성값으로 표현합니다. 수치를 이용한 객관화 작업을 통해 선입견이나 감정을 가능한 한 배제할 수 있게 되며, 선택을 요구하는 상황의 본질에 한발 더 가까이 다가갈 수 있게 됩니다.

     

     

    좋은선택나쁜선택03.png

     

     

    하지만, 우리의 수치에 대한 직관은 믿을 만하지 않습니다. 확률과 통계에는 함정이 숨어 있으며 데이터 수치가 말하지 않는 것을 캐치해 내지 못하거나 말하지 못 하도록 숨기는 경우도 있습니다. 숫자로도 얼마든지 신기루를 쌓아 올릴 수 있다는 것이죠. 그래서 이 책은 수치에 기반한 데이터를 바로 읽어 내기 위해 좌로도, 우로도 치우치지 않는 방법을 수학 전공자의 입장에서 설명해 가고 있습니다.

     

     

    좋은선택나쁜선택04.png

     

    '굿 윌 헌팅'과 같은 영화를 보면, 마치 영어로 설명하듯 수학공식을 사용하여 일상의 현상들을 설명하는 수학천재들을 볼 수 있습니다. 이 책에도 수학공식들이 꽤 나옵니다. 하지만, 수학공식들을 최대한 말로 설명하기 위해 노력한 저자의 고민도 꽤나 보입니다.

    그래도, 이집트 상형문자와 수학기호들을 구분 못하는 저 같은 문과출신들에게는 이 책이 조금 어렵게 느껴질 수도 있습니다. 그렇다고 해서, 수학천재들을 대상으로 한 책은 분명 아닙니다. 수학기호들을 요리조리 피해도 말하려고 하는 핵심을 파악하는데는 크게 어려움이 없었으니까요.

    데이터는 거짓말을 하지 않습니다. 하지만, 거짓말쟁이는 데이터를 이용하죠. 만약 당신이 데이터에 기반한 선택이나 의사결정을 해야 하는 위치에 있는 기획자나 마케터, 혹은 경영자라면, 데이터 바로 읽기 입문서로 부담없이 일독해 보시는 것을 추천합니다. 170여페이지의 얇고 가벼운 책이니까요. 커피 한잔하며 카페에서 두어시간정도면 다 읽을 수 있을꺼에요.

     

     

  • 데이터는 사람들의 신뢰를 얻기 위해 매우 좋은 수단입니다. 데이터와 수치, 통계는 어떤 주장에 있어서 강한 근거가 되기도 합니다. 그렇기에 많은 글에서 다음과 같은 문구를 사용합니다.

    데이터는 거짓말을 하지 않는다

    데이터는 거짓말을 하지 않습니다. 정확히는 데이터는 거짓말을 할 수 없습니다. 데이터는 그 자체로 존재할 뿐입니다. 하지만 데이터로 거짓말을 하기는 너무 쉽습니다. 빅토리아 여왕 시대의 총리 벤저민 디즈레일리는 다음과 같은 말을 했습니다.

    “세상에는 세 가지 거짓말이 있다. 그럴듯한 거짓말, 새빨간 거짓말, 그리고 통계다.”

    이 책은 데이터/통계로 할 수 있는 거짓말과 이를 피하는 선택을 이야기하고 있습니다. 다양한 유형의 통계값을 해석하는 과정을 통해 좋은 선택을 하는 방법, 나쁜 선택을 피하는 방법을 쉽게 설명하고 있습니다. 기존의 알고 있던 내용들도 더 쉽고, 체계적으로 이해할 수 있었습니다.

    아쉬운 부분이 있다면 데이터를 읽는 과정 자체는 매우 좋았으나, 합리적인 선택을 하는 과정이 비교적 내용이 부족했습니다. 좋은 선택 나쁜 선택 보다는 데이터 바로 읽기 가 위주가 되어 흐름이 진행되었다는 점이 장점이자 단점인 것 같습니다. 개인적으로는 후자가 더 필요한 내용이기 때문입니다.

    수학적인 내용 자체가 어렵지 않고 사례가 많아 쉽게 읽을 수 있는 책이었습니다. 데이터에 대한 직관을 키우고 싶으신 분들과 데이터 분야에서 발표를 하시는 분들에게 더욱 추천해주고 싶은 책이었습니다. 책을 통해 더 풍부한 발표를 할 수 있을 것 같습니다.

  • 대부분의 사람들은 좋은 선택을 하기 위하여

    여러 자료를 찾아볼 것이고 그 자료에는

    통계적 수치나 데이터가 존재할 수 있다.

     

    대부분의 경우라고 말하기는 어렵겠지만

    관련 분야의 전문가가 아닌 일반인이 

    이 데이터를 얼마나 올바르게 해석할 수 있을까?

     

    좋은 선택 나쁜 선택에서는

    여러 형식의 데이터들을 보여주고 이를 해석해 나감으로써

    독자에게 데이터를 어떻게 이해해야 할지를 제시해주고 있다.

     

    해석하는 과정에서 나름대로 추측하는 재미도 있고

    그동안 여러 기사에서 얼마나 놀아났는지도 깨닫게 된다.

     

    개인적으로 경마 이야기가 흥미로웠는데

    상황을 요약해보면 아래와 같다.

     

    1. 누군가 이번주 경마에서 우승마를 알려준다.

    2. 우승마를 알게된 사람은 반신반의할 수 있고 개소리라고 치부할 수 도 있다.

    3. 실제로 알게된 우승마가 이겼다.

    4. 우승마를 알려준 사람에게서 그 다음주 우승마를 알고 싶으면 돈을 내라고...

     

    사실 조금만 생각해보면 간단하다. ( 정말로 우승마를 알 수 있다면 알려준 사람이 경마를 하면 되는 것이다. )

    이 이야기의 트릭은 읽어나가면서 추측하는 재미가 있었는데 방법은 아래와 같다.

    4마리의 말이 경기를 한다면 4명에게 각각의 말이 우승마라고 알려주면 된다.

    이렇게 하면 4명중 1명은 자신이 알게된 우승마가 이기게 되는 것이다.

     

    그 외에도 확률과 통계에 대한 여러 사례와 해석이 있으며

    이를 통하여 하나 하나 알아갈수록 확률과 통계에 대한 관심이 커지게 되었다.

    또한 데이터를 올바르게 바라보려면 어떻게 해야하는지 알게되어 매우 유익하다.

     

    [ 결론 ]

    개인적으로 데이터에 무방비하게 노출된 일반인으로써 

    최소한 당하고 살지 않기 위해서라도 필독해야 하지 않을까 싶다.

    그리고 재독을 하면서 내용을 정리한 다음 이 책에서 참고한 벌거벗은 통계학이라는 책도 읽어야 겠다.

결재하기
• 문화비 소득공제 가능
• 배송료 : 0원배송료란?

배송료 안내

  • 책, 아이템 등 상품을 3만원 이상 구매시 무료배송
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 도서명 :
좋은 선택, 나쁜 선택
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
좋은 선택, 나쁜 선택
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
좋은 선택, 나쁜 선택
구입처*
구입일*
부가기호*
부가기호 안내

* 회원가입후 도서인증을 하시면 마일리지 500점을 드립니다.

* 한빛 웹사이트에서 구입한 도서는 자동 인증됩니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한됩니다.

* 절판도서, eBook 등 일부 도서는 도서인증이 제한됩니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실