메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

인사이드 머신러닝 인터뷰

빅테크에서 자주 묻는 194가지 문제로 ML 면접 완벽 대비하기

한빛미디어

번역서

판매중

  • 저자 : 펑 샤오
  • 번역 : 정원창
  • 출간 : 2024-03-15
  • 페이지 : 332 쪽
  • ISBN : 9791169212120
  • 물류코드 :11212
  • 초급 초중급 중급 중고급 고급
4.9점 (27명)
좋아요 : 19

ML 면접을 위한 기본기부터 실무를 위한 실용적인 접근법까지

 

ML 면접에서 어떤 질문에도 자신 있게 대처하려면 전체 ML 워크플로와 관련 핵심 개념을 명확히 정리해야 한다. 이 책은 ML 기본 지식과 코딩 면접부터 시스템 및 인프라 설계 면접까지 단계별로 따라가며 지원자가 꼭 준비해야 할 문제와 해결 전략을 살펴본다. 저자는 아마존과 트위터, AI 스타트업을 거치며 천 명에 가까운 지원자를 면접한 경험을 바탕으로 빅테크 ML 면접에서 자주 묻는 질문 194가지와 최선의 답변을 구성하는 노하우를 풀어낸다. 책에서 제시하는 키워드 중심의 명쾌한 답변과 면접 관련 팁을 활용해 자신 있는 부분은 보강하고 부족한 부분은 충실히 보완해 면접을 성공으로 이끌어보자.

 

펑 샤오 저자

펑 샤오

15년 동안 소셜 미디어, 광고 기술, 핀테크, 전자 상거래 등 다양한 분야에서 ML 리더십 직책을 맡아 천 명에 가까운 지원자를 면접했다. 트위터(현재 X)에서 스태프 ML 엔지니어로 근무하면서 추천 알고리즘과 광고 예측 및 랭킹을 위한 ML 시스템을 설계했으며 그 전에는 록시(Roxy)라는 AI 스타트업을 공동 창업해 벤처 캐피탈에서 수백만 달러의 투자를 받았다. 경력 초기에 아마존과 팩트셋(FactSet)에서 ML 팀을 이끌며 기계 번역, 표 형식 정보 추출, 개체명 인식, 토픽 모델링 등 다양한 ML 시스템의 개발을 감독했다.

정원창 역자

정원창

전자공학과 전산학을 공부하고 국내외의 크고 작은 하드웨어와 소프트웨어 회사에서 경험을 쌓았다. 현재는 자연어 처리에 중점을 둔 머신러닝 엔지니어로 일하고 있다. 옮긴 책으로 『인사이드 머신러닝 인터뷰』, 『개발자의 하루를 바꾸는 코파일럿 & 챗GPT』(이상 한빛미디어) 등이 있다.

 

1장 ML 면접에 임하기
테크니컬 폰 스크린
ML 기본 지식 면접
ML 코딩 면접
ML 시스템 설계 면접
기타 면접
우수한 답변의 필수 요소

 

2장 ML 기본 지식
Q2.1 데이터셋 수집 단계
Q2.2 데이터 수집 시 문제
Q2.3 데이터 수집 시 고려 사항
Q2.4 레이블 불균형 처리
Q2.5 누락된 레이블 처리
Q2.6 입력 피처 유형
Q2.7 피처 선택과 중요도
Q2.8 피처 선택 방법
Q2.9 누락된 피처값
Q2.10 모델링 알고리즘
Q2.11 로지스틱 회귀 작동 방식
Q2.12 로지스틱 회귀 손실 함수
Q2.13 경사하강법 최적화
Q2.14 하이퍼파라미터 튜닝
Q2.15 모델 과적합 처리
Q2.16 정규화 기법
Q2.17 선형 회귀와 로지스틱 회귀
Q2.18 신경망 활성화 함수
Q2.19 의사 결정 트리, 랜덤 포레스트, 그래디언트 부스팅 결정 트리
Q2.20 부스팅과 배깅
Q2.21 비지도 학습 기법
Q2.22 k-평균 작동 방식
Q2.23 준지도 학습 기법
Q2.24 손실 함수 유형
Q2.25 손실 함수 볼록성
Q2.26 분류 모델 평가 지표
Q2.27 회귀 모델 평가 지표
Q2.28 모델 최적화
Q2.29 모델 성능 개선

 

3장 ML 코딩
Q3.1 k-평균
Q3.2 k-최근접 이웃
Q3.3 의사 결정 트리
Q3.4 선형 회귀
Q3.5 평가 지표
Q3.6 저수지 샘플링
Q3.7 확률 문제
Q3.8 해시 테이블과 분산 프로그래밍 문제
Q3.9 그래프 문제
Q3.10 문자열 문제
Q3.11 배열 문제

 

4장 ML 시스템 설계 1 - 추천 시스템
Q4.1 시스템 목적
Q4.2 시스템 지표
Q4.3 추천 콘텐츠 유형
Q4.4 추천 콘텐츠 혼합
Q4.5 시스템 운영 매개변수
Q4.6 시스템 구성 요소
Q4.7 콜드 스타트 문제
Q4.8 데이터셋 유형
Q4.9 데이터셋 수집 기법
Q4.10 데이터셋 편향
Q4.11 서빙 편향 완화
Q4.12 위치 편향 완화
Q4.13 추천 후보 출처
Q4.14 추천 후보 생성 단계
Q4.15 추천 후보 생성 알고리즘
Q4.16 임베딩 기술
Q4.17 대규모 추천 시스템의 후보 스코어링
Q4.18 신규 콘텐츠 색인화
Q4.19 추천 후보 병합 및 정리
Q4.20 사전 랭킹 모델 학습
Q4.21 사전 랭킹 모델 평가 지표
Q4.22 사전 랭킹 모델 알고리즘
Q4.23 사전 랭킹 모델 최적화
Q4.24 랭킹 모델 주요 피처
Q4.25 텍스트 또는 ID 기반 피처
Q4.26 횟수 기반 피처
Q4.27 헤비 랭킹 모델 학습
Q4.28 헤비 랭킹 모델 알고리즘
Q4.29 랭킹 모델 아키텍처
Q4.30 랭킹 모델 예측값 보정
Q4.31 랭킹 모델 평가 지표
Q4.32 다중 작업 모델과 개별 모델
Q4.33 모델 서빙 시스템
Q4.34 캐싱
Q4.35 모델 업데이트
Q4.36 온라인 실험
Q4.37 모델 로드
Q4.38 모델 실험 고려 사항
Q4.39 오프라인 평가 지표
Q4.40 온라인 성능 저하

 

5장 ML 시스템 설계 2 - 응용
Q5.1 문서 파싱
Q5.2 감성 분석
Q5.3 토픽 모델링 기법
Q5.4 문서 요약
Q5.5 자연어 이해
Q5.6 지도 학습 레이블
Q5.7 비지도 학습 피처
Q5.8 판별적 문제 피처
Q5.9 생성 모델 피처
Q5.10 정보 추출 모델 구축
Q5.11 정보 추출 평가 지표
Q5.12 분류 모델 구축
Q5.13 회귀 모델 구축
Q5.14 토픽 할당
Q5.15 토픽 모델링 평가 지표
Q5.16 문서 클러스터링 모델 구축
Q5.17 클러스터링 평가 지표
Q5.18 텍스트 생성 모델 구축
Q5.19 텍스트 생성 평가 지표
Q5.20 모델링 워크플로
Q5.21 오프라인 예측

 

6장 ML 인프라 설계
Q6.1 모델 개발 가속화
Q6.2 모델 학습 가속화
Q6.3 모델 학습 분산
Q6.4 모델 학습 파이프라인 평가
Q6.5 분산 학습 오류
Q6.6 모델 업데이트
Q6.7 모델 최적화
Q6.8 서빙 시스템 구성 요소
Q6.9 서빙 시 문제
Q6.10 피처 수화 개선
Q6.11 지연 시간 개선
Q6.12 많은 요청 처리하기
Q6.13 서빙 시 모델 업데이트
Q6.14 모델 배포와 롤백
Q6.15 서버 모니터링
Q6.16 서빙 시 성능 저하

 

7장 고급 ML 문제
Q7.1 지연된 레이블
Q7.2 레이블 없이 학습하기
Q7.3 가격 모델

 

부록 A 생성 모델: 노이지 채널 모델에서 LLM까지
A.1 기계 번역(MT)
A.2 자동 음성 인식(ASR)
A.3 트랜스포머로의 수렴
A.4 현실의 과제를 위한 미세 조정

 

참고자료
찾아보기

* 아마존과 트위터, AI 스타트업을 거친 베테랑 면접관이자

* ML 엔지니어가 제시하는 성공적인 ML 면접을 위한 노하우
 

ML 면접을 앞둔 지원자라면 어떤 역량을 개발해야 할지, 어떤 주제를 중점으로 학습해야 할지, 답변할 때 무엇을 고려해야 할지 등 고민이 많을 겁니다. 이 책은 ML 분야 취업에 필요한 역량 정리부터 실무 중심의 탄탄한 문제 해결 전략, 최신 기술을 반영한 부록과 참고자료까지 제공합니다.

 

첫째, ML 분야 취업에 꼭 필요한 실무 워크플로 핵심 지식
FAANG을 비롯한 빅테크 기업의 ML 면접에서 자주 묻는 질문 194가지를 담았습니다. 간결한 질문과 키워드 중심의 명쾌한 답변으로 구성되어 있어 면접에 앞서 내용을 정리하는 데 유용합니다. 이해를 돕기 위해 어려운 개념이나 모호한 표현에는 풍부한 역자주를 더했습니다.

 

둘째, 기본부터 심화 문제까지 대비하기 위한 단계별 지침
다섯 가지 면접 세션(ML 기본 지식 - ML 코딩 - ML 시스템 설계 - ML 인프라 설계 - 고급 ML 문제)으로 구성되어 있어 각자 지원하는 포지션과 난이도, 필요에 따라 내용을 찾아 보기 쉽습니다.

 

셋째, 핵심 키워드 중심으로 강력한 답변을 구성하는 전략
질문에 관한 핵심 키워드를 뽑아내고, 여러 가지 접근 방식을 비교하고, 장단점과 트레이드오프를 논하는 등 ML 면접에서 높은 점수를 얻기 위한 답변 구성 전략을 소개합니다.

 

넷째, 실제 시나리오 기반의 실무 중심 문제 해결 방식
ML 수명 주기 전반에 걸친 실용적인 개념과 시나리오를 다루므로 면접을 준비하는 구직자뿐 아니라 숙련된 실무자가 기본기를 확실히 다지는 데 도움이 됩니다.

 

이 책이 필요한 독자

  • ML 관련 직군을 희망하는 취업 준비생
  • ML 분야에서 경쟁력을 높이고 싶은 실무자
     

인사이드 머신러닝 인터뷰 책을 읽게 되었다. 목차는 여러 ML모델들에 대해 인터뷰에서 나올 수 있는 내용들, 추천 시스템, 데이터 이슈, NLP 그리고 ML 시스템 설계등 대부분의 주제들을 망라해서 다루고 있었다.

 

데이터 수집시 발생할 수 있는 문제 중, 서빙 편향, 무작위로 데이터 누락, 레이블 검증, 데이터 정규화, 리샘플링 등의 내용을 다루고 있었다. 다중 클래스 샘플의 데이터 셋을 다운 샘플링 및 가중치 부여를 하는 내용이 나왔다.

 

모델링 알고리즘은 로지스틱 회귀, 그래디언트 부스팅 결정 트리, 심층 신경망을 다루고 있었고 로지스틱 회귀는 시그모이드 함수를 사용해 이벤트의 확률로 변환 후 0, 1같은 이진 결과를 매핑하는 내용이 나왔다. 가능도 함수는 가능도를 최대화하는 로그 손실 함수를 통해 세티값을 최소하는 내용이 나왔다.

 

손실 함수는 잘 알려진 평균 제곱 오차, 평균 제곱 오차, 절대 제곱 오차, 평균 절대 백분율 오차의 내용이 나왔고 손실 함수의 볼록성과 경사값을 통해 손실을 최소화 하는 내용을 다루고 있었다.

 

K-최근접 이웃과 같은 대표 비지도 학습의 파이썬 코드를 다루고 있었고, 의사 결정 트리에 대한 내용을 소개하고 있었다. 또한, NLP 관련해 텍스트를 인코딩, 디코딩, 유사도 점수를 구하는 것에 대한 내용을 다뤘고 NLP에서 유명한 어텐션 메카니즘에 대해서도 다루고 있었다.


머신러닝 관련 인터뷰를 준비하는 분들이 이 책을 읽으시면 전반적인 인터뷰 내용이 정리될 것이란 생각이 들었다.

이 글은 한빛미디어로 부터 책을 증정받아 작성되었습니다.

최근에 한빛미디어 <나는 리뷰어다> 활동으로 제공받아 읽은 『인사이드 머신러닝 인터뷰』라는 책에 대해 소개하고자 합니다.
이 책이 처음 서점에 나왔을 때에도 유심히 보고 있었는데 때마침 이렇게 기회가 되어 읽게되어 너무 좋았습니다.

이 책은 빅테크 기업의 머신러닝 면접에서 실제로 다뤄지는 194가지 질문과 모범 답안을 제시하며, 면접 준비생들에게 실질적인 도움을 주는 가이드북입니다. 특히 저자 펑 샤오는 아마존, 트위터 등에서 천 명 가까이 되는 지원자들을 직접 면접한 경험을 바탕으로 책을 집필했기에 책의 내용이 매우 생생하고 구체적입니다.

『인사이드 머신러닝 인터뷰』는 ML 기본 지식 면접, 코딩 면접, 시스템 설계 면접 등 면접 유형별로 나누어 핵심 개념과 기술을 체계적으로 정리하고 있습니다. 또한 각 장마다 짚고 넘어가야 할 키워드를 요약해주고, 실전에서 활용 가능한 명쾌한 답변 전략까지 제시해줍니다.

책에 등장하는 질문들을 보면 로지스틱 회귀분석의 원리부터 콜드 스타트 문제 해결 방안, 대규모 추천 시스템 아키텍처 설계까지 머신러닝 실무자라면 반드시 알아야 할 개념들로 구성되어 있습니다. 저는 특히 자연어 이해와 추천 시스템을 구축할 때 고려해야 할 사항들을 이 책을 통해 도움을 받았습니다. 자연어 이해 파트에서는 문서 요약, 감성 분석, 토픽 모델링 등 다양한 태스크에 활용되는 피처 엔지니어링 기법과 모델링 노하우를 배울 수 있었습니다. 또한 추천 시스템 챕터에서는 사용자 행동 로그를 기반으로 한 암묵적 피드백의 활용 등 실무에 적용 가능한 인사이트를 얻을 수 있었습니다. 

다만, 면접에 나올만한 내용들을 초점을 맞춰 정리되어 있기 때문에 실무에 그대로 이 내용을 쓰기는 부족합니다.
저는 추천시스템, 자연어처리 파트에서 어떤 부분이 주요 포인트인지 키워드와 중심내용을 파악 후 다른 책이나 인터넷을 통해 내용을 깊게 파악해서 더 쉽게 실무에 도움을 받았습니다.

그리고, 이 책을 끝까지 읽는데 시간이 많이 걸렸습니다. 저는 머신러닝이 주 포지션이 아닌 만큼 책을 읽는데 다소 시간이 걸렸습니다.
이 책은 독자 대상이 머신러닝 기초 지식이 어느 정도 있는 사람들인 만큼, 초심자들에겐 다소 어려울 수 있습니다. 
하지만 머신러닝 학습의 로드맵을 제시해주는 나침반 같은 역할을 해줄 수 있을 것이라 생각합니다.

머신러닝 엔지니어를 꿈꾸는 분들이라면 이 책과 함께 차근차근 실력을 쌓아가시길 추천드립니다. 면접 준비는 물론, 실무에서의 역량 강화에도 큰 도움이 될 것입니다. 

이 리뷰는 한빛미디어 <나는 리뷰어다> 활동으로 책을 제공받아 작성되었습니다

 

https://developside.tistory.com/118

바쁜 하루이긴 하지만 적어도 한달에 한권이상 인공지능 관련 서적을 읽으려고 노력하고 있다. 그렇게 읽다보면 정말 다양한 서적들이 시중에 나와있는 것을 알 수 있다. 정석처럼 이론적인 내용을 쭉 설명해놓은 책도 있고, 혹은 코드나 실습을 위주로 설명하는 책들도 있다. 혹은 최근 인공지능 관련 업계로의 취업을 위해서 Q&A 형식으로 이론적인 내용과 나올 수 있는 예상 답변 등을 나열한 책 유형도 있다. 이번에 읽은 책은 마지막에 언급한 질답형 책이다.

 

인사이드 머신러닝 인터뷰

 

사실 비슷한 유형의 책은 많이 나와있다. 제이펍에서 나온 "데이터 과학자와 데이터 엔지니어를 위한 인터뷰 문답집" 이란 책도 있고, 인공지능 취업은 아니지만 한빛미디어에서 개발자 취업자를 대상으로 출간된 "개발자 기술 면접 노트" 도 어떤 예상 질문에 대한 답변과 그 답변에 대한 이론적인 내용을 설명을 담고 있다. 보통 저자는 다년간의 경험을 쌓은 면접관으로써, 면접에서 통과하는데 어필할 수 있는 팁도 같이 제공되는 편이다.

 이번에 소개할 책도 비슷한 유형을 가지면서 타이틀에 달려있다시피 194개의 문제에 대한 예상 답변을 기본지식, 코딩, 시스템 설계, 인프라 설계, 고급 문제 등의 유형으로 나눠서 설명을 하고 있다. 사실 이 194개의 문제가 커버하는 주제의 범주는 거의 인공지능이 다루는 모든 분야라고 할 수 있기 때문에 모든 내용이 이 책 안에 다 담겨져 있지 않고, 이를 뒷받침할 수 있는 참고 문헌들이 인용되어 나온다.

그래서 어느정도 예상이 될 수도 있겠지만, 이 책을 통해서 어떤 이론적인 배경이나 증명을 배울 수 있다기 보다는 어떤 예상되는 질문에 답변할 수 있을만한 답을 짧은 형태로 제공하고 있기 때문에 책의 목적처럼 면접을 준비하는 사람에게 좋은 책이 될 수 있다. 물론 면접을 준비하는 사람의 태도에 따라 각각 다르겠지만, 앞에서 언급한 것처럼 부가적으로 제공되는 참고 문헌까지 같이 활용한다면 이 책이 추구하는 목표에 달성할 수 있을 것이다. 

다만 이 책을 읽는데 있어서 몇몇 감안해야 할 부분이 있다. 우선 책의 분량 만큼이나 각 문제별로 소개되는 예상 답변의 분량은 생각보다 짧다고 느낄 수 있다. 사실 소위 말하는 빅테크 기업에서 출제하는 기출문제가 들어 있을 것 같다고 하고 책을 폈었는데, 기출 문제라기 보다는 기출 문제가 담고 있는 핵심 문항을 소개하고 이에 대한 답변을 제공하고 있었다. 그래서 조금 디테일한 문제를 찾고자 하는 사람은 조금 실망할 수 있다. 

또한 면접관이 아무래도 NLP쪽 면접을 위주로 책을 작성해서 그런지 문제 유형이나 내용이 NLP 관련 내용과 이를 활용한 시스템 설계에 치중된 경향이 있다. NLP가 아닌 컴퓨터 비전쪽 취업을 준비하는 사람들도 물론 초반부에 소개되는 기본적인 ML 지식에 대한 내용을 읽을 수는 있겠지만, 뒤쪽에 언급되는 ML 코딩이나 고급 ML 기술쪽에서는 의외로 얻어갈 부분이 없을수도 있다. 

그래도 짧기는 하지만 나름 생성 AI 쪽 내용도 부록 형식으로 담으면서 최신 경향을 담고자 노력을 했고, ML 관련 기본 지식부터 해서 시스템 설계/운용까지 다양한 분야에 대한 주제를 요약 형식으로 훑을 수 있다는 점은 책이 목적으로 하는 ML 쪽 인터뷰를 준비하는 사람에게는 "잘만 활용한다면" 정말 유용한 책이라고 할 수 있겠다. 

 

(해당 포스트에서 소개하고 있는 "인사이드 머신러닝 인터뷰" 책은 한빛 미디어로부터 제공받았음을 알려드립니다.)

출처: https://talkingaboutme.tistory.com/entry/Book-Inside-ML-Interview [자신에 대한 고찰:티스토리]

머신 러닝과 관련된 서적은 도처에 편재하지만, 머신 러닝 인터뷰에 대해 안내하는 책은 전무한 실정이다. ML과 관련된 지식과 스킬을 함양하고 다양한 경험을 쌓더라도, 실제 인터뷰에서 합격에 이르는 길은 결코 순탄하지만은 않다. ML 자체의 특수성에서 기인한 문제이기도 하지만 ML 이론과 지식을 인터뷰 현장에서 온전히 드러내기 위해선 좀 더 전략적이고 현실적인 방법이 필요하다. 오늘 소개하는 이 책이 바로 ML 인터뷰를 준비하는 이들에게 최고의 무기가 될 수 있지 않을까 생각한다. 

 

이 책은 ML 면접에 대한 다양한 유형의 평가 방법을 먼저 설명한다. 테크니컬 폰 스크린을 비롯해서 ML 시스템 설계 면접까지 각각의 세부 유형을 구체적으로 다루면서 놓치지 말아야 할 핵심과 중요 평가 고려 항목에 대해 명징하게 안내해 나간다. 이후 ML 기본 지식에 대한 내용을 본격적으로 살펴보게 되는데, 데이터 수집 과정에서부터 피처 엔지니어링, 지도 학습과 비지도 학습을 망라하는 여러 ML 알고리즘과 그와 관련된 주요 사항이 일목요연하게 정리된 내용을 통해 그간 막연하게 알고 있었던 지식이 체계화될 수 있는 기회가 되리라 생각한다. ML 코딩 파트에서는 실제 코드를 작성함에 있어 여러 문제와 관련된 사항에 반드시 필요하거나 필수적으로 챙겨야 하는 상세 요소들에 대해 다루고 있다. 추천 시스템과 응용으로 걸쳐 설명되는 ML 시스템 설계를 통해 다양한 알고리즘을 최적의 상태로 모델링하기 위한 핵심과 스킬에 대해 학습하게 되고, 이어서 ML 인프라 설계에서 모델이 배포되고 적용되며 배포 이후의 모티너링에 이르는 일련의 과정에 대한 실질적인 노하우를 배우게 된다. 

 

오늘 소개한 이 책은 ML 인터뷰 합격에 이르는 과정에 반드시 필요한 핵심과 정수를 온전히 제공하고 있으며, 실제 수많은 면접자를 평가한 저자의 경험에서 농축된 내공이 단연 돋보이는 서적이다. 처음부터 끝나는 지점까지 어느 것 하나 버릴 것 없이 피와 살이 되는 내용으로 구성된 이 도서를 통해 ML 분야의 인터뷰를 준비하는 이들뿐만 아니라, ML의 기본을 다시 다지고 정리하려는 사람들에게도 충분히 도움될 수 있다고 생각한다.끝으로 ML 인터뷰를 준비하는 모든 이들에게 본 서적을 강력하게 추천한다. 

 

P.S 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

한빛미디어에서 출간된 인사이드 머신러닝 인터뷰 책은 펑샤오라는 사람이 지었다. 펑 샤오라는 사람은 15년동안 소셜 미디어, 광고 기술 등 다양한 분야에서 ML 리더십 직책을 맡아 천 명에 가까운 지원자를 면접했다. 현재는 트위터(X)에서 스태프 ML 엔지니어로 근무하면서 추천 알고리즘과 광고 에측 및 랭킹을 위한 ML 시스템을 설계했다. 천 명에 가까운 ML 관련 지원자를 면접할 만큼 면접에 대한 다양한 경험이 쌓였으니, 이 책은 머신러닝 직무 관련 면접을 앞두고 있는 사람들에게 큰 도움이 될 수 있다. 

 

대부분 ML 관련 직무 면접은 신입 / 경력 이렇게 두 가지로 나뉘게 된다. 신입 때 봤던 면접 질문 같은 경우 ML 관련 기초 지식을 기반으로 물어보는 질문들이 굉장히 많았고, 경력 때 경험했던 면접 질문 같은 경우에는 내가 진행했던 프로젝트와 관련하여 심도있는 질문들을 많이 받았었던 기억이 난다. 그래도 어느정도 규모가 있는 빅테크 회사 같은 경우에는 신입이나 경력직 구분 없이 테크니컬 폰 스크린 면접을 시작으로, ML 기본 지식, 코딩 면접 등을 거치게 되며, 경력직 같은 경우에는 ML 시스템 설계 면접 까지 추가로 보게 된다. 

 

그래서 이 책에서는 폰 스크린 단계 면접 부터 시작하여, ML 기본 지식 면접, 코딩 면접, 시스템 설계 면접 까지 신입부터 경력직까지 모든 연차에 맞춰 면접에 대한 가이드를 제시해준다. 경력직인 나도 이 책의 ML 기본 지식을 훑어보다 보면 잊고 있었던 지식이나, 알고 있었던 지식에 살을 덧붙여 지식 업데이트가 되는 듯한 느낌을 받았다. 면접을 앞두고 있는 사람들이라면, 면접 전에 한번 정도 훑어보면 도움될만한 책이며, 면접을 앞두고 있지 않더라도, ML 교양서로 정도로 봐도 될 것 같다는 생각이 들었다. 여러모로 ML과 관련하여 쓸모가 많은 책이였다. 


“한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

개발자 면접 대비를 위한 책은 많았지만 머신러닝에 특화된 책은 없었기 때문에 더욱 반갑게 다가온 도서입니다. 이 책을 통해 머신러닝 기본 개념부터 코딩, 시스템 및 인프라 설계까지 살펴볼 수 있기 때문에 면접 전 정리하기에 아주 유용합니다. 머신러닝 분야의 취준이나 이직을 앞두고 계신 분들에게 추천합니다!

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

올해 꼭 책을 한달에 한권은 읽겠다는 다짐으로 한빛미디어의 서평단 활동을 하게 되면서 읽게 된 3번째 책은 '인사이드 머신러닝 인터뷰'이다. 

 

이 책은 책 제목처럼 ML(Machin Learning) 엔지니어들이 알아야 하는 지식 전반 내용과 구체적인 각각의 개념들을 정리한 해법수학과 같은 느낌의 책이다. 물론, 이 내용들이 머신러닝 엔지니어 인터뷰시 나오는 문제들이기도 할 것이다.

사실 머신러닝 엔지니어로써 인터뷰 보다는 채용매니저로써 주로 일을 해 온 입장에서 , 이 정도의 내용을 알고 이해하고 있거나 경험해 본 엔지니어라면 무조건 뽑을 것이다.  이 책은 인터뷰를 위한 책보다는 머신러닝 전반에 대한 이해와 구체적인 개념 정립을 위해서 책상앞에 꼽아두고, 수시로 찾아보고푼 책이기도 하다.  또한, 초보자보다는 이미 머신러닝을 경험해본 사용자들이 체계를 잡거나 부족한 부분을 보완하기에 최적의 책이라고 생각한다. 또한, 각 과정의 세부 내용들까지 깊이 이해하고자 하는 독자들을 위한 책으로써도 최적이다. 물론, 초보를 위한 기본적인 개념들부터 고려해야 할 사항들까지도 제시하고 있는건 사실이다.

 

무엇보다 머신러닝을 가볍게 접해 본 초보자인 나에게는 결코 쉽지 않았던 책이다. 책 내용이 어렵다기 보다는 제목 그대로 '인사이드'로 기본적인 개념에서 한단계 더 들어가 제대로 설명하는 내용들이 많다. 또한, 내용이 간결하고 압축적이며 체계적이다. 그렇기에 기본 개념을 제대로 가지고 있지 않은 초보자들은 다른 머신러닝 개론서를 보고서 이 책을 보기를 추천한다. 그래서, 초급에서 중급으로 가거나, 중급자로서 체계적인 정리를 하고자 하는 이들에게는 정말 너무 좋은 책이 될거라 감히 단언한다. 

 

각 장마다 우측의 내용처럼 마치 인터뷰 질문을 하듯이 되어 있다.

다만, 한가지 아쉬운 건 초반의 ML지식들에 대한  개념 설명에서는 이미지나 그림을 추가했더라면 초보자들도 좀 더 이 책을 보는데 허들이 줄어들지 않았을까 하는 생각을 해본다. 물론, 책의 중반에서부터는 여러 이미지들과 함께 개념 설명을 보여준다. 다른 한편으로는 사실 각 하나하나가 워낙 깊이 있는 내용들이라서 이 내용들을 깔끔하게 묶었다는데 보다 의미를 둘 수 있을거 같다. 

 

그리고, 마지막 파트에서는 LLM 관련 내용도 추가하여 최신의 트렌드한 기술들도 인터뷰시나 개념을 잡는데 도움이 될 수 있도록 하고 있다. 물론, 상세 내용은 각 파트별로 별도의 책이나 인터넷을 통해서 확인해 볼 필요는 있을 것이다.

 

최근에 생성형AI와 딥러닝/머신러닝 관련 읽은 책중에 가장 집중도가 필요로 했던 책이었다. 보다 AI/머신러닝 전문가가 되고 싶다고 꼭 이 책을 읽어보기를 추천한다.

머신러닝에 대해서 아직 전체적으로 아는 상태는 아니라서 조금은 어렵기도했다.. 그래도 머신러닝 강의에서 특히나 기억에 남은 로지스틱 회귀, 그리고 과적합 문제는 나오니 내용이 약간 떠오르기도 했고 어떻게 설명하면 좋을지 책을 통해 정리해볼 수 있었던 시간이었다. 콜드 스타트 문제는 프로젝트를 하면서 마주했던 경험이었던 만큼 데이터 수집 기법, 모델링 기법 관점에서 살펴볼 수 있었던 것 같다 책을 읽으면서 느낀 것은 각 질문별로 꼬리질문 형식으로도 많이 구성되어있다는 것이었다. 특히나 면접에서는 꼬리질문이 많이 나올 것 같은데 어떻게 나올지 미리 볼 수 있었다. 그리고 알고있던 내용은 한번 더 정리하면서 설명을 보충해볼 수 있는 시간이었다. 머신러닝에 대해 잘 아시는 분들이라면 이 책을 통해 각 질문에 대해서 먼저 답해보고 내용을 보면서 비교해보면 좋을 것 같다.머신러닝에 특화되어있는 만큼 머신러닝 개념관련 면접을 대비하고자 할 때 많은 도움이 될 것 같다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

어떤 문제로부터 출발할 때, 머신러닝에 대한 지식이 많이 없다면 계속 이어서 말하기 어려울 것입니다. 단순히 대답만 외웠다면, 그 원리를 이해하지 못해 대답을 제대로 못할 것이고, 깊게 공부하지 않거나 생각하지 않았더라면 문제를 해결하는 방법을 찾기 어려울 수도 있습니다. 이 책은 그런 분들이 답을 잘 찾아갈 수 있도록 합니다. 또한, 변형된 질문에도 활용할 수 있도록 광범위하게 개념을 설명해주고 있습니다. 

 

 기본 이론서적과 다른것은, 아무래도 면접 대비이다 보니 각 기술들의 기본, 그리고 기술들의 차이점, 어떤때에 어떤걸 쓰는게 좋은지 특징들이 보기 좋게 정리되어있다. 꼭 면접이 아니더라도 ML쪽의 내 지식을 한번 되짚어 보기에도 좋은 것 같다. 

  "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

제목에서 보이다시피 면접대비를 위한 책이지만, 면접을 준비하는 사람 뿐 아니라 머신러닝을 현업으로 하고 있는 모든 분들께도 분명 도움이 되는 내용들이 많습니다. ML 기본 지식, 시스템 설계, 인프라 설계 등 실무를 한다면 한번쯤 겪게 되는 문제들이 예상질문으로 나와있습니다.

ML 분야의 면접은 특히 자료가 많이 없어서 준비할 때 막연했던 느낌이 듭니다. 정보의 불균형이 심해서 여러 커뮤니티에서 질문들을 하며 스스로 정리를 잘 했어야 했는데요. 이 책이 더 일찍 나왔다면 제가 준비할 때 더 수월했겠다는 생각도 들었습니다.

예상질문 194가지의 문제에 대해 저자가 쉽게 정리한 답을 보고 싶으시다면 책에서 확인해보시면 되겠습니다.

막연해보이는 ML 전 범위를 잘 구조화시켜서 독자로 하여금 소화하기 편하게 해주는 책인 것 같습니다. 

저자 펑 샤오는 15년간 머신러닝 시스템 개발의 경험이 있는 머신러닝 책임급 직책으로 천명에 가까운 응시자를 면접했고, 이를 기반으로 이 도서를 저술했습니다. 특히 아마존과 트위터에서 기계학습 엔지니어링 리더로 근무하면서 기술을 리딩하는 업체에서 더욱 중요하게 느낀 기본기에 대한 고민과 지식을 정리를 했다는 것을 이 책을 통해 느낄 수 있었습니다. 이 책은 면접을 준비하는 기계학습 엔지니어를 대상으로 하며, 기업들이 실제로 묻는 질문 또는 실제로 묻고 검증해야 하는 질문 194개와 그에 대한 답변을 제공합니다. 332페이지에 걸친 이 책은 지하철 출퇴근시 한손에 들고 읽기에는 적당한 두께지만 방대한 머신러닝에 대한 이론과 실제를 모두 다루지는 않습니다. 오히려 너무 자세한 수식이나 이론을 깊게 다루지 않으므로써 머신러닝 지식이 있는 이들에게 알고 있는 것을 한번 훑을 수 있고, 지식을 함양하려는 이들에게는 어떠한 포인트에 중점을 두고 학습해야 하는가를 알게 할 수 있습니다. 머신러닝 면접 과정 전반에 대해 상세히 설명하고, 실제 사례를 통해 문제 해결 전략을 제시합니다. 저자는 다양한 산업 분야에서의 경험을 통해 얻은 통찰을 바탕으로, 면접자가 갖추어야 할 지식과 기술을 체계적으로 정리하여 제공합니다.

 

이 책은 머신러닝 면접 과정을 구체적으로 분석하고, 기초적인 머신러닝의 지식과 코딩, 시스템 디자인, 인프라스트럭처 등 주요 면접 영역을 다룹니다. 각 섹션마다 실제로 면접에 나오는(나올 수 밖에 없는) 질문과 그에 대한 모범 답안을 제공하며 면접관이 어떤 사항을 중요하게 여기는지에 대한 깊은 이해를 돕습니다. 또한, 면접 준비를 위한 단계별 가이드와 함께 효과적인 문제 해결 전략을 제시합니다. 머신러닝 업계에서 자주 접할 수 있는 다양한 기술적 문제들에 대해 실질적인 예시와 케이스를 제공하며 설명하고 있습니다.

 

독자는 이 책을 통해 기계학습 면접에 필요한 핵심 지식과 문제 해결 기술을 배울 수 있습니다. 특히, 머신러닝 시스템의 설계와 구현에 필요한 많은 실무 경험을 기반한 지식을 익힐 수 있으며, 복잡한 데이터 문제를 해결하는 방법과 효과적인 커뮤니케이션 기술을 습득할 수 있습니다. 또한 실제 면접 상황에서 면접관의 기대를 충족시키는 정확한 지식의 포인트와 정답, 그리고 답변하는 방법을 자세히 설명함으로써 면접 준비에 실질적인 도움을 제공합니다.

 

이 책은 기계학습과 코딩에 이미 어느 정도 숙련된 독자를 대상으로 하고 있습니다. 따라서, 초보자가 접근하기에는 다소 어려울 수 있습니다. 책에 등장하는 개념과 용어들은 머신러닝과 딥러닝의 기본적인 내용이고, 학습자는 반드시 암기하거나 짚고 넘어가야 하는 내용입니다. 초심자의 경우 이러한 부분이 학습의 포인트가 됨을 참고하여 이 책을 디딤돌로 다른책을 계속 학습된다면 더 좋을것 같습니다. 추후 2판에서 기초적인 내용이 추가된다면 보다 폭넓은 독자층에게 도움이 될 것 같고, 최신 ML 트렌드와 기술 변화를 반영하여 주기적으로 내용을 업데이트하는 것도 필요할 것 같습니다.

 

이 책의 가장 큰 장점은 대기업에서 실제로 사용하는 면접 질문과 그에 대한 체계적이고 심도 있는 답변을 제공한다는 점입니다. 이는 면접 준비뿐만 아니라 실제 업무에서의 문제 해결 능력을 향상시키는 데도 크게 기여할 수 있습니다. 책에서 다루는 실제 사례와 전략은 면접뿐만 아니라 실제 업무에서도 유용하게 활용될 수 있습니다.

 

머신러닝 분야에서의 면접 준비에 있어 매우 구체적이고 실용적인 지침을 제공합니다. 실제 면접에서 자주 나오는 질문들을 다루고 있어, 면접 준비에 있어 매우 큰 도움을 줍니다. 기계학습 분야에 진출하려는 새로운 인재나 경력을 한 단계 업그레이드하려는 경험 많은 전문가 모두에게 유익할 것이며, 머신러닝 업계의 면접 준비뿐만 아니라 직무 수행 능력을 향상시키는 데에도 도움을 줄 수 있는 귀중한 자료입니다. 또한 외계어를 쓰는 머신러닝 엔지니어와 소통하기 위한 좋은 단어장도 될 것입니다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

“한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.”

ML 엔지니어들과 소통이 필요한 MLOps 엔지니어, 그리고 소프트웨어 엔지니어들에게 추천하며 직접 토이 프로젝트를 수행하면서 필요한 용어나 개념들을 기록해나가면서 공부하기 무척 좋은 책입니다.

면접에 대한 질문이 194개 정도 있으므로, 프로젝트를 해보면서 활용했던 개념이나 용어들이 나오면 이 책을 옆에 두고 기록해 나가면서 학습했을 때 효과가 200%를 만들 것이라 생각합니다.

이 책에 나와있는 다수의 질문들은 실제로 제가 면접에서 받은기억이 있네요. 또한 전체적으로 읽어봤을 때 정말정말 중요한 핵심 요소들만 잘 설명해놨습니다. 즉, 굉장히 트렌디한 내용이나 딥하게 설명이 되어있진 않아도 필수적으로 알아야할 개념을 잘 소개했어요. 독자에 따라서는 기본 요약서 정도로 보일 수 있을수도 있어보여요. 다만 앞서 언급했듯 선별된 핵심개념에 대해선 정말 추천하고 공감할 만큼 잘 나와있고 그것을 바탕으로 학습해나가면 괜찮은 효과를 얻을 수 있지 않을까 싶습니다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

 

한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 제공 받아&nbsp;작성된&nbsp;서평입니다.

 

 

매일 수십통씩 오는 이메일을 정리하다가 실수로 수신거부 처리를 해버려서 3월에는 서평단 활동을 하지 못했습니다. 두 달 만에 받아본 책은 바로 '인사이드 머신러닝 인터뷰'입니다. 이번 달에는 AI와 관련된 도서가 선택지에 많이 있지 않아서, 큰 고민을 하지 않고 고를 수 있었습니다. 책에서는 말 그대로 ML 면접을 대비하기 위한 질문과 답변들이 수록되어 있습니다.

 

세부 주제를 제외하고 대주제를 기준으로 목차를 작성하면 다음과 같습니다. 자세한 내용은 한빛미디어에서 확인해주세요.

 

1장 ML 면접에 임하기

2장 ML 기본 지식

3장 ML 코딩

4장 ML 시스템 설계 1 - 추천 시스템

5장 ML 시스템 설계 2 - 응용

6장 ML 인프라 설계

7장 고급 ML 문제

 

책의 내용은 주로 AI 연구자보다는 ML 엔지니어 관련 직무 면접에 초점이 맞춰져 있는데, 그럼에도 전반적으로 ML 프로젝트 프로세스에 대한 내용을 이해하고, 어떤 질문을 받을 수 있을지에 대해 생각해볼 수 있어서 유익했습니다.

 

 

 

 

특히 의미있다고 생각한 부분은, 단순히 질문과 답변의 나열이 아닌, 어떤 상황에서 어떤 질문을 받게 될 것이고, 그 질문에 대한 답을 했을 때 어떤 질문이 또 이어질 수 있는지가 자연스럽게 소개되어 있었습니다. 예를 들어 클러스터링에 대한 개념을 묻고, 이를 평가하기 위해서 사용되는 지표는 무엇인지를 연달아 확인할 수 있었습니다. 한 가지 아쉬운 점은, 다양한 태스크에 여러 평가 지표를 사용할 수 있을 때, 결과로 나온 점수를 동시에 해석하는 방법에 대해서도 다루었다면 했습니다. 그래도 최근 AI 관련 직무, 그 중에서도 특히 ML 엔지니어가 인기가 많은데, 관련 직무 면접을 대비하는데 많은 도움이 될 거라는 생각이 들었습니다.


요즘 챗GPT가 핫 하던데, 이런 인공지능 개발자들은 면접을 어떻게 볼까? 뭐 이런 생각들에 대해서 인공지능 개발자가 아닌 사람이 들여다 볼 수 있는 시간이었다. 머신러닝 시스템 구성에 관한 기본 지식을 알고 대답하려면 어떤 부분들을 짚어야 하는지, 머신러닝의 면접은 어떻게 이뤄지는지. ML의 기본 개념을 제대로 이해하고 있는지? 내가 알지 못했던 머신러닝의 다양한 부분들을 들을 수 있었다는데 뜻깊은거 같다. 뭐가 있는지 알아야지 나중에라도 써먹지 않겠는가.

 

 

책이 300페이지 좀 넘는데 ML 인터뷰 준비 뿐만아니라 ML 커리어 초기의 개발자라면 여러가지 다양한 주제를 폭넓게 다루고 있어서 두고 두고 써먹을 수 있으리라 생각된다. 난 이 분야의 전문가가 아닌데도 이 분야의 깊은 이해가 옅보이는 책이다. 

 

 

 

출처: https://ingorae.tistory.com/1809 [잉고래의 잇다이어리:티스토리]

현재 다양한 산업에서 생성형 AI 활용되고 있으며, 거의 모든 산업게에서 AI/ML 분야 인력을 채용하고 팀이 유지되고 있다. 하지만 생성 AI에 대한 기본 개념인 ML에 대해 제대로 된 이해를 하고 있는 사람은 흔치 않고, 다양한 관련 기술서적도 기본적인 개념을 파악하고 기본기를 다지기에는 어려운 수준이라고 볼 수 있을 것 같다. 이 책은 ML 직무 면접을 준비하는 사람을 비롯해서 ML 업계에서 일하는 다양한 직군의 기본기를 다져주고자 하는 목적으로 쓰여졌다. 이를 위해 중요 주제를 선정하고 내용을 탄탄히 정리할 수 있도록 단계별로 내용을 정리하고 있다. 또한 ML 면접 과정을 따라 가면서 자주 묻는 질문에 대해 이상적인 답변을 구성하고 제시하고 있다. 

이 책은 총 7장으로 구성되어 있다. 1장은 ML 면접에 임하는 단계로서 다양한 유형의 ML 면접을 소개하고, 우수 답변의 필수 요소에 대해 설명한다. 2장에서는 ML 기본지식을 소개하는 장으로서, 데이타셋 수집 단계부터 이 단게에서 발생할 수 있는 문제점, 그리고 고려사항에 대해 설명한다. 또한 질문에서 나올 수 있는 기본적인 지식을 총 29개로 나누어 제시한다. 3장은 ML 코딩에 대한 부분을 설명하고, 4장과 5장에서는 ML 시스템 설계에 대해 소개한다. 6장에서는 ML 인프라 설계에 대해 제시하고 7장에서는 고급 ML 문제를 제공한다. 

각각의 장마다 세부적인 질문형식으로 문제를 제시하고 이에 대한 답변을 설명하는 형식으로 되어 있다. 따라서 실제 면접을 보는 입장에서 면접관이 질문하는 과정처럼 책을 읽어 나갈 수 있으며, 주어진 주제에 대해 전반적으로 고민하고 답변할 수 있는 능력을 키울 수 있는  구성이라고 생각한다. 뒷부분으로 가면 갈수록 제시되는 질문이 어려운 난이도를 가지지만 현재 본인의 수준에 맞추어 책을 읽어보면 좋을 것 같다. 


“한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다”


 

1. 누구든 쓰기 좋은 머신러닝 총정리본

시중에는 다양한 머신러닝 책들이 나와있지만, 과연 어떤 책을 갖고 공부해야 할지 감 잡기 어려우신 분들이 많으셨을 겁니다. 인공지능에 대한 배경지식이 있냐 없냐의 여부에 따라서 선택의 폭이 매우 달라지니까요. 하지만 이 책을 그런 걱정을 한번에 잠재울만한 놀라운 범용성을 갖고 있습니다. 기본적인 머신러닝 지식들을 소개해주는 것을 시작으로 실제 코딩과 설계, 그리고 심화 과정까지 모두 다루고 있기 때문입니다.

그렇기에 초심자든, 개발자든 이 책 한권으로 각자의 Needs를 충족할 수 있으리라고 생각했습니다. 마치 잘 만들어진 백과사전, 교과서를 보는 듯 했달까요? 뒤에도 서술하겠지만, 이런 놀라운 범용성을 갖게 된 배경에는 이 책을 저술한 저자의 칼같은 객관성 있는 문체가 한 몫했습니다. 다소 딱딱할 수도 있는 문체이지만, 이는 최대한 간결한 문장으로 보다 많은 지식들을 분명하게 전달할 수 있게 해주었습니다. 그렇기에 누구든지 부담없이 읽고 공부하기엔 최적화되어 있다고 볼 수 있겠지요.

2. 객관적이고 정돈된 문체

책을 꺼내어 읽으면 가장 처음에 느낀 점은 은 '사람이 썼다는 생각이 들지 않을 정도로 Dry'함이라는 것이죠. 마치 독자들은 매순간 칼같은 시험관 앞에서 자신의 지식을 시험당한다는 인상을 주기 충분할 것입니다. 슥슥 읽으면서 저자가 이 책을 최대한 객관적인 문체로 서술하고자 노력했음을 느꼈습니다. 그래서 처음엔 딱딱하지만 이내 사족없이 공부할 수 있는 여건을 제공해주는 책에 감사함을 느끼게 됩니다.

특히나 독자들이 공부하고 몸담을 인공지능이라는 분야는 이런 느낌에서 결코 벗어나서는 안 된다는 말을 해주는 것 같았습니다. 오로지 모델과 데이터만으로 구성되는 인공지능에겐 주관성이란 영역은 존재해선 안되거든요. 공부하고 연구하는 우리 입장이야, 최선의 모델을 찾기 위해 노력해야 하지만, 적어도 최선의 모델로 접근하기 위해 필요한 모든 데이터들은 편향됨 없이 준비되어야 하는 것처럼 말이죠. 이 책은 감정하나 없는 문장들을 통해 가장 효과적으로 독자들을 가르치고 있었습니다.

3. 메타인지를 기반으로 실무 면접 및 시험을 준비할 수 있는 최고의 책! 

이런 형식을 취하여 독자가 얻을 수 있는 이점은 무엇이 있을까. 가장 좋은 이점은 독자들에게 '메타인지'를 불러오게 만들어준다는 것이겠죠. 끊임없이 저자는 머신러닝 지식과 활용법을 독자에게 물어보며 그들이 잘 알고 있는지 확인시킵니다. 그 과정속에서 독자들은 자신이 머신러닝에 대해 잘 아는 것과 모르는 것을 구분지을 수 있습니다. 강점과 약점의 파악은 곧 자신의 수준을 인지하게끔하여, 막연하고 길게만 느껴지는 실무 면접 준비 기간을 효과적으로 쓸 수 있게끔 해줄 겁니다.

그것을 염두해둔 탓인지 책 곳곳에는 여백이 많습니다. 독자들은 질문에 응답해 여백에 기록하면서 일차적으로 준비해볼 수 있겠고, 그다음 써둔 기록에서 무엇을 보완해야하는지를 생각해보며 후속적으로 준비해볼 수 있습니다. 이런 구성들은 이 책의 가치가 비단 학습에만 초점을 맞춘 것이 아닌, 다방면으로 활용가능한 단권 개념서로도 충분히 가치있을 것이라고 알려주고 있었습니다.

 

개인적으로는 오랜만에 머신러닝 개념들을 보니까, 흐릿한 내용들 사이로 읽어내려가느라 벅찼던 것 같습니다. 저는 머신러닝에 진심으로 뛰어드는 입장은 아닌지라 압축된 내용들에 감탄하기 바빴던 것 같습니다. 진지하게 공부를 임해보고자 하는 이들 누구든지 도움이 될 수 있는 좋은 바이블이 될 수 있으리라 생각합니다.

 

☆ 이 포스팅은 한빛미디어 <나는 리뷰어다> 활동을 위해 책을 제공받아 제작된 서평입니다 ☆
 

이책의 최대강점은 "추천알고리즘 서비스" 와 관련한 IT 기업의 인터뷰를 연습하는데 최적화 되어 있습니다. 저자가 `X`( 구 Twitter) 재직한 개발자로 머신러닝 중 추천관련 내용들이 자세하게 적혀있고, 부록에서는 최신 딥러닝 기술인 `트랜스포머` 까지 다루고 있는만큼 방대한 분야에 대해서 내용들을 훝어보기에 적합했습니다.

한가지 단점은 인터뷰 연습인 만큼 관련 개념들이 생소한 초보자 분들에게는 조금 힘들수 있는 책입니다.

이 책에서 한 이야기 중에 이런 말이있다. 지원한 포지션에 따라 다르지만 일반적으로 면접관은 최신 모델보다는 로지스틱 회귀나 부스팅 트리에 관해 질문할 가능성이 크다 라는 점이다. 매우 공감되는 내용이었다.

ML 직무 인터뷰를 준비한다면 이 책으로 가볍게 준비하는 것을 추천합니다.

안녕하세요, 기술과 함께 살고 읽는 컨티뉴언입니다.

오늘 잠자기 전 들고 온 책은 아주 재밌는 머신러닝책입니다.

정말 재밌냐구요?

저한테는 그렇습니다만...ㅎㅎ

왜 재밌냐면 바로 면접을 도와주기 때문인데요.

머신러닝, 인공지능, 딥러닝 이런 단어만 들어도 어려울 거예요.

예맞아요.

정말 어려워요.

저도 데이터분석가로 데이터직군에 다양한 면접관으로 일하면서 뭐를 질문해야되는지,

면접관으로써 내가 정말 자격이 있는지 항상 고민했어요.

그런 면에서 이 책이 그 고민을 해결해주고 있는데요.

그럼 함께 살펴볼게요.

<인사이드 머신러닝 인터뷰>


컨티뉴언 머신러닝 인사이트

면접, 정말 항상 떨리고 기대되는 순간이죠.

누군가에게는 첫 시작이면서도 마지막이 될 수 있는.

좋은 시작일 맞이하고 싶죠.

그러려면 머신러닝이라는 벽을 통과해야되는 순간이 있는데요.

특히나 요즘처럼 인공지능 인재를 채용하거나,

머신러닝관련 업무를 한 사람을 뽑는 경우가 많아질 때.

이 책은 반드시 도움이 될 거예요.

ML 면접에서 어떤 질문에도 자신 있게 대처하려면 전체 ML 워크플로와 관련 핵심 개념을 명확히 정리해야 한다.

 

저는 데이터 분석가라서 사실 처음에는 관심이 없었어요.

그런데 데이터 분석가 또한 결국에는 넓게 보면 데이터를 다루는 직군입니다.

그리고 더 넓게 보면 머신러닝이라는 개념은 데이터와 무조건 연결되죠.

이 책을 보다보면 다양한 수식이 나오는데요.

겁낼 필요없어요.

왜냐?

중요한 건 수식이 아니라 면접 질문과 그에 따른 답변와 과정이기 때문이죠.

과정을 얼마나 나답게 설명하냐가 중요한거죠.

그냥 교과서처럼 말하는 것도 중요한 방법이긴해요.

하지만 좀 더 나답게, 나의 경험을 섞어서 말할 수 있다면

면접에서 더 나은 점수를 딸 수 있을거예요.

간결한 질문과 키워드 중심의 명쾌한 답변으로 구성되어 있어 면접에 앞서 내용을 정리하는 데 유용합니다.

그런 차원에서 이 책은 단순히 머신러닝만 말하고 있지 않아요.

문제정의부터 코딩, 그리고 어려운 설계까지 다루고 있죠.

머신러닝을 통해서 할 수 있는 것은 점점 더 많아지고 있어요.

어쩌면 외워야 될게 많아진다고 느낄 수도 있는데요.

사실 이 책에 나와있는 정보, 면접질문에 대해서 모두 다 답변할 수 있는 사람은 거의 없어요.

저자도 그건 마찬가지일거예요.

그러면 어떤 것을 먼저해야 되냐?

다섯 가지 면접 세션(ML 기본 지식 - ML 코딩 - ML 시스템 설계 - ML 인프라 설계 - 고급 ML 문제)으로 구성되어 있어 각자 지원하는 포지션과 난이도, 필요에 따라 내용을 찾아 보기 쉽습니다.

 

그건 당연히 회사에 따라 다를거예요.

만약에 면접을 봐야되는 회사가 머신러닝 초입단계다?

그러면 이 책의 첫 챕터를 봐야겠죠.

그런데 머신러닝을 활발하게 쓰고 있다?

그러면 이 책의 후반부를 보셔야 되세요.

그런 것처럼 이 책은 마치 하나의 회사의 과정을 보여주고 있죠.

이 책이 필요한 독자

● ML 관련 직군을 희망하는 취업 준비생

● ML 분야에서 경쟁력을 높이고 싶은 실무자

+ @@@

자 어떠신가요?

면접준비하는데 도움이 되실까요?

단순히 이 책을 통해 면접통과!라고 말하고 싶지만~

어려울 수 있어요.

그럴때는?

역시나 반복하셔야되겠죠.

반복하고 반복하면서 여러분만의 또 다른 질문을 만들고 답하면서

원하는 회사에, 또는 원하는 일을 만들어보시는거예요.

부담갖지 않고 즐겁게 하는거.

그게 이 책에서 추구하는 바와 제가 추구하는 부분입니다.

여러분이 면접뿐만 아니라 긍정적으로 재밌게 하루를 마무리할 수 있기를 바라며.

ML 면접의 복잡한 미로를 헤쳐나가는 데

필요한 전략과 지식으로 가득합니다.

제가 십여 년 전 수많은 면접에서 실패를 경험하며 절실히 원했던 책입니다.


 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

# 머신러닝 분야 면접 준비의 중요성

머신러닝 분야는 최근 몇 년 동안 기술 산업에서 가장 빠르게 성장하는 영역 중 하나로 자리잡았습니다.

이러한 성장은 빅테크 기업뿐만 아니라 다양한 산업 분야에서 머신러닝 전문가에 대한 수요를 급격히 증가시켰습니다.

그 결과, 머신러닝 역량을 갖춘 인재를 선발하는 면접 과정도 점점 더 경쟁적이고 까다로워지고 있습니다.

이런 상황에서 '인사이드 머신러닝 인터뷰'는 지원자들이 면접에서 성공할 수 있도록 필수적인 지식과 전략을 제공하는 매우 중요한 자원이 됩니다.

이 책은 면접자가 머신러닝 워크플로 전반에 걸쳐 필요한 핵심 개념을 명확히 이해하고, 어떤 질문에도 자신 있게 대응할 수 있도록 돕습니다.

머신러닝 기술 면접은 단순히 기술적 지식을 평가하는 것을 넘어, 문제 해결 능력, 시스템 설계 능력, 그리고 실제 업무에 적용할 수 있는 실용적인 접근법까지 평가합니다.

이 책은 이 모든 면을 아우르는 내용을 담고 있어, 
면접을 준비하는 이들에게 꼭 필요한 가이드가 됩니다.

# 저자 펑 샤오의 배경과 ML 분야에서의 깊은 통찰

펑 샤오는 15년 이상의 경력을 가진 머신러닝 전문가로, 
아마존, 팩트셋, 트위터(현재 X), 그리고 자신이 공동 창업한 AI 스타트업 록시에서 주요 역할을 맡았습니다.

그의 경력은 소셜 미디어, 광고 기술, 핀테크, 전자 상거래 등 다양한 산업에 걸쳐 있으며, 그가 머신러닝 시스템을 광범위한 어플리케이션에 적용할 수 있는 능력을 가지고 있음을 의미합니다.

그의 깊은 통찰력과 실전 경험은 이 책에서 제공하는 정보의 깊이와 폭을 더하며, 면접 준비생들이 실제 업계의 요구사항을 이해하는 데 크게 기여합니다.

펑 샤오의 다양한 산업 경험은 책 전반에 걸쳐 반영되어 있습니다. 그는 면접 시 자주 묻는 질문들을 선별하고, 그에 대한 최선의 답변을 구성하는 노하우를 제공함으로써 지원자들이 실제 면접 상황에서 어떻게 대응해야 할지에 대한 명확한 가이드라인을 제시합니다.

각 산업별로 요구하는 머신러닝 기술과 시스템 설계 문제에 대한 심도 깊은 분석을 통해, 지원자들이 다양한 배경을 가진 면접관들 앞에서 자신감을 가질 수 있도록 도와줍니다.

그의 경험은 책에서 다루는 심화 문제와 시나리오 기반의 문제 해결 방식에 생동감을 부여하며, 면접 준비자들이 실제 업무에서 마주칠 수 있는 도전을 이해하고 대비하도록 합니다.

​# 책의 구조 및 주요 내용 소개

"인사이드 머신러닝 인터뷰"는 면접 준비생들이 빅테크 기업의 ML 면접을 체계적으로 준비할 수 있도록 구성된 책입니다.

- ML 면접에 임하기
 면접의 구조와 전반적인 준비 방법을 소개하며, 기술적인 스크린과 기타 면접 과정에 대한 개요를 제공합니다.
- ML 기본 지식
 데이터 수집, 처리, 모델링 알고리즘, 로지스틱 회귀, 하이퍼파라미터 튜닝 등 ML의 핵심 개념을 설명합니다.
- ML 코딩
  실제 코딩 문제를 통해 ML 알고리즘의 구현과 최적화 방법을 다룹니다.
- ML 시스템 설계 - 추천 시스템 / 응용
  대규모 ML 시스템, 특히 추천 시스템과 관련된 설계 문제를 다룹니다.
  특정 ML 응용 분야에 대한 시스템 설계 문제를 다루며, 문서 파싱, 감성 분석 등 다양한 주제를 포함합니다.
- ML 인프라 설계
  모델 개발, 배포, 서빙 등에 필요한 인프라 설계와 관련된 고급 문제를 다룹니다.
- 고급 ML 문제
  복잡한 실세계 문제와 최신 ML 기술에 대한 심층적 논의를 제공합니다.

빅테크 기업 면접에서 자주 묻는 질문 194가지
"인사이드 머신러닝 인터뷰"는 빅테크 기업에서 자주 나오는 194가지 질문을 꼼꼼히 수집하고 분석하여, 각 질문에 대한 효과적인 대응 전략을 제공합니다.

이 질문들은 기본적인 ML 개념부터 복잡한 시스템 설계, 코딩 문제에 이르기까지 다양하며, 각 질문에 대해 예상 답변과 함께 설명이 제공됩니다.

효과적인 면접 준비를 위한 실용적인 팁과 기법
책은 면접 준비에 필요한 다양한 전략과 기법을 제공합니다. 문제의 핵심을 빠르게 파악하는 방법, 효과적인 커뮤니케이션 기술, 시간 관리 전략, 스트레스 관리 방법 등이 포함됩니다.

또한, 실제 면접 시나리오를 가상으로 연습해보는 방법을 통해 면접 당일에 더욱 자신감을 가지고 대응할 수 있도록 돕습니다. 이러한 팁과 기법은 면접 준비생이 면접 과정을 체계적으로 이해하고 효과적으로 대비할 수 있도록 설계되었습니다.

책은 ML 면접의 주요 영역들을 체계적으로 다루고 있습니다. 
ML 기본 지식에서는 데이터의 수집 및 처리 방법, 기본적인 모델링 기술과 로지스틱 회귀의 이해 등을 포함합니다.

ML 코딩 부분에서는 알고리즘의 구현 및 효율성을 평가하는 문제를 중점적으로 다루며, ML 시스템 설계에서는 추천 시스템과 같은 복잡한 시스템의 구조와 필요성을 분석합니다.

면접에서 높은 점수를 얻기 위한 핵심 키워드와 답변 전략
이 책은 면접에서 성공적으로 대응하기 위해 핵심 키워드 중심의 답변을 구성하는 방법을 강조합니다.

각 질문에 대해 키워드를 정리하고, 이를 바탕으로 명확하고 간결한 답변을 구성하는 전략을 제공합니다.

이 방법을 통해 면접관이 찾고 있는 정보를 빠르고 효과적으로 전달하게 하여, 면접자가 기술적인 능력뿐만 아니라 커뮤니케이션 능력도 갖추었다는 인상을 줄 수 있습니다.

실제 시나리오 기반의 실무 중심 문제 해결 방식
저자는 실제 업무 상황에서 발생할 수 있는 문제를 바탕으로 한 시나리오 기반의 문제 해결 방식을 제시합니다.

이를 통해 독자들은 단순히 이론적 지식을 넘어서 실제로 발생할 수 있는 다양한 상황에서 어떻게 문제를 분석하고 해결할 수 있는지를 배울 수 있습니다. 이 접근법을 통해 실제 직무 수행 시에도 큰 도움이 됩니다.

# 이 책을 추천하는 이유

ML 분야 취업 준비생과 실무자에게 왜 필요한가?
이 책은 ML 분야의 취업 준비생 뿐만 아니라 현직에서 일하고 있는 실무자에게도 귀중한 자료입니다.

취업 준비생에게는 면접에서 자주 나오는 질문들과 그에 대한 최적의 대응 방법을 제공함으로써 면접 성공률을 높이는 데 도움을 줍니다.

실무자에게는 현재의 업무에 필요한 최신 지식과 기술을 갱신하고, 직무 내에서의 성장과 발전을 돕는 심화된 내용을 제공합니다. 산업 전반에 걸친 머신러닝의 적용 사례를 통해 보다 넓은 시야를 갖게 합니다.

책을 통해 기대할 수 있는 변화와 발전
이 책을 통해 ML 기술 면접에 필요한 준비를 체계적으로 할 수 있을 뿐만 아니라, 면접 과정에서 요구되는 다양한 역량을 향상시킬 수 있습니다.

책에 제시된 문제 해결 전략과 실용적인 팁은 면접자가 면접 상황에서 더욱 능동적이고 자신감 있게 대응할 수 있도록 돕습니다.

또한, 면접 이후 실제 업무에 임할 때도 이 책에서 배운 기술과 지식을 바탕으로 더 높은 성과를 낼 수 있는 기반을 마련합니다.

# ​책의 전체적인 평가 및 추천
"인사이드 머신러닝 인터뷰: 빅테크에서 자주 묻는 194가지 문제로 ML 면접 완벽 대비하기"는 머신러닝 분야의 면접 준비를 위한 필독서입니다.

저자 펑 샤오는 자신의 풍부한 경험과 깊은 전문 지식을 바탕으로, 면접 준비생들이 자주 마주하는 어려움과 질문들에 대해 심도 깊고 실질적인 조언을 제공합니다.

이 책은 면접 준비뿐만 아니라, 머신러닝의 핵심 개념과 실제 적용 방법에 대한 이해를 돕기에도 충분합니다.

책은 각 면접 주제별로 세분화되어 있어 사용자가 필요한 부분만을 선택적으로 학습할 수 있는 유연성을 제공합니다.

또한, 각 장의 구성이 체계적이고 명료하여, 새로운 개념을 배우거나 기존 지식을 복습하기에 이상적입니다.

질문과 답변 외에도 면접에서 높은 점수를 얻기 위한 전략과 팁을 제공함으로써, 면접 준비 과정을 보다 효과적으로 만들어 줍니다.

이 책은 전통적인 면접 준비서에서 한 단계 더 나아가, 실제 면접 상황에서 필요한 대응 전략뿐만 아니라, 실무에 적용 가능한 실용적 지식과 기술을 강조합니다.

면접 준비를 단순한 질문-답변 연습이 아닌, 실제 업무 수행 능력을 향상시키는 과정으로 바라보게 하는 새로운 접근 방법을 제시합니다.

이를 통해 독자들은 면접 자체뿐만 아니라 실질적인 업무 환경에서도 우수한 성과를 낼 수 있는 기반을 마련할 수 있습니다.

이 책은 ML 분야에서 경력을 시작하거나, 현재의 직업에서 더 나아가고자 하는 모든 사람들에게 적극 추천됩니다.

빅테크 기업뿐만 아니라 다양한 산업에서 필요로 하는 머신러닝 전문가로서의 자질을 갖추기 위한 근본적인 이해와 실무 능력을 강화할 수 있는 훌륭한 자원입니다.

이 책은 단순한 면접 준비서를 넘어서, 머신러닝 분야의 전문가로 성장하고자 하는 이들의 동반자가 될 것입니다.

본 포스팅은 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

빅데이터 시대, 필수 무기로서의 접근..

머신러닝은 인공지능 분야의 핵심 기술로 자리매김하며, 빅데이터 시대를 이끌어가는 핵심 동력으로 진화하고 있다. 이러한 시대적 요구에 발맞춰, 머신러닝 관련 전문가 양성에 대한 관심과 투자가 급증하고 있고 기업들은 인력 확보에 힘을 쓰고 있는 추세이다.

이러한 상황에 발맞추어 이 책은 현장에서의 면밀한 분석과 풍부한 경험을 바탕으로 머신러닝 인터뷰 준비를 위한 실용적인 가이드를 제공한다. 신입/경력 인터뷰를 준비하는 학생이나 구직자가 아니더라도 해당 분야에 대해 전반적인 흐름이나 이론을 탄탄하게 다지고자 하는 시니어 개발자들에게도 많은 도움이 되는 내용이 담겨 있다.

저자인 펑 샤오는 아마존, 트위터 등의 빅테크 기업에서 머신러닝 엔지니어로 근무하며 축적한 노하우와 실무 경험을 바탕으로, 면접에서 자주 묻는 질문들을 194개 선정하고 전체 7개 장으로 나누어 심층적으로 다루고 있다.

1장: ML 면접에 임하기

머신러닝 면접의 단계별 프로세스 및 우수한 답변을 위한 요소를 설명

테크니컬 폰 스크린, 기본 지식 면접, 코딩 면접, 시스템 설계 면접 등 다양한 면접 유형을 소개한다.

면접 준비 팁, 면접관에게 주는 좋은 인상, 흔히 하는 실수

2장: ML 기본 지식

머신러닝 기본 개념, 용어, 알고리즘 등을 체계적으로 구성

데이터 수집, 모델링, 평가 등 머신러닝 프로세스의 각 단계.

선형 회귀, 로지스틱 회귀, 결정 트리, 랜덤 포레스트, SVM, k-평균 등 다양한 알고리즘

손실 함수, 하이퍼파라미터 튜닝, 정규화, 과적합 방지 등의 개념 설명

3장: ML 코딩

머신러닝 코딩 면접에서 자주 등장하는 문제 유형과 해결 방법을 제시

k-평균, k-최근접 이웃, 의사 결정 트리, 선형 회귀 등의 알고리즘을 Python으로 구현

평가 지표, 저수지 샘플링, 확률 문제, 해시 테이블, 그래프 문제

코딩 문제 풀이 팁, 오류 방지, 효율적인 코드 작성 등을 위한 가이드를 제공

4장: ML 시스템 설계 1 - 추천 시스템

추천 시스템의 설계 및 구축 과정을 단계별로 설명

추천 시스템의 목적, 지표, 콘텐츠 유형, 혼합 전략, 운영 매개변수

콜드 스타트 문제, 데이터셋 편향, 서빙 시스템 설계 등 실제 추천 시스템에서 발생하는 문제들

추천 후보 생성 알고리즘, 임베딩 기술, 랭킹 모델, 모델 평가, 서빙 시스템

5장: ML 시스템 설계 2 - 응용

문서 파싱, 감성 분석, 토픽 모델링, 문서 요약, 자연어 이해 등 다양한 NLP 응용 분야

각 응용 분야의 특징, 사용되는 알고리즘, 평가 지표 설명

정보 추출, 분류, 회귀, 토픽 할당, 클러스터링, 텍스트 생성 등 다양한 모델 구축 및 평가 방법

모델링 워크플로우, 오프라인 예측 등 실제 응용 분야에서 사용되는 기술 소개

6장: ML 인프라 설계

모델 개발, 학습, 분산, 평가, 서빙 등 머신러닝 인프라 설계 및 구축 과정

분산 학습 시스템의 설계, 오류 처리, 모델 업데이트, 최적화

서빙 시스템의 구성 요소, 문제 해결, 피처 수화, 지연 시간 개선, 모델 업데이트

서버 모니터링, 성능 저하 해결, 모델 배포 및 롤백 등 실제 서빙 시스템 운영 관련 내용

7장: 고급 ML 문제

지연된 레이블, 레이블 없는 학습, 가격 모델링 등 머신러닝 분야의 최신 연구 동향 소개

단순히 면접 질문과 답변을 제시하는 수준을 넘어, 각 질문에 대한 심층적인 분석과 실무 경험을 바탕으로 한 해설을 제공한다. 저자는 면접관이 질문을 통해 무엇을 평가하고자 하는지, 어떤 답변을 기대하는지 명확하게 설명함으로써, 독자들이 면접 질문의 핵심 의도를 파악하고 적절한 답변 전략을 수립하도록 도와주고 있다.

책에서는 실제 면접에서 발생했던 에피소드를 적극적으로 활용하여, 실제 면접 상황에서 적절하게 대처할 수 있는 실전적인 역량을 키울 수 있을 것이다.

머신러닝 인터뷰에 필요한 기초 지식부터 심화 내용까지 포괄적으로 다루고 있어. 머신러닝의 기본 개념과 알고리즘, 데이터 전처리, 모델 학습 및 평가, 딥러닝, 강화학습 등 머신러닝 관련 주요 분야들을 체계적으로 학습할 수 있도록 구성되어 있다.

각 주제별 핵심 개념과 용어를 명확하게 정의하고, 관련 예제와 그림을 활용하여 설명 한다. 이 책을 보기전에 수많은 머신러닝/딥러닝 관련 책을 보았는데, 이 책 처럼 전반적은 흐름을 집어주는 체계적인 구성을 본적은 없었다.

"인사이드 머신러닝 인터뷰"는 머신러닝 분야 취업을 준비하는 개발자들에게 추천할만한 책이다. 면밀한 분석과 풍부한 경험을 바탕으로 구성된 실용적인 내용, 다양한 난이도의 문제와 해결 전략, 빅테크 기업 면접 질문 분석, 머신러닝 기초부터 심화 내용까지 포괄적인 지식 체계등이 모든 수준의 독자들에게 유용한 내용을 담고 있다.

빅데이터 시대를 살아가는 지금, 머신러닝은 필수적인 기술이기에 "인사이드 머신러닝 인터뷰"를 통해 자신만의 경쟁력을 키워 머신러닝 분야 구직과 더 큰 개발자로서의 역량을 가지리라 생각한다.

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

근래의 머신러닝 업계를 이끄는 양대 산맥은 중국과 미국이라고 합니다.

인사이드 머신러닝 인터뷰의 저자는 중국인으로써 아마존, 트위터 등에서 머신러닝 엔지니어로 근무했습니다.

이 책에서는 빅테크 기업들이 면접에서 자주 묻는 질문들이 저자의 해설과 함께 수록되어있습니다.

물론 면접을 주제로 집필된 도서이지만 단지 인터뷰 만을 위한 책은 아닙니다.

초심자도, 중급자도, 상급자도 이 책을 읽으며 현업에 적용할 수 있는 다양한 인사이트를 얻을 수 있을 것입니다.


 

 

이 책은 면접, 기본지식, 코딩, 시스템 설계, 인프라 설계, 예제 등으로 구성되어있습니다.

다양한 카테고리로 책을 구성하여 독자들이 폭넓은 정보를 얻어갈 수 있도록 하였습니다.

대부분의 취업 준비생들은 면접에서 어떤 질문이 나올지, 내가 그 질문에 답할 수 있을지가 가장 궁금할 것입니다.

학부 시절 혹은 석, 박사 과정에서 배우고 경험한 내용 위주로 면접이 진행되는 것이 가장 이상적이겠지만,

기업 입장에서의 면접은 지원자의 머신러닝에 대한 지식은 물론이고 지원자가 조직과 실무에 잘 적응할 수 있을지, 기본기는 잘 쌓아두었는지, 성장 가능성이 있는지가 가장 궁금합니다.

그러다보니 현업에서만 얻을 수 있는 경험과 인사이트를 요구하기도 합니다.

이 책에서는 아직은 생소한 분야라고도 할 수 있는 머신러닝 분야의 현업 경험을 조금이나마 옅볼 수 있도록 해줍니다.


 

 

첫 번째 파트인 면접 파트에서는 지원자가 면접 전에 알아야 할 정보들을 제공합니다.

이어서 기술 면접을 분야별로 나누어 현업에서 일하는 엔지니어의 입장에서 면접 팁을 제공합니다.

 

두 번째 파트인 기본 지식 파트에서는 기본 지식 면접에서 물어볼 만한 다양한 주제의 기본 지식들을 엔지니어의 시선으로 해설해두었습니다.

그림이 많지는 않지만 주제별로 핵심만 기록되어 있기 때문에 읽기가 어렵지는 않습니다.

 

 

세 번째 파트인 코딩 파트에서는 필수적으로 알아야 할 알고리즘과 관련된 면접 팁들이 수록되어 있습니다.

머신러닝 엔지니어들이 전문적인 개발자는 아니기 때문에 코딩 파트에 대한 궁금증이 많을 것 같은데 간단한 예제와 함께 핵심적인 내용들이 수록되어 있습니다.

 

 

네 번째 파트인 시스템 설계 파트에서는 실무 워크플로 관점에서의 머신러닝 모델링 문제를 분석합니다.

일반적으로 시스템 설계 파트에서는 특정 상황을 가정하고, 문제를 해결할 수 있는 시스템 구축을 설명하는 것을 목표로 합니다.

 

다섯 번째 파트인 인프라 설계 파트는 시니어 지원자를 위한 파트입니다.

이 파트에서는 머신러닝 솔루션을 대규모로 구현하기 위한 인프라 설계에 대한 면접 질문들이 수록되어있습니다.

 

이 책에서는 시스템 설계 파트에 대한 분량이 가장 길기 때문에 주니어 머신러닝 엔지니어들이 가장 많은 것을 얻어갈 수 있을 것 같습니다.


머신러닝 엔지니어를 위한 면접 책을 표방하지만 머신러닝에 관심있는 개발자나 학부생, 머신러닝 개발자와 소통하고 싶은 기획자 혹은 관리자들에게도 아주 유익한 책이라고 생각합니다.

 

ChatGPT 이후로 급물살을 타고 있는 AI업계에 관심이 있다면 이 책을 한 번쯤 정독하는 것을 추천합니다. 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

ML & DL 분야의 면접은 보통 다른 분야에 비해 더욱 미지의 영역이라고 볼 수 있습니다.

 

어떤 질문이 나올 지, 어떤 역량을 개발해야 할지, 나의 전문이 아닌 분야의 대한 질문이 나오면 어떤식으로 답변해야 할 지 등등 막막한 것이 사실입니다.

ML & DL 분야의 면접에서 어떠한 질문에도 잘 대처하기 위한 가장 좋은 방법은 ML & DL 제품의 전체 워크플로와 핵심 개념들을 잘 정리하고 있는 것이 가장 좋은 방법이지만,

그러한 경험이 없거나 특정 분야의 업무만 해본 개발자라면 이 역시 준비하기 힘듭니다.

‘인사이드 머신러닝 인터뷰’는 이런 고민을 가지고 있는 예비 면접자분들에게 좋은 가이드가 될 것입니다.

이 책은 복잡한 ML & DL 개념을 핵심적으로 짚어주며, 기본 지식과 코딩 면접 스킬, 특정 분야의 ML & DL 서비스 구현을 예로 들어서 시스템 및 인프라 설계에 대한 실전 예제를 보여주며 실제 면접 상황에서 다양한 질문에 대해서 어떻게 대답해야 하는지에 대한 가이드를 제시합니다.

면접 준비와 예상 질문들의 목록이 포함되어 있는 것은 물론이고, 실전 머신러닝의 근본적인 요점들이 항목별로 체계적으로 정리되어 있기 때문에 초심자든 중급자든 이 책은 많은 것을 배울 수 있습니다.

초보자들에게는 이론을 확립하고 실무적인 경험을 쌓는 데 도움이 되고, 중급자들에게는 더 깊이 있는 이해를 제공합니다.

저 같은 경우에는 이 책을 옆에 두고 오랫동안 참고할 수 있는 사전처럼 쓰려고 합니다.

왜냐하면 ML & DL 분야의 기술은 빠르게 발전하고 있지만, 그 근본을 이루는 기술은 바뀌지 않을 것이고 이 책은 그 근본에 대한 올바른 이해를 제공해 주기 때문입니다.

기본기를 다지고 개념을 명확하게 정립하는 데 도움이 되기 때문에 단순히 면접 준비뿐만 아니라 전문가로 성장하기 위한 디딤돌이 될 것이라고 생각합니다.

‘인사이드 머신러닝 인터뷰’는 단순히 면접을 통과하는 것을 넘어서, ML & DL 분야에서의 성공적인 경력을 쌓고자 하는 사람들에게 좋은 가이드가 될 것입니다.

이 책을 통해 면접에 성공하는 것은 물론, ML & DL 분야에서의 전문가로서의 길을 열어가게 될 것입니다.

총평

알고리즘 인터뷰 책과 강의는 수도 없이 쏟아지는데, 
머신러닝 엔지니어를 위한 인터뷰는 도대체 언제 나올까? → 나왔다.

혼자 준비하기 답답했던 ML 엔지니어들에게 한 줄기 빛 같은 책이다. 본인도 최근 구직을 하면서 각종 구글링과 지인 네트워크를 통해 겨우겨우 정보를 얻어 준비했었고, 앞으로 머신러닝 엔지니어의 공급은 더 많아질 텐데 언제쯤 나올까 했던 책이 드디어 나왔다! 전형을 마무리한 후에 이 책을 보게 된 건 슬프지만, 인터뷰 준비 뿐만 아니라 옆에 두고 ML essential 다지기에도 너무 괜찮은 책이다.

저자의 이름이 재미있게도(?) 최근에 화제가 되는 샤오미 전기차의 이름과 동일한데, 이 분 굉장히 대단한 분이다. Amazon 등 빅테크에서 ML 엔지니어로 활동했으며 중간에 Roxy Device라는 스타트업을 창업을 하고 개발팀이 트위터(현 X)에 인수되어 ML ranking, modeling, serving 등 전반적인 ML 업무를 맡으며 천 명에 가까운 지원자를 면접봤다고 한다. 얼마나 많은 경험과 노하우가 들어있을지 기대하며 책을 폈었다.

고등학교 때 남들이 수학의 정석을 보는 반면 본인은 수학의 바이블을 굉장히 좋아했는데, 오랜만에 마음에 드는 전공 서적을 찾은 느낌이었다. 몇 번의 ML면접을 경험해본 바 정말 필요한 내용들이 집약적으로 담겨 있다. 해당 전형이 왜 필요한지, 무엇이 중심 내용인지부터 스토리텔링으로 이해와 암기를 자연스럽게 연결시켰다. 이 책은 사기적이다. 정말 솔직히 말하면 포트폴리오와 논문 실적이 어느정도 존재한다는 가정 하에, 이 책을 달달 외운다면 왠만한 IT기업은 다 뚫지 않을까 싶다. 개인적으로 요즘은 AI 인재 포화상태라고 생각하며 인터뷰도 기본 3-4번 보고 신중하게 뽑는 추세여서 면접 기준이 점점 더 높아지고 있는데, 주변의 ML 엔지니어 구직자에게 이 책을 강력 추천하고 싶다! 

너무 찬사를 남발했는데 요즘 한국 사회 한정으로 육각형을 갖춘 이상형을 다들 원하고 찾지만 실제로는 없듯이 아쉬운 점이 있다면, 일반적인 ML 엔지니어를 대상으로 하고 있기 때문에 세부 분야인 NLP, CV, Multi-Modal 등에 대해서는 깊게 다루고 있지 않다. 최근에는 단순 ML 엔지니어 외에도 특정 분야의 전문가를 영입하기 위해 NLP 중에서도 LLM 전문가, Multilingual 전문가, Prompting 전문가 등 JD를 꽤나 구체적으로 적어서 뽑는 추세인데 분량상 이 부분까지 커버하기는 버거운 것 같다. (개인적으로 Part.2가 나왔으면 하는 바램도 있다.) 또한  비교적 최근에 출간한 도서라 LLM까지 다루고 있지만, ChatGPT의 RLHF, instruction fine-tuning까지만 담겨 있는 것도 참고 바란다.

 

한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 제공 받아 작성된 서평입니다.

출처: https://sysout.tistory.com/104 [Emily's Tistory:티스토리]

어떤 사람이 갖고 있는 지식은 '내가 알고 있는 것', '내가 모른다는 사실을 아는 것', '내가 모른다는 사실조차 모르는 것'으로 분류할 수 있는데, 그 중 가장 큰 비중은 그 존재조차 모르는 '내가 모른다는 사실조차 모르는 것'이다. 이 책은 읽으면서 이런 감정을 느꼈다.

 

책에서 다루는 주제가 굉장히 방대하기도 하지만, 이 책이 없었다면 ML 면접은 고사하고, 지금 내가 머신러닝 공부를 제대로 하고 있는가 의문이 들 정도였다.

다행이라면, 난 이 책을 모두 읽었고 무엇이 부족하며 어떻게 공부해야하는지 어느정도 갈피를 잡았다는 것이다.

 

책의 전체적인 구성은 ML 면접 과정을 질문과 답변 형식으로 진행하고 있지만, 저 처럼 앞으로 ML엔지니어를 꿈꾼다면 아주 유용한 학습 가이드로 활용할 수 있을 것이다.

따라서, ML 엔지니어를 목표로 하는 누구든지 최대한 빠른 시간에 읽어 보길 추천한다. 책 내용 모두를 이해하지 못해도 앞으로 어떻게 해야하는지와 관련한 충분한 인사이트를 얻게 될 것이다. 적어도 나의 강점과 보완해야 할 분야는 확실히 알 수 있다.

 

책의 구성은 빅테크(유튜브, 링크드인, 텐센트, 스포티파이, 스냅챗, 알리바바, 하웨이, 홈디포, 마이크로소프트, 구글, 아마존, 페이스북 ...)에서 자주 묻는 194가지 문제를 전체 7개 장으로 설명하는데,

1장 "ML 면접에 임하기"에서는 ML 면접 과정과 평가 항목에 관해 알아 보고,

2장 "ML 기본 지식"은 ML 엔지니어링을 포함하여 ML 교과서에 나오는 이론 위주로 설명한다.

3장 "ML 코딩"에서는 코딩 면접 관점에서 대처하는 방법과 python으로 기본 알고리즘(k-평균, 의사 결정 트리, 선형 회귀, ..., 문자열 문제)의 작성법을 알려주고,

4장 "ML 시스템 설계1 - 추천 시스템"은 면접에서 가장 비중이 높은, 즉 현업에서 가장 많이 사용하는 추천 시스템을 대상으로 데이터셋 선정, 서빙, 편향, 랭킹 모델, 평가 방법 및 고려해야 될 사항에 관해 설명한다.

5장 "ML 시스템 설계2 - 응용"에서는 자연어 처리와 관련하여 전처리, 감성 분석, 토픽 추출, 문서 요약, 피처 엔지니어링, 분류, 회귀, 평가 방법 및 고려해야 될 사항에 관해 알려주고,

6장 "ML 인프라 설계"은 서빙 관점에서 모델 개발 및 학습 가속화와 오류시 처리 방법, 모델 업데이트, 레이턴시 감소방안, 롤백, 모니터링에 관해 알아보고

7장 "고급 ML 문제"에서는 지연된 레이블이나 레이블 없이 학습하는 방안, 가격 모델의 최적화 방안에 관해 설명한다.

끝으로, 부록 A "생성모델: 노이지 채널 모델에서 LLM까지"은 생성 모델을 활용한 기계 번역, 음성 인식, 트랜스포머, 파인튜닝까지 알아보고, 참고자료로 마무리 한다.

 

수식으로 부담을 주는 책은 아니다. 아키텍처는 중간중간 그림으로 알기 쉽게 설명하고 있으며, 질문의 순서가 학습, 알고리즘, 아키텍처, 평가 지표, 서빙등 ML 엔지니어링 파이프라인순으로 되어 있어서 흐름을 따라가지에도 좋다.

 

책은 디자인은 녹색 계열로 부족한 부분이 없었으며, 역자분도 역주로 세심하게 알려주어, 책을 이해하는데 어려움은 없었다.

 

책의 난이도와 다루는 분야는 개인적으로 머신 러닝에서 역대급이 아닐까 생각한다.

초기 선형 회귀 모델부터 k-최근접 이웃, 의사 결정 트리, 랜덤 포레스트, 부스팅, 신경망(DNN, CNN, RNN), 그래프, 강화학습, 비지도 학습, 트랜스포머, LLM을 총망라하고 있으며, ML 엔지니어링 부분의 데이터 선별, 전처리, 피처 엔지니어링, 차원 감소, 서빙, 평가, 모니터링, 오류 대처 방안까지 다룬다.

그럼에도 ML 엔지니어가 되기 위해서는 꼭 필요한 내용이라고 생각하기 때문에, 그저 저자의 해박한 지식에 존경을 표하고 싶다.

다만, 책의 분량으로 모든 내용을 상세히 설명할 수 없음을 이해할 수 있을 것이다. 책에서 무엇을 공부하면 되는지 알려주는 것만으로도 개인적으로 엄청한 이득이라고 생각한다.

 

ML 면접과 관련해서도 책 중간중간 많은 팁을 전달하지만, 특히 빅테크에서 ML 모델을 활용하는 방법과 최신 기술 및 참고자료의 관련 논문은 앞으로 ML 분야를 배우는데 있어 좋은 길잡이가 될 것이다.

 

그렇기 때문에 저를 포함하여 지식이 부족해도 이 책을 읽어야하는 이유이다. 내가 모른다는 사실조차 몰라서 되겠는가?



"YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다"

 

#인사이드머신러닝인터뷰 #머신러닝인터뷰 #머신러닝 #펑샤오 #정원창 #한빛미디어

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 상품명 :
인사이드 머신러닝 인터뷰
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
인사이드 머신러닝 인터뷰
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
인사이드 머신러닝 인터뷰
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실

최근 본 상품1