처음 배우는 머신러닝: 기초부터 모델링, 실전 예제, 문제 해결까지

· 한빛미디어
4.0
리뷰 1개
eBook
376
페이지

eBook 정보

 머신러닝 기초 이론, 실전 예제, 문제 해결까지 한번에

이 책은 구글과 라쿠텐 머신러닝 개발자가 초보자 눈높이에서 머신러닝의 핵심 이론과 실용적인 예제를 제시합니다. 머신러닝 입문자가 이론을 바탕으로 강력한 성능을 내는 머신러닝 시스템을 구현하고 사용할 수 있도록 하는 것이 이 책의 목표입니다.

1부에서는 ‘머신러닝 기초 지식’, 2부에서는 ‘머신러닝 주요 모델’, 3부에서는 ‘머신러닝 시스템 구현’을 알려줍니다. 이론과 실무 예제와 해결 방법까지 모두 담고 있어 입문자뿐 아니라 이미 머신러닝을 현업에서 다루면서 체계적으로 실력을 다잡고자 하는 중고수에게도 최고의 선택이 될 겁니다.


★ 이 책에서 다루는 내용

이 책은 머신러닝 입문자가 알아야 하는 머신러닝의 전반적인 내용을 다룹니다. 여러분은 머신러닝이 왜 쓸모 있고 어떤 모델과 문제가 있는지, 실무에서 어떻게 사용하는지, 머신러닝의 다양한 문제를 어떻게 해결할 수 있는지, 프로그램 코드를 어떻게 만드는지 알게 될 겁니다.

 

[1부 머신러닝 기초 지식]

머신러닝과 딥러닝이 무엇이고 어떤 분류와 어떤 개념이 있는지 알아봅니다. 1부의 기본 개념은 3부의 실습에서 유용하게 사용되므로 정확히 알고 가는 것이 좋습니다.

 

-1장 머신러닝 시작하기

머신러닝의 큰 그림을 이해하는 데 도움이 되는 내용을 소개합니다. 머신러닝과 딥러닝이 무엇인지, AI와 다른 관련 분야들과는 어떠한 관계를 갖고 있으며 어떻게 분류하는지 설명합니다.

 

- 2장 머신러닝의 주요 개념

머신러닝의 주요 개념을 설명합니다. 이론적인 부분을 최대한 쉽고 실용적으로 설명했습니다. 이 장을 읽고 나면 머신러닝을 도입했을 때 문제를 어떻게 바라보고 어떻게 표현하며 어떻게 해결 방법을 찾는지, 그리고 예측에 어떻게 사용하는지에 대해 알 수 있습니다. 이들 개념은 성능에 커다란 영향을 끼치므로 어렵더라도 읽어보기 바랍니다.

 

[2부 머신러닝 주요 모델]

머신러닝 주요 모델의 이론과 개념을 실제 적용 사례와 함께 설명합니다. 회귀, 군집화 등 머신러닝의 모델에 대해 어느 정도 알고 있지만 바탕이 되는 이론이나 적용할 수 있는 문제가 무엇인지에 대해 구체적으로 알고 싶으면 2부를 꼭 읽어보세요. 특히 8장은 실제로 이론을 적용했을 때 발생하는 다양한 문제를 해결하는 방법을 소개합니다.

 

- 3장 데이터와 문제

문제의 종류와 데이터에 대해 이해해야 머신러닝을 제대로 수행할 수 있습니다. 데이터와 문제의 종류를 소개하여 머신러닝으로 해결할 수 있는 문제를 이해하는 데 도움을 줍니다.

 

- 4장 구매 이력 데이터를 이용한 사용자 그룹 만들기

수치 항목으로 구성된 구매 이력 데이터로 사용자 그룹을 만드는 문제를 다룹니다. 수치 데이터를 이용하는 대표적인 모델인 회귀와 군집화를 좀 더 자세히 알아봅니다.

 

- 5장 문서 분석 시스템 만들기

문서를 분석하는 다양한 방법에 대해 설명합니다. 문서를 주어진 카테고리에 맞게 분류하는 방법, 숨겨진 토픽을 찾는 방법, 문법을 분석하는 방법, 문서에서 고유명사를 추출하는 방법 등 이론적인 기반을 소개합니다. 또한 최신 유행하는 임베딩 학습으로 문서를 분석하는 방법도 소개합니다.

 

- 6장 영화 추천 시스템 만들기

넷플릭스, 유튜브 등의 서비스는 사용자가 좋아할 만한 영상을 어떻게 찾아낼까요? 추천 시스템의 기본 이론에 대해 알아봅니다.

 

- 7장 이미지 인식 시스템 만들기

이미지의 내용을 어떻게 인식하는지에 대해 설명합니다. 비슷한 사진 찾기, 이미지에 들어 있는 주요 물체를 찾는 인식 기법에 대해 설명합니다. 또한 최신 기법인 신경망을 이용한 이미지 분류에 대해서도 살펴봅니다.

 

- 8장 머신러닝의 다양한 문제점 해결하기

머신러닝을 최초로 구현했을 때부터 바로 좋은 성능을 보인다면 정말 운이 좋은 겁니다. 같은 방법을 사용하더라도 여러 가지 상황에 따라 좋은 성능이 나오지 않을 수 있습니다. 대부분의 경우에는 몇 가지 문제만 해결해도 엄청난 성능 향상을 얻을 수 있습니다. 모델의 다양한 문제점을 해결하는 방법, 까다로운 데이터를 처리하는 방법, 속도 향상을 위한 방법 등을 알아

봅니다.

 

[3부 머신러닝 시스템 구현]

3부에서 설명한 이론을 실제로 구현하는 방법과 라이브러리를 이용하는 방법을 소개합니다. 모델을 실제로 적용하는 방법을 더 빨리 알고 싶다면 2부보다 3부를 먼저 읽어도 됩니다.

 

- 9장 머신러닝 소프트웨어 소개

머신러닝 태스크에 사용되는 프로그래밍 언어와 각 언어에서 사용하는 대표적인 머신러닝 라이브러리 및 딥러닝 프레임워크를 소개합니다. 이 책에서 주로 사용할 라이브러리는 사이킷런과 텐서플로입니다. 이 두 라이브러리의 기본적인 사용법에 대해서도 알아봅니다.

 

- 10장 구매 이력 데이터를 이용한 사용자 그룹 만들기 - 실전

4장에서 소개한 ‘구매 이력 데이터를 이용한 사용자 그룹 만들기’를 실제로 구현해봅니다. 데이터와 프로그래밍 코드를 함께 살펴보면서 다양한 군집화 구현에 대해 살펴봅니다.

 

- 11장 문서 분석 시스템 만들기 - 실전

5장에서 살펴본 다양한 ‘문서 분석 시스템’을 구현해봅니다. 스팸문자 분류기와 문서 내용을 간추리는 데 사용되는 토픽을 찾는 방법, 한국어 처리와 임베딩 학습을 통한 문서 분석 방법을 알아봅니다.

 

- 12장 영화 추천 시스템 만들기 - 실전

6장에서 설명한 ‘영화 추천 시스템’을 구현해봅니다. 실제 데이터와 프로그래밍 코드를 살펴보면서 협업 필터링 구현 방법에 대해 소개합니다.

 

- 13장 이미지 인식 시스템 만들기 - 실전

7장에서 살펴본 이미지 관련 기술을 이용해 ‘이미지 인식 시스템’을 만듭니다. 기본적인 이미지 데이터를 다루는 방법과 얼굴 사진 분류 및 딥러닝을 이용한 손글씨 분류를 구현해봅니다.

평가 및 리뷰

4.0
리뷰 1개
young jae kim
2021년 9월 12일
.ㅇ !ㄴ .
이 리뷰가 유용했나요?

저자 정보

 저자_김승연

막연히 인간이 무엇인지 데이터를 통해 이해하고 싶다며 컴퓨터공학과에 들어간 이후 머신러닝과 소프트웨어 개발의 길을 걷고 있다. 서울대학교에서 컴퓨터공학부를 마치고 조지아 공과대학에서 효율적인 문서의 표현형 학습에 대한 머신러닝을 연구하여 컴퓨터 과학 석사와 박사 학위를 취득했다. 현재 구글 리서치에 소속되어 모바일 환경에서의 머신러닝을 주제로 연구 개발하고 있다.


저자_정용주

서울대학교에서 컴퓨터공학과 고고미술사학을 전공하면서 발굴 데이터의 전산 분석 강좌를 통해 머신러닝의 가능성을 체험한 후 도쿄대학에서 머신러닝을 이용한 웹 스팸 검출에 관한 연구로 정보이공학 석사와 박사 학위를 취득했다. 그 후 일본 전자상거래기업 라쿠텐에서 데이터 분석 및 부정사용 검출에 종사했다. 현재는 스탠퍼드에서 1년의 방문연구원 생활 후 라쿠텐 미국 지사에서 데이터 분석을 담당하고 있다.

이 eBook 평가

의견을 알려주세요.

읽기 정보

스마트폰 및 태블릿
AndroidiPad/iPhoneGoogle Play 북 앱을 설치하세요. 계정과 자동으로 동기화되어 어디서나 온라인 또는 오프라인으로 책을 읽을 수 있습니다.
노트북 및 컴퓨터
컴퓨터의 웹브라우저를 사용하여 Google Play에서 구매한 오디오북을 들을 수 있습니다.
eReader 및 기타 기기
Kobo eReader 등의 eBook 리더기에서 읽으려면 파일을 다운로드하여 기기로 전송해야 합니다. 지원되는 eBook 리더기로 파일을 전송하려면 고객센터에서 자세한 안내를 따르세요.