實戰機器學習|使用Spark(電子書)

· 碁峰資訊股份有限公司
ଇବୁକ୍
584
ପୃଷ୍ଠାଗୁଡ଼ିକ

ଏହି ଇବୁକ୍ ବିଷୟରେ

學習熱門的機器學習演算法

本書介紹熱門的機器學習演算法及其實作方式。你將會了解如何在Spark ML這套開發框架之內,實作各種機器學習概念。首先,我們會帶你在單一節點與多重節點的運算叢集上,完成Spark的安裝工作;接著,說明如何執行以Scala和Python語言撰寫的Spark ML程式;然後以幾套資料集為範例,深入探索分群、分類與迴歸;最後,利用Spark ML來處理文字資料。


打造可以應用於工作中的機器學習程式

弄懂概念之後,便可運用來實作演算法,可能是從頭開始,或是將既有的系統轉移到這個新平台,像是從Mahout或Scikit轉移到Spark ML。當你讀完本書之時,應該能夠善加運用Spark,打造可以應用於工作中的機器學習程式。


本書將帶您:

.實際動手嘗試最新版的Spark ML

.以Scala與Python語言撰寫Spark程式

.在本機以及Amazon ECS雲端平台上,安裝並設置Spark開發環境

.取用公開的機器學習資料集,使用Spark進行資料的載入、處理、清理與轉換等動作

.處理巨量的文字資料,包括特徵萃取,並使用文字資料作為輸入餵給機器學習模型

.撰寫Spark函式,評估機器學習模型的表現能力


#碁峰資訊 GOTOP Information Inc.

ଲେଖକଙ୍କ ବିଷୟରେ

 Rajdeep Dua

曾服務於Google的大數據工具推廣團隊,如BigQuery;曾在VMware公司的開發人員技術傳播小組工作,致力於大數據平台Greenplum,也與Spark移植團隊緊密合作,加入功能集合,把Spark移植到VMware的公開雲和私有雲平台。


Manpreet Singh Ghotra

目前任職Salesforce,致力於以Apache Spark來開發一套機器學習平台;使用Apache Spark與機器學習技術,打造情緒分析器。曾任職於世界最大線上零售商之一的機器學習部門,使用Apache Mahout研究運送時間的計算,以及R推薦系統。


Nick Pentreath

擁有財務金融、機器學習、軟體開發的背景,曾任職於Goldman Sachs企業,線上廣告刊登目標新創公司的研究科學家、倫敦Cognitive Match有限公司、並且在非洲最大的社群網路Mxit,領導資料科學與分析團隊。

ଏହି ଇବୁକ୍‍କୁ ମୂଲ୍ୟାଙ୍କନ କରନ୍ତୁ

ଆପଣ କଣ ଭାବୁଛନ୍ତି ତାହା ଆମକୁ ଜଣାନ୍ତୁ।

ପଢ଼ିବା ପାଇଁ ତଥ୍ୟ

ସ୍ମାର୍ଟଫୋନ ଓ ଟାବଲେଟ
Google Play Books ଆପ୍କୁ, AndroidiPad/iPhone ପାଇଁ ଇନଷ୍ଟଲ୍ କରନ୍ତୁ। ଏହା ସ୍ଵଚାଳିତ ଭାବେ ଆପଣଙ୍କ ଆକାଉଣ୍ଟରେ ସିଙ୍କ ହୋ‍ଇଯିବ ଏବଂ ଆପଣ ଯେଉଁଠି ଥାଆନ୍ତୁ ନା କାହିଁକି ଆନଲାଇନ୍ କିମ୍ବା ଅଫଲାଇନ୍‍ରେ ପଢ଼ିବା ପାଇଁ ଅନୁମତି ଦେବ।
ଲାପଟପ ଓ କମ୍ପ୍ୟୁଟର
ନିଜର କମ୍ପ୍ୟୁଟର୍‍ରେ ଥିବା ୱେବ୍ ବ୍ରାଉଜର୍‍କୁ ବ୍ୟବହାର କରି Google Playରୁ କିଣିଥିବା ଅଡିଓବୁକ୍‍କୁ ଆପଣ ଶୁଣିପାରିବେ।
ଇ-ରିଡର୍ ଓ ଅନ୍ୟ ଡିଭାଇସ୍‍ଗୁଡ଼ିକ
Kobo eReaders ପରି e-ink ଡିଭାଇସଗୁଡ଼ିକରେ ପଢ଼ିବା ପାଇଁ, ଆପଣଙ୍କୁ ଏକ ଫାଇଲ ଡାଉନଲୋଡ କରି ଏହାକୁ ଆପଣଙ୍କ ଡିଭାଇସକୁ ଟ୍ରାନ୍ସଫର କରିବାକୁ ହେବ। ସମର୍ଥିତ eReadersକୁ ଫାଇଲଗୁଡ଼ିକ ଟ୍ରାନ୍ସଫର କରିବା ପାଇଁ ସହାୟତା କେନ୍ଦ୍ରରେ ଥିବା ସବିଶେଷ ନିର୍ଦ୍ଦେଶାବଳୀକୁ ଅନୁସରଣ କରନ୍ତୁ।