實戰機器學習|使用Spark(電子書)

· 碁峰資訊股份有限公司
Ebook
584
Pages

About this ebook

學習熱門的機器學習演算法

本書介紹熱門的機器學習演算法及其實作方式。你將會了解如何在Spark ML這套開發框架之內,實作各種機器學習概念。首先,我們會帶你在單一節點與多重節點的運算叢集上,完成Spark的安裝工作;接著,說明如何執行以Scala和Python語言撰寫的Spark ML程式;然後以幾套資料集為範例,深入探索分群、分類與迴歸;最後,利用Spark ML來處理文字資料。


打造可以應用於工作中的機器學習程式

弄懂概念之後,便可運用來實作演算法,可能是從頭開始,或是將既有的系統轉移到這個新平台,像是從Mahout或Scikit轉移到Spark ML。當你讀完本書之時,應該能夠善加運用Spark,打造可以應用於工作中的機器學習程式。


本書將帶您:

.實際動手嘗試最新版的Spark ML

.以Scala與Python語言撰寫Spark程式

.在本機以及Amazon ECS雲端平台上,安裝並設置Spark開發環境

.取用公開的機器學習資料集,使用Spark進行資料的載入、處理、清理與轉換等動作

.處理巨量的文字資料,包括特徵萃取,並使用文字資料作為輸入餵給機器學習模型

.撰寫Spark函式,評估機器學習模型的表現能力


#碁峰資訊 GOTOP Information Inc.

About the author

 Rajdeep Dua

曾服務於Google的大數據工具推廣團隊,如BigQuery;曾在VMware公司的開發人員技術傳播小組工作,致力於大數據平台Greenplum,也與Spark移植團隊緊密合作,加入功能集合,把Spark移植到VMware的公開雲和私有雲平台。


Manpreet Singh Ghotra

目前任職Salesforce,致力於以Apache Spark來開發一套機器學習平台;使用Apache Spark與機器學習技術,打造情緒分析器。曾任職於世界最大線上零售商之一的機器學習部門,使用Apache Mahout研究運送時間的計算,以及R推薦系統。


Nick Pentreath

擁有財務金融、機器學習、軟體開發的背景,曾任職於Goldman Sachs企業,線上廣告刊登目標新創公司的研究科學家、倫敦Cognitive Match有限公司、並且在非洲最大的社群網路Mxit,領導資料科學與分析團隊。

Rate this ebook

Tell us what you think.

Reading information

Smartphones and tablets
Install the Google Play Books app for Android and iPad/iPhone. It syncs automatically with your account and allows you to read online or offline wherever you are.
Laptops and computers
You can listen to audiobooks purchased on Google Play using your computer's web browser.
eReaders and other devices
To read on e-ink devices like Kobo eReaders, you'll need to download a file and transfer it to your device. Follow the detailed Help Center instructions to transfer the files to supported eReaders.