本書有DRM加密保護,需使用HyRead閱讀軟體開啟

內容簡介
學習熱門的機器學習演算法
 
本書介紹熱門的機器學習演算法及其實作方式。你將會了解如何在Spark ML這套開發框架之內,實作各種機器學習概念。首先,我們會帶你在單一節點與多重節點的運算叢集上,完成Spark的安裝工作;接著,說明如何執行以Scala和Python語言撰寫的Spark ML程式;然後以幾套資料集為範例,深入探索分群、分類與迴歸;最後,利用Spark ML來處理文字資料。
 

打造可以應用於工作中的機器學習程式
 
弄懂概念之後,便可運用來實作演算法,可能是從頭開始,或是將既有的系統轉移到這個新平台,像是從Mahout或Scikit轉移到Spark ML。當你讀完本書之時,應該能夠善加運用Spark,打造可以應用於工作中的機器學習程式。
 
本書將帶您
.實際動手嘗試最新版的Spark ML
.以Scala與Python語言撰寫Spark程式
.在本機以及Amazon ECS雲端平台上,安裝並設置Spark開發環境
.取用公開的機器學習資料集,使用Spark進行資料的載入、處理、清理與轉換等動作
.處理巨量的文字資料,包括特徵萃取,並使用文字資料作為輸入餵給機器學習模型
.撰寫Spark函式,評估機器學習模型的表現能力


作者簡介
 
Rajdeep Dua
 
曾服務於Google的大數據工具推廣團隊,如BigQuery;曾在VMware公司的開發人員技術傳播小組工作,致力於大數據平台Greenplum,也與Spark移植團隊緊密合作,加入功能集合,把Spark移植到VMware的公開雲和私有雲平台。

 
Manpreet Singh Ghotra
 
目前任職Salesforce,致力於以Apache Spark來開發一套機器學習平台;使用Apache Spark與機器學習技術,打造情緒分析器。曾任職於世界最大線上零售商之一的機器學習部門,使用Apache Mahout研究運送時間的計算,以及R推薦系統。
 
Nick Pentreath
 
擁有財務金融、機器學習、軟體開發的背景,曾任職於Goldman Sachs企業,線上廣告刊登目標新創公司的研究科學家、倫敦Cognitive Match有限公司、並且在非洲最大的社群網路Mxit,領導資料科學與分析團隊。


  • CHAPTER 01 與 Spark 一起奔跑(第1 - 1頁)
    • 在本地端安裝並設定 Spark(第1 - 3頁)
    • Spark 叢集(第1 - 5頁)
    • Spark 程式設計模型(第1 - 6頁)
    • SchemaRDD(第1 - 19頁)
    • Spark 資料框(第1 - 20頁)
    • 邁出第一步撰寫 Spark 程式:使用 Scala 語言(第1 - 21頁)
    • 邁出第一步撰寫 Spark 程式:使用 Java 語言(第1 - 25頁)
    • 邁出第一步撰寫 Spark 程式:使用 Python 語言(第1 - 29頁)
    • 邁出第一步撰寫 Spark 程式:使用 R 語言(第1 - 32頁)
    • 在 Amazon EC2 上執行 Spark(第1 - 35頁)
    • 設定 Amazon Elastic MapReduce 並執行 Spark(第1 - 43頁)
    • Spark 的使用者介面(第1 - 47頁)
    • Spark 支援的機器學習演算法(第1 - 49頁)
    • 與其他程式庫相比,Spark ML 的優勢(第1 - 54頁)
    • 在 Google Compute Engine 上頭建立 Spark 叢集:Cloud Dataproc(第1 - 56頁)
    • 總結(第1 - 62頁)
  • CHAPTER 02 機器學習需要的數學知識(第2 - 1頁)
    • 線性代數(第2 - 3頁)
    • 梯度下降法(第2 - 36頁)
    • 過去經驗、可能性、事後機率(第2 - 37頁)
    • 微積分(第2 - 38頁)
    • 圖表繪製(第2 - 40頁)
    • 總結(第2 - 42頁)
  • CHAPTER 03 設計機器學習系統(第3 - 1頁)
    • 何謂機器學習?(第3 - 2頁)
    • 介紹 MovieStream(第3 - 3頁)
    • 機器學習系統的商業案例(第3 - 4頁)
    • 機器學習模型的種類(第3 - 6頁)
    • 以資料驅動的機器學習系統的組成元件(第3 - 7頁)
    • 機器學習系統的架構(第3 - 13頁)
    • Spark MLlib(第3 - 15頁)
    • 效能提升:在 Spark MLlib 之上的 Spark ML(第3 - 15頁)
    • 比較 MLlib 支援的演算法(第3 - 17頁)
    • MLlib 支援的方法和開發人員 API(第3 - 18頁)
    • MLlib 版本(第3 - 20頁)
    • MLlib 版本比較(第3 - 20頁)
    • 總結(第3 - 21頁)
  • CHAPTER 04 Spark 取得資料並進行處理準備(第4 - 1頁)
    • 存取公開資料(第4 - 2頁)
    • 資料探索與視覺化(第4 - 6頁)
    • 資料處理與轉換(第4 - 34頁)
    • 從資料萃取出有用的特徵(第4 - 38頁)
    • 總結(第4 - 61頁)
  • CHAPTER 05 使用 Spark 建構推薦引擎(第5 - 1頁)
    • 推薦模型的種類(第5 - 2頁)
    • 從你的資料萃取出正確特徵(第5 - 17頁)
    • 訓練推薦模型(第5 - 19頁)
    • 使用推薦模型(第5 - 25頁)
    • 評估推薦模型的表現(第5 - 39頁)
    • FP-Growth 演算法(第5 - 52頁)
    • 總結(第5 - 58頁)
  • CHAPTER 06 使用 Spark 建構分類模型(第6 - 1頁)
    • 分類模型的類型(第6 - 3頁)
    • 從資料萃取出正確的特徵(第6 - 35頁)
    • 訓練分類模型(第6 - 35頁)
    • 使用分類模型(第6 - 38頁)
    • 增進模型表現能力與調校參數(第6 - 46頁)
    • 其他特徵(第6 - 51頁)
    • 總結(第6 - 69頁)
  • CHAPTER 07 使用 Spark 建構迴歸模型(第7 - 1頁)
    • 迴歸模型的種類(第7 - 2頁)
    • 評估迴歸模型的表現能力(第7 - 4頁)
    • 從資料萃取出正確的特徵(第7 - 7頁)
    • 訓練迴歸模型並使用(第7 - 14頁)
    • 增進模型表現能力與調校參數(第7 - 38頁)
    • 總結(第7 - 62頁)
  • CHAPTER 08 使用 Spark 建構分群模型(第8 - 1頁)
    • 分群模型的種類(第8 - 2頁)
    • 從資料萃取出正確的特徵(第8 - 7頁)
    • k- 平均演算法:訓練分類模型(第8 - 13頁)
    • k- 平均演算法:評估分群模型的表現能力(第8 - 24頁)
    • WSSSE 受迭代次數的影響(第8 - 25頁)
    • 二分 k- 平均演算法(第8 - 29頁)
    • 二分 k- 平均演算法:訓練分群模型(第8 - 30頁)
    • 高斯混合模型(第8 - 43頁)
    • 總結(第8 - 49頁)
  • CHAPTER 09 Spark 與維度縮減(第9 - 1頁)
    • 維度縮減的種類(第9 - 2頁)
    • 從資料萃取出正確的特徵(第9 - 5頁)
    • 訓練維度縮減模型(第9 - 18頁)
    • 使用維度縮減模型(第9 - 23頁)
    • 評估維度縮減模型(第9 - 27頁)
    • 總結(第9 - 31頁)
  • CHAPTER 10 Spark 與進階文字處理(第10 - 1頁)
    • 文字資料為何如此特別?(第10 - 1頁)
    • 從資料萃取出正確的特徵(第10 - 2頁)
    • 使用 tf-idf 模型(第10 - 27頁)
    • 評估文字處理的影響(第10 - 34頁)
    • 以 Spark 2.0 進行文字分類(第10 - 36頁)
    • Word2Vec 模型(第10 - 38頁)
    • Word2Vec 與 20 個新聞群組資料集(第10 - 42頁)
    • 總結(第10 - 43頁)
  • CHAPTER 11 Spark 串流程式庫與即時機器學習(第11 - 1頁)
    • 線上學習(第11 - 2頁)
    • 串流處理(第11 - 3頁)
    • Spark 串流與線上學習(第11 - 22頁)
    • 線上模型評估(第11 - 31頁)
    • 結構化串流(第11 - 36頁)
    • 總結(第11 - 37頁)
  • CHAPTER 12 Spark ML 的工作流程 API(第12 - 1頁)
    • 介紹工作流程(第12 - 1頁)
    • 工作流程如何運作?(第12 - 7頁)
    • 機器學習工作流程範例(第12 - 12頁)
    • 總結(第12 - 25頁)
紙本書 NT$ 620
單本電子書
NT$ 434

還沒安裝 HyRead 3 嗎?馬上免費安裝~
QR Code