新書推薦:

《
金手铐(讲述海外留学群体面临的困境与挣扎、收获与失去)
》
售價:NT$
347.0

《
五谷杂粮养全家 正版书籍养生配方大全饮食健康营养食品药膳食谱养生食疗杂粮搭配减糖饮食书百病食疗家庭中医养生药膳入门书籍
》
售價:NT$
254.0

《
七种模式成就卓越班组:升级版
》
售價:NT$
296.0

《
主动出击:20世纪早期英国的科学普及(看英国科普黄金时代的科学家如何担当科普主力,打造科学共识!)
》
售價:NT$
403.0

《
太极拳套路完全图解 陈氏56式 杨氏24式和普及48式 精编口袋版
》
售價:NT$
152.0

《
2+20:私募股权为什么能长期战胜市场
》
售價:NT$
403.0

《
经典秩序的重构:廖平的世界观与经学之路(探究廖平经学思想,以新视角理解中国传统学术在西学冲击下的转型)
》
售價:NT$
454.0

《
你喜欢勃拉姆斯吗……
》
售價:NT$
245.0
|
內容簡介: |
Scala函式X機器學習X圖形演算X程式監控
實戰大數據分析,用Spark優化運算效率與速度
本書涵蓋了Spark專案的主要知識:
Spark核心RDD
SparkShell互動式數據分析
SparkStreaming即時資料串流
SparkSQL查詢處理
MLlib機器學習框架
GraphX圖形處理
除了以上基本Spark知識之外,還專闢一章介紹Scala,它除了是最熱門的函數式編程語言,也是Spark的原生語言。讀者將會學到使用Scala進行基礎函數編程,直接用它來寫出Spark應用程式。並且於最後特別提及Spark的三種叢集管理與Spark內建的網頁監控應用程式。
書中還介紹其他可搭配Spark使用的大數據技術,如:HDFS、Avro、Pqrquet、Kafka、Cassandra、Hbase、Mesos...等。也提供了機器學習和圖學概念的介紹。
如果想要將這本書發揮最大效益,就請嘗試動手鍵入書中的範例。用這些範例程式進行實驗,你將會覺得更加清楚明瞭。練習過書中的範例,在讀完這本書後將會成為一個有實力的Spark開發者。
本書特色:
透過上百場大數據相關研討會,萃取出業界人士常見問題之精華
了解開發者在運用Spark時,可能需要使用的開發和測試工具
涵蓋機器學習與圖形演算,強化大數據分析能力基礎
適合軟體設計者、架構設計師、專案管理者、或是程式設計師閱讀
|
關於作者: |
MohammedGuller
他是美國數據分析平台公司Glassbeam的首席架構師,主要工作是帶領開發高階預測分析系統。身為大數據和Spark的專家,他常受邀到許多大數據研討會演講。對於建立新產品、巨量資料分析、以及機器學習有著無比的熱情。
過去20年來,Mohammed成功地從概念到發佈,開發出許多創新科技產品。在加入Glassbeam公司前,他是TrustRecs.com的創辦人,這間公司是他任職於IBM五年後創立的。而在加入IBM前,他也在許多高科技新創公司帶領開發新產品。
Mohammed擁有美國加州大學柏克萊分校的商業管理碩士學位,以及印度古吉拉特大學RCC的電腦軟體碩士學位。
|
目錄:
|
CHAPTER01──大數據技術
Hadoop
資料序列化
分欄式儲存
訊息系統
NoSQL
分散式SQL查詢引擎
總結
CHAPTER02──Scala程式設計
函數式程式設計
Scala基礎
可獨立執行的Scala應用程式
總結
CHAPTER03──Spark核心
總覽
高階架構
應用程式的執行
資料來源
應用程式介面
惰性操作
快取
Spark工作
共用變數
總結
CHAPTER04──使用SparkShell進行互動式資料分析
起手式
REPL指令
將SparkShell作為ScalaShell使用
數值分析
日誌分析
總結
CHAPTER05──撰寫Spark應用程式
Spark中的HelloWorld
編譯並執行應用程式
監控應用程式
應用程式除錯
總結
CHAPTER06──SparkStreaming
SparkStreaming簡介
應用程式介面
完整的SparkStreaming應用程式
總結
CHAPTER07──SparkSQL
SparkSQL簡介
效能
應用程式
應用程式介面
內建函數
使用者自訂函數與使用者自訂彙整函數
互動式分析範例
使用SparkSQLJDBC伺服器進行互動式分析
總結
CHAPTER08──Spark機器學習
介紹機器學習
Spark機器學習函式庫
MLlib函式庫概觀
TheMLlibAPI
MLlib應用程式範例
SparkML
SparkML應用程式範例
總結
CHAPTER09──Spark圖學處理
圖形簡介
GraphX簡介
GraphXAPI
總結
CHAPTER10──叢集管理器
獨立叢集管理器
ApacheMesos
YARN
總結
CHAPTER11──監控
監控獨立叢集
監控Spark應用程式
總結
|
|