新書推薦:

《
非人哉官方设定集(2024版)
》
售價:NT$
924.0

《
高句丽与拓跋鲜卑国家起源比较研究(欧亚备要)
》
售價:NT$
539.0

《
谈判力:谈判无处不在+谈判从说不开始(套装2册)
》
售價:NT$
306.0

《
常见病特效穴位速查
》
售價:NT$
179.0

《
我的人生哲学:我对这个世界没什么好说的
》
售價:NT$
245.0

《
此去经年:林徽因自传式独家心灵告白
》
售價:NT$
254.0

《
混凝土弹性与粘弹性多尺度理论
》
售價:NT$
857.0

《
别害怕冲突 高情商处理冲突避免情绪化反应 揭秘冲突背后的复杂原因
》
售價:NT$
301.0
|
內容簡介: |
準備好釋放潛藏在您資料中的力量了嗎?透過這本綜合技術大全,您將學會如何用ApacheHadoop來打造並維運一個可靠而具擴充性的分散式系統。無論是想瞭解如何分析各種大小資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。
針對Hadoop2所做的這個改版,新增了YARN以及Hadoop相關專案的新章節,像是Parquet、Flume、Crunch及Spark。從這些新案例中,您可以了解Hadoop在健康照護系統以及基礎資料處理這些領域所扮演的角色。
.學習基礎元件如MapReduce、HDFS及YARN。
.更深入探索MapReduce,包含開發應用程式。
.設定及維護Hadoop叢集以使用HDFS及YARN上的Mapreduce。
.學習兩種資料格式:Avro的資料序列化和Parquet巢狀資料。
.使用資料攝取工具,如Flume(使用於串流資料)和Sqoop(使用於批量資料傳輸)。
.了解高階資料處理工具,如Pig、Hive、Crunch,以及Spark。
.學習HBase分散式資料庫以及運用ZooKeeper打造分散式服務。
|
關於作者: |
TomWhite
TomWhite自2007年起就是ApacheHadoop的提交者。他不僅是阿帕契軟體基金會的成員,同時也是Cloudera的工程師。他曾幫orielly.com、java.net與IBM的developerWorks撰寫技術文章,並在商業研討會上發表多場演講。
|
目錄:
|
第一部分 Hadoop基礎
chapter1|遇見Hadoop
chapter2|MapReduce
chapter3|Hadoop分散式檔案系統
chapter4|YARN
chapter5|Hadoop的IO
第二部分 MapReduce
chapter6|開發MapReduce程式
chapter7|MapReduce如何運作
chapter8|MapReduce的類型與格式
chapter9|MapReduce的特性
第三部分 Hadoop操作
chapter10|建立一個Hadoop叢集
chapter11|Hadoop的管理
第四部分 相關專案
chapter12|Avro
chapter13|Parquet
chapter14|Flume
chapter15|Sqoop
chapter16|Pig
chapter17|Hive
chapter18|Crunch
chapter19|Spark
chapter20|HBase
chapter21|ZooKeeper
第五部分 案例研究
chapter22|Cerner的可聚集資料
chapter23|生物資料科學:用軟體拯救生命
chapter24|Cascading
appendixA|安裝ApacheHadoop
appendixB|Cloudera的Hadoop發行套件
appendixC|準備NCDC氣象資料
appendixD|舊版及新版的JavaMapReduceAPI
index
|
|