本書有DRM加密保護,需使用HyRead閱讀軟體開啟
  • 大數據:從基礎理論到最佳實踐
  • 點閱:8
  • 作者: 祁偉主編
  • 出版社:清華大學出版社
  • 出版年:2017[民106]
  • ISBN:978-7-302-45743-5 ; 7-302-45743-3
  • 格式:EPUB
  • 版次:第1版
  • 附註:簡體字版 封面副題名: 爽!可以自己親手搭建並有效管理大數據平台了! 封面英文題名: Big data
租期14天 今日租書可閱讀至2021-05-24

內容介紹
本書側重於大數據的實踐性技術,系統地介紹了主流大數據平台及工具的安裝部署、管理維護和應用開發。平台和工具的選擇均為當前業界主流的開源產品,因此,對於讀者來說,有很強的可操作性。
本書涉及的開源技術包括:HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka、Flume等。除介紹一般性的背景知識、安裝部署、管理維護和應用開發技術外,還特別注重案例實踐,重要的技術點以實際工作場景或案例為依托,使讀者能快速入門,參考案例動手實踐,通過具體深入的實踐,體會大數據的技術本質特征,領略大數據技術帶來的創新理念,更好地理解和把握信息技術的發展趨勢。
本書主要內容包括以下幾大部分。
大數據存儲篇:以HDFS為基礎,介紹分布式文件系統的原理、安裝、fs命令的使用、編程,介紹如何用HDFS實現,並通過HTTP調用。

大數據計算篇:以MapReduce、YARN為基礎,介紹分布式計算的原理、部署,以及編程案例。
非關系型數據庫篇:以HBase為基礎,重點介紹非關系型數據庫的優勢、原理、部署,以及命令行使用,編程案例,與Sqoop配合使用等。
大數據倉庫篇:以Hive、數據倉庫等為基礎,重點介紹數據的抽取、原理、部署、分析與編程。
大數據實時計算篇:以Storm、Kafka為基礎,介紹實時計算的架構、組成、使用與開發。
本書非常適合從事大數據技術開發與使用的初學者,以及從事大數據技術研發的企事業單位工程師學習和參考,也適合高校計算機相關專業的專科生、本科生和研究生學習使用。


作者介紹
祁偉:畢業於北京師范大學,目前擔任《中國教育信息化》雜志社總編輯,具有超過20年的IT工作經驗,在網絡路由、服務器虛擬化、數據庫等方面有深入研究和豐富的實踐經驗。
 
劉冰:畢業於中國科學院計算技術研究所,數據中心架構師,從事虛擬化、監測與大數據分析等方面研究,曾與祁偉總編共同著有《雲計算:從基礎架構到*佳實踐》,現就職於教育部教育管理信息中心。
 

常志軍:畢業於中國科學院自動化研究所,大數據平台架構師,分布式系統研究人員。先后在搜狐暢游、中國搜索、Opera歐朋、中科院自動化所從事大數據領域的探索與研發工作。
 
趙廷濤:畢業於中國傳媒大學,現就職於科技部信息中心,有多年大數據存儲研發經驗,現從事數據中心管理運維工作,專注於虛擬化、應用系統建設等相關技術研究。
 
高俊秀:畢業於北京航空航天大學計算機學院,數據倉庫架構師,八年互聯網大數據從業經驗。歷任百度、豌豆莢、今日頭條的數據平台和數據倉庫核心研發和負責人,對數據在業務上發揮價值有深入的理解。


  • 封面页
  • 书名页
  • 版权页
  • 目录
紙本書 NT$ 359
單本電子書
NT$ 251

點數租閱 20點
租期14天
今日租書可閱讀至2021-05-24
還沒安裝 HyRead 3 嗎?馬上免費安裝~
QR Code