本書以Hadoop 3.3.0為核心,涵蓋Hadoop生態(tài)系統(tǒng)的常用組件,主要介紹各組件的架構原理、Shell命令、常用API及編程等,并配有較多例題。全書共7章,內容包含Hadoop概述、Hadoop偽分布式安裝、Hadoop分布式文件系統(tǒng)HDFS、分布式計算框架MapReduce、分布式數(shù)據(jù)庫HBase、數(shù)據(jù)倉庫Hive和內存計算框架Spark,第2~7章還設計了相關實驗。本書可以作為高等院校大數(shù)據(jù)、計算機、應用統(tǒng)計等相關專業(yè)的教材,也可作為Hadoop愛好者的入門教程或自學參考用書。本書配有電子課件,歡迎選用本書作教材的教師登錄www.cmpedu.com注冊后下載,或加微信13910750469索取。