大數據的概念很火,但人們對它的認識卻是混亂的:有人說大數據就是指所有的數據,有人說大數據是指線上行為、日志等半結構/非結構化的數據形態(tài),有人說大數據就是以Hadoop為代表的新技術……到底什么是大數據?同樣風風火火了很久的云計算與大數據有什么關系?令人眼花繚亂的眾多大數據技術的本質是什么?各有什么優(yōu)缺點?爭論不休的“小變大”與“大變小”技術策略到底孰正孰邪?企業(yè)究竟應該如何定位與使用大數據,難道是為了Hadoop而Hadoop?未來的技術方向究竟如何?本書結合現代企業(yè)數據管理實踐,從策略、技術、應用、企業(yè)數據架構等多個維度,體系化地對大數據及相關技術進行了全面深入的論述:首先對大數據相關概念予以澄清;接著深入剖析各種大數據技術的內在本質,指出其各自的優(yōu)缺點、適用場景與相互關系;同時對大數據技術“分”與“合”這兩種廣受爭議的技術策略的內在聯系進行了分析與討論,明確指出現代數據管理技術的發(fā)展趨勢;最后結合大數據時代企業(yè)新一代數據架構規(guī)劃的實際,對大數據及相關技術在企業(yè)數據體系中的具體定位給出了切實可行的建議,并且面向云數據中心建設,提出了大數據云――云計算數據基礎設施的概念與方法。