本書是大數據分析技術的入門圖書,內容分為大數據分析與挖掘概述、Spark SQL結構化數據分析與處理、Spark Streaming流數據分析與處理、Spark GraphX圖數據分析與處理、Spark MLlib機器學習和大數據分析系統(tǒng)等6章。通過每章的章節(jié)導讀,讀者能夠快速了解本章相關內容的背景意義;通過相關理論及概念的介紹,讀者能夠對大數據分析的基本方法有整體認識和了解;通過典型案例的講解,讀者能夠對大數據分析技術的應用有深刻認識。本書既注重基礎知識也關注前沿問題,通過知識鏈接、小貼士等板塊補充相關前沿知識內容。 本書可作為數據科學與大數據專業(yè)人員的入門讀物,也可作為相關職業(yè)教育課程的參考書,還可作為大數據技術應用的愛好者以及各領域大數據建設、管理和運用者的參考書。