本書內容基于Spark新版本展開,符合企業(yè)目前開發(fā)需要。本書全面講解Spark SQL相關知識和實戰(zhàn)應用,各章均提供較為豐富的案例及其詳細的操作步驟,并配套示例源碼、數(shù)據集、PPT課件和教學大綱。本書共10章。第1~3章為Spark SQL的基礎準備部分,內容包括Spark SQL的發(fā)展和簡介、Spark的典型數(shù)據容器及關系、Spark概述與環(huán)境搭建、Spark典型數(shù)據結構RDD;第4~7章為Spark SQL的基礎應用部分,內容包括Spark SQL入門實戰(zhàn)(包括Scala編程基礎)、SQL基礎語法、操作多數(shù)據源、SparkSQL性能調優(yōu)等;第8~10章分別通過影評數(shù)據分析、商品統(tǒng)計數(shù)據分析、咖啡銷售數(shù)據分析等3個實戰(zhàn)項目進行鞏固提升。本書內容翔實、示例豐富,既可作為Spark初學者、大數(shù)據分析人員、大數(shù)據應用開發(fā)人員的自學手冊,也可作為高等院?;蚋呗毟邔T盒S嬎銠C、軟件工程、數(shù)據科學與大數(shù)據技術、智能科學與技術、人工智能等專業(yè)大數(shù)據課程的教材。本書封面貼有清華大學出版社防偽標簽,無標簽者不得銷售。版權所有,侵權必究。舉報:010-62782989,beiqinquan@tup.tsinghua.edu.cn。