本書從大數(shù)據分析角度入手, 首先介紹了不同的大數(shù)據處理模式與代表性的處理系統(tǒng), 其次對大數(shù)據分析所應用的數(shù)據挖掘、 機器學習的理論工具給予了介紹, 最后詳細介紹了典型的大數(shù)據技術IBM InfoSphere BigInsights。本書由3篇共25章組成。 第1篇大數(shù)據系統(tǒng)基礎, 由第1章概述和第2章大數(shù)據基礎組成。 第2篇大數(shù)據分析理論基礎, 由第3章到第10章組成, 主要介紹了一些概率與統(tǒng)計方面的基礎知識、 數(shù)據挖掘的基本技術以及機器學習的常用概率化工具。 第3篇大數(shù)據技術, 由第11章到第25章組成, 全面介紹了IBM InfoSphere BigInsights各個組件和基本應用。本書可作為高等學校大數(shù)據專業(yè)方向以及計算機科學技術、 軟件工程、 物聯(lián)網工程等信息科學技術類專業(yè)的本科教材, 也可作為相關專業(yè)的技術人員的參考資料。