第一章 互聯(lián)網中的數(shù)據(jù)概述
第一節(jié) 從IT走向DT
第二節(jié) 時代背景
第三節(jié) 相關概念的界定
第四節(jié) 數(shù)據(jù)的影響
第五節(jié) 互聯(lián)網數(shù)據(jù)處理技術的發(fā)展
第二章 互聯(lián)網web頁面數(shù)據(jù)的獲取
第一節(jié) 網絡爬蟲技術概述
第二節(jié) 爬蟲的內核技術
第三節(jié) 主題爬蟲技術
第四節(jié) 動態(tài)Web頁面獲取技術
第五節(jié) 微博信息內容獲取技術
第六節(jié) 反爬蟲技術與反反爬蟲技術
第七節(jié) 爬蟲技術的展望
第三章 數(shù)據(jù)處理技術基礎
第一節(jié) 數(shù)據(jù)產生及特性
第二節(jié) 數(shù)據(jù)技術體系
第三節(jié) 數(shù)據(jù)采集與存儲
第四節(jié) 數(shù)據(jù)分析與挖掘
第五節(jié) 數(shù)據(jù)可視化
第六節(jié) 可視化典型案例
第四章 信息處理與分析應用
第一節(jié) 語音識別簡介
第二節(jié) 連續(xù)語音識別技術
第三節(jié) 多語言語音識別技術
第五章 數(shù)據(jù)分析的模型與算法
第一節(jié) 數(shù)據(jù)分析技術概述
第二節(jié) 特征選擇與特征提取
第三節(jié) 文本的向量空間模型
第四節(jié) 文本的概率模型
參考文獻