前言
第1章 概述
1.1 項集:數據挖掘研究領域的焦點之一
1.2 頻繁項集挖掘問題的研究歷史
1.3 高可用項集挖掘問題的研究歷史
1.4 本書的主要內容
第2章 頻繁項集挖掘問題
2.1 概述
2.1.1 問題形式化定義
2.1.2 搜索空間與方法
2.2 基礎頻繁項集挖掘算法介紹
2.2.1 經典的候選生成Apriori算法
2.2.2 以垂直視角處理數據庫的Eclat算法
2.2.3 基于前綴樹結構的FP—growth算法
2.3 性能測試的軟硬件環(huán)境
2.3.1 數據庫描述
2.3.2 參照算法介紹
2.3.3 其他軟硬件設施
2.4 實驗一:三種基礎算法的性能測試
2.4.1 實驗結果
2.4.2 性能評價
第3章 BFP-growth:快速模式增長算法
3.1 經典模式增長算法的性能分析
3.1.1 影響FP-growth性能的三個因素
3.1.2 ICDM*佳算法:FPgrowth
3.2 批量模式增長算法:BFP-growth
3.2.1 性能提升的途徑
3.2.2 核心步驟:兩次前綴樹遍歷
3.2.3 算法偽代碼
3.3 BFP-growth算法的性能分析
3.3.1 *少的遍歷花費
3.3.2 FP-array技術應該集成在BFP-growth中嗎
3.3.3 無修飾的前綴樹結構
3.4 實驗二:BFP-growth的性能測試及討論
3.4.1 BFP-growth及FPgrowth*與基礎算法的對比
3.4.2 實驗結果討論
3.5 小結
第4章 基于結點集合結構的NS算法
4.1 Eclat及FP—growth算法的優(yōu)缺點
4.2 結點集合結構(Node—set)
4.2.1 條件結點
4.2.2 結點拓撲序號
4.2.3 使用結點集合結構表示前綴樹
4.3 NS算法
4.3.1 映射前綴樹到結點集合結構
4.3.2 從結點集合結構中挖掘頻繁項集
4.3.3 一個例子
4.3.4 NS算法的原子操作
4.4 實驗三:NS算法與其他快速挖掘算法的性能對比
4.4.1 實驗結果