注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)數(shù)據(jù)庫并行離群數(shù)據(jù)挖掘及應(yīng)用

并行離群數(shù)據(jù)挖掘及應(yīng)用

并行離群數(shù)據(jù)挖掘及應(yīng)用

定 價:¥39.00

作 者: 李俊麗 著
出版社: 科學(xué)技術(shù)文獻出版社
叢編項:
標(biāo) 簽: 暫缺

ISBN: 9787518977383 出版時間: 2021-07-01 包裝: 平裝
開本: 16開 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  全書共由7章組成,其中:第1章主要介紹數(shù)據(jù)挖掘技術(shù)、離群挖掘、集群系統(tǒng)與Spark并行計算模型及大數(shù)據(jù)的相關(guān)概念、理論基礎(chǔ)和應(yīng)用。第2章利用特征分組,針對高維分類數(shù)據(jù)集,研究了一種基于加權(quán)特征分組的離群檢測新方法,通過將特征分為多個特征組來發(fā)現(xiàn)每個組中特征模式的不同方面。第3章利用Spark計算平臺,研究了高維分類數(shù)據(jù)的并行離群檢測算法。第4章通過分析屬性間的相關(guān)性,研究了一種基于互信息的混合屬性離群檢測算法。該算法在互信息機制下給出了針對數(shù)值型和分類型統(tǒng)一的屬性加權(quán)方法和離群得分計算方法,而且不同類型屬性下的相似性度量也進行了規(guī)范化處理。第5章針對互信息計算的復(fù)雜性問題,充分利用Spark并行計算框架的強大計算能力,研究了一種并行互信息計算方法,該算法利用列變換和虛擬數(shù)據(jù)劃分技術(shù)降低了網(wǎng)絡(luò)傳輸和計算代價。第6章以某鋼鐵企業(yè)實際的冷軋輥產(chǎn)品加工數(shù)據(jù)為背景,設(shè)計與實現(xiàn)了冷軋輥制造過程離群檢測原型系統(tǒng),從而為企業(yè)開展產(chǎn)品質(zhì)量控制提供了一種新的技術(shù)方法和解決思路。第7章是研究的總結(jié)與展望。

作者簡介

暫缺《并行離群數(shù)據(jù)挖掘及應(yīng)用》作者簡介

圖書目錄

目錄


第1章緒論

1.1大數(shù)據(jù)挖掘及應(yīng)用

1.1.1數(shù)據(jù)挖掘技術(shù)

1.1.2數(shù)據(jù)挖掘的發(fā)展趨勢和研究前沿

1.1.3大數(shù)據(jù)及其應(yīng)用

1.1.4集群系統(tǒng)與并行計算

1.1.5Spark并行計算模型

1.1.6大數(shù)據(jù)挖掘技術(shù)的應(yīng)用

1.2離群數(shù)據(jù)挖掘及研究動態(tài)

1.2.1離群數(shù)據(jù)挖掘

1.2.2分類數(shù)據(jù)離群挖掘

1.2.3混合屬性數(shù)據(jù)離群挖掘

1.2.4離群數(shù)據(jù)并行挖掘及性能優(yōu)化

1.2.5離群數(shù)據(jù)挖掘的應(yīng)用

1.3本章小結(jié)


第2章基于加權(quán)特征分組的高維分類數(shù)據(jù)離群挖掘

2.1引言

2.2相關(guān)工作

2.2.1離群檢測

2.2.2高維數(shù)據(jù)離群檢測

2.2.3分類數(shù)據(jù)離群檢測

2.3離群檢測前期準(zhǔn)備

2.3.1分類數(shù)據(jù)和問題陳述

2.3.2計算特征的相關(guān)性

2.3.3特征分組算法

2.4離群值檢測算法WATCH

2.4.1特征加權(quán)

2.4.2離群得分

2.4.3離群檢測算法

2.4.4時間復(fù)雜度分析

2.5實驗分析

2.5.1數(shù)據(jù)集

2.5.2特征分組評估

2.5.3特征分組結(jié)果分析

2.5.4離群點檢測的精度

2.5.5離群檢測效率

2.5.6可解釋性

2.6本章小結(jié)


第3章基于Spark的分類數(shù)據(jù)并行離群挖掘

3.1引言

3.2基本概念

3.2.1高維分類數(shù)據(jù)特征組

3.2.2MapReduce和Spark RDD

3.3特征分組

3.3.1特征分組的基本概念

3.3.2基于Spark的特征分組的并行實現(xiàn)

3.4基于Spark的POS算法

3.4.1基于Spark的POS算法的工作流程

3.4.2基于Spark的特征分組

3.4.3并行離群挖掘

3.5POS的性能調(diào)優(yōu)

3.5.1RDD緩存

3.5.2參數(shù)調(diào)優(yōu)

3.6實驗分析

3.6.1數(shù)據(jù)集

3.6.2偽分布環(huán)境下的挖掘性能

3.6.3RDD緩存的影響

3.6.4特征組的數(shù)量對算法的影響

3.6.5算法的可擴展性

3.6.6算法的可伸縮性

3.7本章小結(jié)


第4章基于互信息的混合屬性加權(quán)離群挖掘算法

4.1引言

4.2相關(guān)工作

4.3基于互信息的混合屬性相關(guān)性度量及加權(quán)機制

4.3.1互信息計算

4.3.2混合屬性加權(quán)機制

4.4基于互信息的混合屬性加權(quán)離群檢測算法

4.4.1數(shù)值空間離群得分

4.4.2分類空間離群得分

4.4.3混合屬性加權(quán)離群檢測算法

4.5實驗結(jié)果與分析

4.5.1混合屬性數(shù)據(jù)離群檢測分析

4.5.2數(shù)值型數(shù)據(jù)離群檢測分析

4.5.3分類型數(shù)據(jù)離群檢測分析

4.6本章小結(jié)


第5章基于Spark的并行互信息計算及其性能優(yōu)化

5.1引言

5.2相關(guān)工作

5.2.1互信息及其并行化

5.2.2性能優(yōu)化

5.3并行互信息計算及性能優(yōu)化

5.3.1列變換

5.3.2數(shù)據(jù)傾斜

5.4MiCS算法的具體實現(xiàn)

5.4.1列變換及虛擬劃分策略

5.4.2互信息計算

5.5實驗與分析

5.5.1應(yīng)用背景

5.5.2數(shù)據(jù)集

5.5.3列變換對MiCS的影響

5.5.4虛擬分區(qū)對MiCS的影響

5.6本章小結(jié)


第6章冷軋輥制造過程離群數(shù)據(jù)挖掘原型系統(tǒng)

6.1引言

6.2系統(tǒng)需求與總體設(shè)計

6.2.1冷軋輥制造過程的復(fù)雜性

6.2.2冷軋輥的失效分析

6.2.3影響冷軋輥生產(chǎn)過程質(zhì)量的因素

6.2.4系統(tǒng)的軟件體系結(jié)構(gòu)及功能

6.3數(shù)據(jù)收集及預(yù)處理

6.3.1數(shù)據(jù)收集

6.3.2數(shù)據(jù)預(yù)處理

6.4冷軋輥制造過程離群檢測及質(zhì)量分析

6.5本章小結(jié)


第7章總結(jié)與展望

7.1總結(jié)

7.2展望

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號