注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)網(wǎng)絡(luò)與數(shù)據(jù)通信網(wǎng)絡(luò)服務(wù)Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)(第2版)

Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)(第2版)

Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)(第2版)

定 價(jià):¥79.00

作 者: 張良均,譚立云,劉名軍,江建明
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787111640028 出版時(shí)間: 2019-12-01 包裝:
開本: 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  本書是Python數(shù)據(jù)分析與挖掘領(lǐng)域的公認(rèn)的事實(shí)標(biāo)準(zhǔn),第1版銷售超過10萬冊(cè),銷售勢(shì)頭依然強(qiáng)勁,被國內(nèi)100余所高等院校采用為教材,同時(shí)也被廣大數(shù)據(jù)科學(xué)工作者奉為經(jīng)典。 \n作者在大數(shù)據(jù)挖掘與分析等領(lǐng)域有10余年的工程實(shí)踐、教學(xué)和創(chuàng)辦企業(yè)的經(jīng)驗(yàn),不僅掌握行業(yè)的新技術(shù)和實(shí)踐方法,而且洞悉學(xué)生和老師的需求與痛點(diǎn),這為本書的內(nèi)容和形式提供了強(qiáng)有力的保障,這是本書第1版能大獲成功的關(guān)鍵因素。 \n全書共13章,分為三個(gè)部分,從技術(shù)理論、工程實(shí)踐和進(jìn)階提升三個(gè)維度對(duì)數(shù)據(jù)分析與挖掘進(jìn)行了詳細(xì)的講解。 \n第一部分 基礎(chǔ)篇(第1~5章) \n主要講解了Python數(shù)據(jù)分析與挖掘的工具和技術(shù)理論,包括數(shù)據(jù)挖掘的基礎(chǔ)知識(shí)、Python數(shù)據(jù)挖掘與建模工具、數(shù)據(jù)挖掘的建模過程,以及挖掘建模的常用算法和原理等內(nèi)容。 \n第二部分 實(shí)戰(zhàn)篇(第6~12章) \n通過工程實(shí)踐案例講解了數(shù)據(jù)挖掘技術(shù)在金融、航空、零售、能源、制造、電商等行業(yè)的應(yīng)用。在案例組織結(jié)構(gòu)上,本書按照“介紹案例背景與挖掘目標(biāo)→闡述分析方法與過程→完成模型構(gòu)建”的順序進(jìn)行,在建模過程關(guān)鍵環(huán)節(jié),穿插程序?qū)崿F(xiàn)代碼。最后,通過上機(jī)實(shí)踐加深對(duì)案例應(yīng)用中的數(shù)據(jù)挖掘技術(shù)的理解。 \n第三部分 提高篇(第13章) \n重點(diǎn)講解了基于Python引擎的開源數(shù)據(jù)挖掘建模平臺(tái)(TipDM)的功能和使用方法,以航空公司客戶價(jià)值分析為案例,介紹了如何使用該平臺(tái)快速搭建數(shù)據(jù)分析與挖掘工程。 \n本書不僅提供TipDM這樣的上機(jī)實(shí)踐環(huán)境,而且還提供配套的案例建模數(shù)據(jù)、Python源代碼、教學(xué)PPT。 \n

作者簡介

  張良均資深大數(shù)據(jù)挖掘與分析專家、模式識(shí)別專家、AI技術(shù)專家。有10余年大數(shù)據(jù)挖掘與分析經(jīng)驗(yàn),擅長Python、R、Hadoop、Matlab等技術(shù)實(shí)現(xiàn)的數(shù)據(jù)挖掘與分析,對(duì)機(jī)器學(xué)習(xí)等AI技術(shù)驅(qū)動(dòng)的數(shù)據(jù)分析也有深入研究。為電信、電力、政府、互聯(lián)網(wǎng)、生產(chǎn)制造、零售、銀行、生物、化工、醫(yī)藥等多個(gè)行業(yè)上百家大型企業(yè)提供過數(shù)據(jù)挖掘應(yīng)用與咨詢服務(wù),實(shí)踐經(jīng)驗(yàn)非常豐富。華南師范大學(xué)、中南財(cái)經(jīng)政法大學(xué)、廣東工業(yè)大學(xué)、西安理工大學(xué)、廣西科技大學(xué)、重慶交通大學(xué)、桂林電子科技大學(xué)等校外碩導(dǎo)或兼職教授。撰寫了《R語言數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》《數(shù)據(jù)挖掘:實(shí)用案例分析》《Hadoop大數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》等10余部暢銷書,累計(jì)銷售超過30萬冊(cè)。

圖書目錄

前言

\n

基礎(chǔ)篇

\n

第1章 數(shù)據(jù)挖掘基礎(chǔ)  2

\n

1.1 某知名連鎖餐飲企業(yè)的困惑  2

\n

1.2 從餐飲服務(wù)到數(shù)據(jù)挖掘  4

\n

1.3 數(shù)據(jù)挖掘的基本任務(wù)  5

\n

1.4 數(shù)據(jù)挖掘建模過程  5

\n

1.4.1 定義挖掘目標(biāo)  6

\n

1.4.2 數(shù)據(jù)取樣  6

\n

1.4.3 數(shù)據(jù)探索  7

\n

1.4.4 數(shù)據(jù)預(yù)處理  8

\n

1.4.5 挖掘建模  8

\n

1.4.6 模型評(píng)價(jià)  8

\n

1.5 常用數(shù)據(jù)挖掘建模工具  9

\n

1.6 小結(jié)  11

\n

第2章 Python數(shù)據(jù)分析簡介  12

\n

2.1 搭建Python開發(fā)平臺(tái)  14

\n

2.1.1 所要考慮的問題  14

\n

2.1.2 基礎(chǔ)平臺(tái)的搭建  14

\n

2.2 Python使用入門  16

\n

2.2.1 運(yùn)行方式  16

\n

2.2.2 基本命令  17

\n

2.2.3 數(shù)據(jù)結(jié)構(gòu)  19

\n

2.2.4 庫的導(dǎo)入與添加  24

\n

2.3 Python數(shù)據(jù)分析工具  26

\n

2.3.1 NumPy  27

\n

2.3.2 SciPy  28

\n

2.3.3 Matplotlib  29

\n

2.3.4 pandas  31

\n

2.3.5 StatsModels  33

\n

2.3.6 scikit-learn  33

\n

2.3.7 Keras  34

\n

2.3.8 Gensim  36

\n

2.4 配套附件使用設(shè)置  37

\n

2.5 小結(jié)  38

\n

第3章 數(shù)據(jù)探索  39

\n

3.1 數(shù)據(jù)質(zhì)量分析  39

\n

3.1.1 缺失值分析  40

\n

3.1.2 異常值分析  40

\n

3.1.3 一致性分析  44

\n

3.2 數(shù)據(jù)特征分析  44

\n

3.2.1 分布分析  44

\n

3.2.2 對(duì)比分析  48

\n

3.2.3 統(tǒng)計(jì)量分析  51

\n

3.2.4 周期性分析  54

\n

3.2.5 貢獻(xiàn)度分析  55

\n

3.2.6 相關(guān)性分析  58

\n

3.3 Python主要數(shù)據(jù)探索函數(shù)  62

\n

3.3.1 基本統(tǒng)計(jì)特征函數(shù)  62

\n

3.3.2 拓展統(tǒng)計(jì)特征函數(shù)  66

\n

3.3.3 統(tǒng)計(jì)繪圖函數(shù)  67

\n

3.4 小結(jié)  74

\n

第4章 數(shù)據(jù)預(yù)處理  75

\n

4.1 數(shù)據(jù)清洗  75

\n

4.1.1 缺失值處理  75

\n

4.1.2 異常值處理  80

\n

4.2 數(shù)據(jù)集成  80

\n

4.2.1 實(shí)體識(shí)別  81

\n

4.2.2 冗余屬性識(shí)別  81

\n

4.2.3 數(shù)據(jù)變換  81

\n

4.2.4 簡單函數(shù)變換  81

\n

4.2.5 規(guī)范化  82

\n

4.2.6 連續(xù)屬性離散化  84

\n

4.2.7 屬性構(gòu)造  87

\n

4.2.8 小波變換  88

\n

4.3 數(shù)據(jù)歸約  91

\n

4.3.1 屬性歸約  91

\n

4.3.2 數(shù)值歸約  95

\n

4.4 Python主要數(shù)據(jù)預(yù)處理函數(shù)  98

\n

4.5 小結(jié)  101

\n

第5章 挖掘建模  102

\n

5.1 分類與預(yù)測(cè)  102

\n

5.1.1 實(shí)現(xiàn)過程  103

\n

5.1.2 常用的分類與預(yù)測(cè)算法  103

\n

5.1.3 回歸分析  104

\n

5.1.4 決策樹  108

\n

5.1.5 人工神經(jīng)網(wǎng)絡(luò)  115

\n

5.1.6 分類與預(yù)測(cè)算法評(píng)價(jià)  120

\n

5.1.7 Python分類預(yù)測(cè)模型特點(diǎn)  125

\n

5.2 聚類分析  125

\n

5.2.1 常用聚類分析算法  126

\n

5.2.2 K-Means聚類算法  127

\n

5.2.3 聚類分析算法評(píng)價(jià)  132

\n

5.2.4 Python主要聚類分析算法  133

\n

5.3 關(guān)聯(lián)規(guī)則  135

\n

5.3.1 常用關(guān)聯(lián)規(guī)則算法  136

\n

5.3.2 Apriori算法  136

\n

5.4 時(shí)序模式  142

\n

5.4.1 時(shí)間序列算法  142

\n

5.4.2 時(shí)間序列的預(yù)處理  143

\n

5.4.3 平穩(wěn)時(shí)間序列分析  145

\n

5.4.4 非平穩(wěn)時(shí)間序列分析  148

\n

5.4.5 Python主要時(shí)序模式算法  156

\n

5.5 離群點(diǎn)檢測(cè)  159

\n

5.5.1 離群點(diǎn)的成因及類型  160

\n

5.5.2 離群點(diǎn)檢測(cè)方法  160

\n

5.5.3 基于模型的離群點(diǎn)檢測(cè)方法  161

\n

5.5.4 基于聚類的離群點(diǎn)檢測(cè)方法  164

\n

5.6 小結(jié)  167

\n

實(shí)戰(zhàn)篇

\n

第6章 財(cái)政收入影響因素分析及預(yù)測(cè)  170

\n

6.1 背景與挖掘目標(biāo)  170

\n

6.2 分析方法與過程  171

\n

6.2.1 分析步驟與流程  172

\n

6.2.2 數(shù)據(jù)探索分析  172

\n

6.2.3 數(shù)據(jù)預(yù)處理  176

\n

6.2.4 模型構(gòu)建  178

\n

6.3 上機(jī)實(shí)驗(yàn)  184

\n

6.4 拓展思考  185

\n

6.5 小結(jié)  186

\n

第7章 航空公司客戶價(jià)值分析  187

\n

7.1 背景與挖掘目標(biāo)  187

\n

7.2 分析方法與過程  188

\n

7.2.1 分析步驟與流程  189

\n

7.2.2 數(shù)據(jù)探索分析  189

\n

7.2.3 數(shù)據(jù)預(yù)處理  200

\n

7.2.4 模型構(gòu)建  207

\n

7.2.5 模型應(yīng)用  212

\n

7.3 上機(jī)實(shí)驗(yàn)  214

\n

7.4 拓展思考  215

\n

7.5 小結(jié)  216

\n

第8章 商品零售購物籃分析  217

\n

8.1 背景與挖掘目標(biāo)  217

\n

8.2 分析方法與過程  218

\n

8.2.1 數(shù)據(jù)探索分析  219

\n

8.2.2 數(shù)據(jù)預(yù)處理  224

\n

8.2.3 模型構(gòu)建  226

\n

8.3 上機(jī)實(shí)驗(yàn)  232

\n

8.4 拓展思考  233

\n

8.5 小結(jié)  233

\n

第9章 基于水色圖像的水質(zhì)評(píng)價(jià)  234

\n

9.1 背景與挖掘目標(biāo)  234

\n

9.2 分析方法與過程  235

\n

9.2.1 分析步驟與流程  236

\n

9.2.2 數(shù)據(jù)預(yù)處理  236

\n

9.2.3 模型構(gòu)建  240

\n

9.2.4 水質(zhì)評(píng)價(jià)  241

\n

9.3 上機(jī)實(shí)驗(yàn)  242

\n

9.4 拓展思考  242

\n

9.5 小結(jié)  243

\n

第10章 家用熱水器用戶行為分析與事件識(shí)別  244

\n

10.1 背景與挖掘目標(biāo)  244

\n

10.2 分析方法與過程  245

\n

10.2.1 數(shù)據(jù)探索分析  246

\n

10.2.2 數(shù)據(jù)預(yù)處理  249

\n

10.2.3 模型構(gòu)建  260

\n

10.2.4 模型檢驗(yàn)  261

\n

10.3 上機(jī)實(shí)驗(yàn)  262

\n

10.4 拓展思考  264

\n

10.5 小結(jié)  265

\n

第11章 電子商務(wù)網(wǎng)站用戶行為分析及服務(wù)推薦  266

\n

11.1 背景與挖掘目標(biāo)  266

\n

11.2 分析方法與過程  267

\n

11.2.1 分析步驟與流程  267

\n

11.2.2 數(shù)據(jù)抽取  269

\n

11.2.3 數(shù)據(jù)探索分析  270

\n

11.2.4 數(shù)據(jù)預(yù)處理  279

\n

11.2.5 構(gòu)建智能推薦模型  283

\n

11.3 上機(jī)實(shí)驗(yàn)  291

\n

11.4 拓展思考  293

\n

11.5 小結(jié)  293

\n

第12章 電商產(chǎn)品評(píng)論數(shù)據(jù)情感分析  294

\n

12.1 背景與挖掘目標(biāo)  294

\n

12.2 分析方法與過程  295

\n

12.2.1 評(píng)論預(yù)處理  296

\n

12.2.2 評(píng)論分詞  297

\n

12.2.3 構(gòu)建模型  303

\n

12.3 上機(jī)實(shí)驗(yàn)  315

\n

12.4 拓展思考  316

\n

12.5 小結(jié)  318

\n

提高篇

\n

第13章 基于Python引擎的開源數(shù)據(jù)挖掘建模平臺(tái)(TipDM)  320

\n

13.1 平臺(tái)簡介  321

\n

13.1.1 模板  321

\n

13.1.2 數(shù)據(jù)源  322

\n

13.1.3 工程  323

\n

13.1.4 系統(tǒng)組件  324

\n

13.1.5 TipDM數(shù)據(jù)挖掘建模平臺(tái)的本地化部署  326

\n

13.2 快速構(gòu)建數(shù)據(jù)挖掘工程  327

\n

13.2.1 導(dǎo)入數(shù)據(jù)  329

\n

13.2.2 配置輸入源組件  331

\n

13.2.3 配置缺失值處理組件  332

\n

13.2.4 配置記錄選擇組件  334

\n

13.2.5 配置數(shù)據(jù)標(biāo)準(zhǔn)化組件  334

\n

13.2.6 配置K-Means組件  336

\n

13.3 小結(jié)  339

\n


本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)