注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡網(wǎng)絡與數(shù)據(jù)通信網(wǎng)絡服務增強型分析:AI驅動的數(shù)據(jù)分析、業(yè)務決策與案例實踐

增強型分析:AI驅動的數(shù)據(jù)分析、業(yè)務決策與案例實踐

增強型分析:AI驅動的數(shù)據(jù)分析、業(yè)務決策與案例實踐

定 價:¥89.00

作 者: 彭鴻濤,張宗耀,聶磊
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787111634164 出版時間: 2019-09-01 包裝:
開本: 頁數(shù): 字數(shù):  

內容簡介

  增強型分析是數(shù)據(jù)科學的未來,本書講解了如何通過前沿的大數(shù)據(jù)技術和AI技術實現(xiàn)智能的數(shù)據(jù)分析和業(yè)務決策,即增強型分析。 \n本書的三位作者是來自德勤、前華為和前IBM的資深數(shù)據(jù)科學家,在大數(shù)據(jù)和AI領域至少都有10年以上的工作經(jīng)驗,他們將各自多年來在“構建數(shù)據(jù)挖掘模型,解決實際業(yè)務問題”方面積累的經(jīng)驗全部總結在了這本書中。 \n全書的內容由兩條主線貫穿: \n技術主線:一方面講解了預測模型、序列分析、預測分析、Prescriptive分析等前沿數(shù)據(jù)處理技術,一方面講解了CNN、RNN和GNN等前沿的AI技術如何為數(shù)據(jù)分析賦能。 \n業(yè)務主線:在數(shù)字化轉型的大時代背景下,如何通過數(shù)據(jù)分析實現(xiàn)智慧營銷、智慧風險管控,實現(xiàn)由初級的“主動營銷”到“被動營銷”,再到“全渠道協(xié)同營銷”等營銷手段的升級應用。 \n本書的重點聚焦在本質內容上,即數(shù)據(jù)處理、算法及模型、“模型洞見到業(yè)務決策”的分析等。 \n\n全書共8章: \n第1章:作者結合自己的從業(yè)經(jīng)驗介紹了數(shù)據(jù)科學家的職業(yè)生涯發(fā)展、工作模式和工作方法要點等內容,為有志成為數(shù)據(jù)科學家的讀者指明了道路和方向; \n第2章:從描述性分析的角度講解了數(shù)據(jù)探索、數(shù)據(jù)預處理衍生指標加工方面的技巧; \n第3章:介紹了預測類模型構建時的新方法、新思路、新工具; \n第4章:講解了序列分析的相關內容,包括序列模式、序列規(guī)則、序列預測等的挖掘與應用,用實例的方式說明了算法的原理、特點和使用技巧; \n第5章:介紹了人工智能下一個階段的重點領域,即如何應用數(shù)據(jù)分析做出優(yōu)決策; \n第6~8章:通過與傳統(tǒng)模型的對比,介紹了CNN、RNN、GNN等算法的原理,通過大量的實例說明了這些AI技術在數(shù)據(jù)分析與決策領域的用法和實際效果。 \n\n

作者簡介

  彭鴻濤德勤企業(yè)咨詢總監(jiān)兼首席數(shù)據(jù)科學家,德勤全球AI團隊核心成員,德勤數(shù)字化轉型、智慧營銷、智慧風控、客戶體驗等核心咨詢服務方案的資深顧問。2008年加入SPSS并與跨國家團隊一起進行Analytical Decision Management決策自動化工具的開發(fā),與國內外團隊一起構建了SPSS在不同應用領域的解決方案,其中某些方案現(xiàn)已成長為IBM的知名解決方案;2014年加入IBM GBSC部門,領導數(shù)據(jù)分析團隊,針對不同客戶設計和實施數(shù)據(jù)分析的方案;2016年加入IBM GBSGBS Cognitive Business Decision Support擔任CTO和首席數(shù)據(jù)科學家,領導團隊開發(fā)實施了有一定行業(yè)影響力的人工智能應用;2017年加入德勤企業(yè)咨詢擔任金融服務總監(jiān)及首席數(shù)據(jù)科學家,領導團隊開拓數(shù)字化轉型背景下的新型咨詢服務方案,期間高質量交付大型銀行的數(shù)字化轉型及實施相關項目并得到客戶高度認可。 張宗耀上海全應科技有限公司資深數(shù)據(jù)科學家,前華為企業(yè)智能部門資深數(shù)據(jù)科學家,前IBM SPSS 算法組件團隊資深算法工程師。2009年加入IBM SPSS算法組件團隊,負責Statistic和Modeler產(chǎn)品的升級和維護;2012年開始大數(shù)據(jù)算法組件的設計和開發(fā),為分布式分析引擎提供了核心計算單元,主導完成開發(fā)了分布式平臺下的廣義線性模型、自動建模算法、ADMM優(yōu)化算法等,打造了分析引擎平臺以及SPSS Modeler產(chǎn)品的競爭力算法模塊;2015年開始投入Spark分布式框架的算法設計和開發(fā),主導完成開發(fā)了生存分析算法、時間序列相關算法等,豐富了SPSS產(chǎn)品的核心算法組件。2016年加入華為,先后就職于華為的數(shù)據(jù)挖掘團隊,以及企業(yè)智能部門的機器學習服務團隊和工業(yè)解決方案團隊,負責算法、機器學習、實時預測、數(shù)據(jù)分析,以及行業(yè)解決方案的設計、開發(fā)和部署相關的工作。 聶磊陜西萬禾數(shù)字科技有限公司CTO,前IBM SPSS 資深數(shù)據(jù)科學家,前IBM Watson Analytics數(shù)據(jù)分析引擎技術主管及架構師。2008 年加入IBM Analytical Decision Management團隊,主導開發(fā)了業(yè)務規(guī)則引擎和基于優(yōu)化技術的預測性維護解決方案;2014年加入IBM Watson Analytics團隊,擔任技術主管兼架構師,主導了IBM Watson Analytics數(shù)據(jù)分析引擎基于Spark技術的轉換,極大提高了平臺的計算能力;2017年擔任IBM Cognos Analytics團隊架構師,主持了自動化技術的引入

圖書目錄

推薦序一

\n

推薦序二

\n

前言

\n

第1章 數(shù)據(jù)科學家的成長之路 1

\n

1.1  算法與數(shù)據(jù)科學家   1

\n

1.1.1  數(shù)據(jù)科學、人工智能、機器學習等   2

\n

1.1.2  室內活動還是室外活動 3

\n

1.2  數(shù)據(jù)科學家不斷成長的幾個階段   3

\n

1.2.1  算法——如何構建數(shù)據(jù)分析模型 5

\n

1.2.2  用法——如何回頭看模型   6

\n

1.2.3  業(yè)務——如何產(chǎn)生更大價值 7

\n

1.2.4  戰(zhàn)略——如何更廣 8

\n

1.3  數(shù)據(jù)科學家的工作模式與組織結構 9

\n

1.3.1  數(shù)據(jù)驅動還是業(yè)務驅動 9

\n

1.3.2  數(shù)據(jù)科學家團隊的組織結構 9

\n

1.4  數(shù)據(jù)科學家的工作方法要點   10

\n

第2章 大數(shù)據(jù)探索及預處理  13

\n

2.1  大數(shù)據(jù)探索 13

\n

2.1.1  數(shù)值類型 13

\n

2.1.2  連續(xù)型數(shù)據(jù)的探索 14

\n

2.1.3  分類型數(shù)據(jù)的探索 19

\n

2.1.4  示例:數(shù)據(jù)探索   20

\n

2.2  數(shù)據(jù)預處理 26

\n

2.2.1  數(shù)據(jù)清洗 26

\n

2.2.2  數(shù)據(jù)變換 29

\n

2.2.3  數(shù)據(jù)歸約 41

\n

2.3  衍生指標的加工 44

\n

2.3.1  衍生指標概述 45

\n

2.3.2  將數(shù)值轉化為百分位數(shù) 45

\n

2.3.3  把類別變量替換為數(shù)值 46

\n

2.3.4  多變量組合   47

\n

2.3.5  從時間序列中提取特征 47

\n

第3章 預測模型的新技術 49

\n

3.1  集成學習   49

\n

3.1.1  Averaging方法    49

\n

3.1.2  Boosting方法 51

\n

3.2  Gradient Tree Boosting介紹 53

\n

3.2.1  梯度與梯度下降   53

\n

3.2.2  Gradient Tree Boosting算法的原理 55

\n

3.3  Gradient Tree Boosting的改進方向   57

\n

3.3.1  Gradient Tree Boosting的使用要點 57

\n

3.3.2  Regularization   59

\n

3.3.3  XGBoost介紹  60

\n

3.4  模型的最佳參數(shù)設置 60

\n

3.5  投票決定最終預測結果   65

\n

3.6  讓模型在訓練結束后還能被更新   66

\n

3.6.1  熱啟動   67

\n

3.6.2  增量學習 67

\n

3.7  多輸出預測 68

\n

3.7.1  Binary Relevance 69

\n

3.7.2  Classifier Chain 70

\n

3.7.3  Ensemble Classifier Chain    70

\n

3.8  案例:如何給客戶從數(shù)百個產(chǎn)品中尋找合適的產(chǎn)品   71

\n

3.8.1  問題提出 72

\n

3.8.2  建模思路 72

\n

3.8.3  模型訓練及應用   73

\n

第4章 序列分析 76

\n

4.1  通過客戶行為研究做出服務策略   76

\n

4.2  頻繁項集、關聯(lián)規(guī)則的挖掘   77

\n

4.2.1  基本概念 77

\n

4.2.2  頻繁或稀疏項集的挖掘 78

\n

4.2.3  關聯(lián)規(guī)則的挖掘   86

\n

4.3  序列模式的挖掘以及應用 88

\n

4.3.1  換種視角觀察項間的順序   88

\n

4.3.2  “事無巨細”還是“事有巨細” 89

\n

4.3.3  序列挖掘的相關算法介紹   92

\n

4.3.4  示例:挖掘購買物品的序列模式 96

\n

4.4  序列規(guī)則的挖掘以及應用 101

\n

4.4.1  將頻繁序列通過業(yè)務解讀轉換為行動指南 101

\n

4.4.2  序列規(guī)則的挖掘實現(xiàn)行動指南   102

\n

4.4.3  序列規(guī)則的挖掘算法   102

\n

4.4.4  示例:通過客戶購買產(chǎn)品的序列推薦合適的產(chǎn)品   104

\n

4.5  序列預測的挖掘以及應用 107

\n

4.5.1  序列規(guī)則與序列預測的關系 107

\n

4.5.2  序列預測算法的介紹   108

\n

4.5.3  示例:客戶下一步會做什么 110

\n

第5章 應用數(shù)據(jù)分析做出最優(yōu)決策 114

\n

5.1  Prescriptive分析概述   114

\n

5.1.1  業(yè)務分析的3個層次   115

\n

5.1.2  為什么需要Prescriptive分析  116

\n

5.1.3  什么時候需要Prescriptive分析 117

\n

5.2  確定因素和非確定因素下的決策分析   118

\n

5.3  What-If分析和Goal Seeking分析 121

\n

5.4  優(yōu)化技術介紹   122

\n

5.4.1  數(shù)據(jù)挖掘算法中常用的優(yōu)化技術 122

\n

5.4.2  優(yōu)化問題求解工具介紹 127

\n

5.4.3  CVXPY優(yōu)化工具在機器學習算法中的應用  130

\n

5.4.4  應用優(yōu)化技術尋找最優(yōu)產(chǎn)品推薦 134

\n

5.5  仿真分析   135

\n

5.5.1  蒙特卡洛的介紹   135

\n

5.5.2  采用蒙特卡洛方法進行重采樣   137

\n

5.6  馬爾可夫鏈及馬爾可夫決策過程   143

\n

5.6.1  馬爾可夫過程及馬爾可夫鏈 145

\n

5.6.2  馬爾可夫決策過程及應用工具   148

\n

5.6.3  應用馬爾可夫決策過程研究營銷策略及客戶生命周期價值   151

\n

第6章 深入探討CNN 155

\n

6.1  換個角度討論CNN    155

\n

6.1.1  卷積是在做什么   156

\n

6.1.2  人臉檢測與人臉識別   159

\n

6.1.3  深度學習意味著什么   165

\n

......

\n


本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號