注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書經(jīng)濟管理經(jīng)濟貿(mào)易經(jīng)濟數(shù)據(jù)挖掘:你必須知道的32個經(jīng)典案例(第2版)

數(shù)據(jù)挖掘:你必須知道的32個經(jīng)典案例(第2版)

數(shù)據(jù)挖掘:你必須知道的32個經(jīng)典案例(第2版)

定 價:¥59.00

作 者: 任昱衡 等
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787121351129 出版時間: 2018-10-01 包裝: 平裝
開本: 16開 頁數(shù): 288 字數(shù):  

內(nèi)容簡介

  本書是為廣大數(shù)據(jù)分析師量身定制的入門讀物,它旨在幫助讀者站在大數(shù)據(jù)時代的制高點。數(shù)據(jù)分析處于統(tǒng)計學、計算機信息科學、運籌學、數(shù)據(jù)庫等多個領域的交叉地帶,大數(shù)據(jù)時代的到來大大豐富了數(shù)據(jù)分析的內(nèi)涵,數(shù)據(jù)分析師的職責與以往相比發(fā)生了巨大的改變。本書全面介紹了經(jīng)典數(shù)據(jù)分析、模式識別、機器學習、深度學習、數(shù)據(jù)挖掘、商務智能等多個領域的數(shù)據(jù)分析算法,將大數(shù)據(jù)時代的數(shù)據(jù)分析熱點技術一網(wǎng)打盡。本書為每個數(shù)據(jù)分析算法都搭配了一個經(jīng)典案例,并按照由易到難的原則構建知識框架,充分照顧了不同水平讀者的閱讀習慣。通過閱讀本書,讀者將對大數(shù)據(jù)時代下的數(shù)據(jù)分析有一個全面的認識。無論是入門級的數(shù)據(jù)分析員還是有一定基礎的數(shù)據(jù)分析師,都能通過本書完善、加深對數(shù)據(jù)分析的認識。

作者簡介

  任昱衡,博士,副研究員,高級電子商務師,高級硬件工程師,中國電子商務協(xié)會電子商務研究院副院長,中國電子商務協(xié)會信用體系建設管理中心主任助理,中國電子商務師資質(zhì)(職稱)認證管理中心主任助理。參與國家多項電子商務法律、法規(guī)、標準制定工作,目前主要負責國家電子商務師職業(yè)水平(職稱)認證體系的構建和國家電子商務行業(yè)企業(yè)信用監(jiān)督工作。

圖書目錄

第1章 經(jīng)典的探索性數(shù)據(jù)分析案例 1

1.1 探索性數(shù)據(jù)分析綜述 2

1.1.1 什么是探索性數(shù)據(jù)分析 2

1.1.2 如何收集數(shù)據(jù) 4

1.1.3 數(shù)據(jù)預處理技術 5

1.2 數(shù)據(jù)巧收集――紅牛的大數(shù)據(jù)營銷案例 8

1.2.1 狀況百出的紅牛企業(yè) 8

1.2.2 紅牛企業(yè)巧妙收集消費者數(shù)據(jù) 9

1.2.3 數(shù)據(jù)收集小結 12

1.3 數(shù)據(jù)可視化――數(shù)據(jù)新聞促使英軍撤軍 13

1.3.1 維基解密帶來的海量數(shù)據(jù) 13

1.3.2 百花齊放的數(shù)據(jù)新聞 15

1.3.3 數(shù)據(jù)可視化小結 18

1.4 異常值分析――Facebook消滅釣魚鏈接 19

1.4.1 Facebook和廣告商之間的拉鋸戰(zhàn) 20

1.4.2 異常值分析指導排名算法工作 22

1.4.3 異常值分析小結 26

1.5 對比分析――TrueCar指導購物者尋找最合算的車價 27

1.5.1 火中取栗的TrueCar網(wǎng)站 28

1.5.2 數(shù)據(jù)對比贏得消費者信賴 29

1.5.3 對比分析小結 32

第2章 經(jīng)典的相關分析與回歸分析案例 35

2.1 相關回歸綜述 36

2.1.1 相關回歸簡介 36

2.1.2 相關性分析的發(fā)展介紹 38

2.1.3 回歸分析的發(fā)展介紹 39

2.2 皮爾遜相關值――紐約市政府利用相關分析監(jiān)控違法建筑 40

2.2.1 簡約而不簡單的消防檢測系統(tǒng) 40

2.2.2 使用相關分析洞察60個變量的關系 42

2.2.3 相關分析小結 45

2.3 時間序列分析――人壽保險的可提費用預測 47

2.3.1 人壽保險公司和可提費用 47

2.3.2 使用4種時間序列回歸預測模型解決問題 49

2.3.3 時間序列分析小結 52

2.4 線性回歸分析――梅西百貨公司的12項大數(shù)據(jù)策略 54

2.4.1 從“一億豪賭”說起的零售商困境 54

2.4.2 SAS公司幫助梅西百貨構建模型 56

2.4.3 線性回歸分析小結 59

2.5 Logistic回歸分析――大面積流感爆發(fā)的預測分析 62

2.5.1 究竟誰才是流感預測算法之王 62

2.5.2 向Logistic算法中引入更多變量 64

2.5.3 Logistic回歸分析小結 67

第3章 經(jīng)典的降維數(shù)據(jù)分析案例 69

3.1 降維分析算法綜述 70

3.1.1 為什么要使用降維算法 70

3.1.2 線性降維算法 72

3.1.3 非線性降維算法 73

3.2 粗糙集算法――協(xié)助希臘工業(yè)發(fā)展銀行制定信貸政策 74

3.2.1 銀行信貸政策的制定原則 75

3.2.2 粗糙集算法的原理和應用 76

3.2.3 粗糙集算法小結 80

3.3 因子分析――基于李克特量表的應聘評價法 82

3.3.1 源于智力測試的因子分析 82

3.3.2 使用因子分析解構問卷 84

3.3.3 因子分析小結 87

3.4 最優(yōu)尺度分析――直觀評估消費者傾向的分析方法 89

3.4.1 市場調(diào)查問題催生的最優(yōu)尺度分析 89

3.4.2 6種經(jīng)典的最優(yōu)尺度分析解讀方法 91

3.4.3 最優(yōu)尺度分析小結 95

3.5 PCA降維算法――智能人臉識別的應用與拓展 97

3.5.1 刷臉的時代來了 97

3.5.2 使用PCA算法完成降維工作 99

3.5.3 PCA算法小結 102

第4章 經(jīng)典的模式識別案例 105

4.1 模式識別綜述 106

4.1.1 模式識別簡介 106

4.1.2 模式識別的發(fā)展脈絡 107

4.1.3 模式識別應用簡介 110

4.2 圖像分析――谷歌的超前自動駕駛技術 111

4.2.1 以安全的名義呼吁自動駕駛技術 111

4.2.2 快速成熟的無人駕駛技術 113

4.2.3 圖像分析小結 116

4.3 遺傳算法――經(jīng)典的人力資源優(yōu)化問題 118

4.3.1 使用有限資源實現(xiàn)利益最大化 118

4.3.2 遺傳算法的計算過程 120

4.3.3 遺傳算法小結 123

4.4 決策樹分析――“沸騰時刻”準確判斷用戶健康水平 124

4.4.1 打造我國最大的健身平臺 124

4.4.2 信息增益和決策樹 126

4.4.3 決策樹小結 129

4.5 K均值聚類分析――HSE24通過為客戶分類降低退貨率 131

4.5.1 在電子商務市場快速擴張的HSE24 131

4.5.2 使用K均值聚類為客戶分類 133

4.5.3 K均值聚類小結 136

第5章 經(jīng)典的機器學習案例 139

5.1 機器學習綜述 140

5.1.1 機器學習簡介 140

5.1.2 機器學習的主流發(fā)展和應用 142

5.2 語義搜索――沃爾瑪搜索引擎提升15%銷售額 143

5.2.1 注重用戶體驗的沃爾瑪公司 144

5.2.2 語義搜索引擎的底層技術和原理 145

5.2.3 語義搜索技術小結 148

5.3 順序分析――搜狗輸入法的智能糾錯系統(tǒng) 150

5.3.1 搜狗輸入法的王牌詞庫和智能算法 151

5.3.2 頻繁樹模式和順序分析算法 153

5.3.3 順序分析小結 156

5.4 文本分析――經(jīng)典的垃圾郵件過濾系統(tǒng) 158

5.4.1 大數(shù)據(jù)時代需要文本分析工作 158

5.4.2 垃圾郵件過濾中的分詞技術和詞集模型 160

5.4.3 文本分析小結 163

5.5 協(xié)同過濾――構建個性化推薦系統(tǒng)的經(jīng)典算法 164

5.5.1 協(xié)同過濾算法為什么這么流行 165

5.5.2 基于用戶和基于產(chǎn)品的協(xié)同過濾 166

5.5.3 協(xié)同過濾算法小結 169

第6章 經(jīng)典的深度學習案例 171

6.1 深度學習綜述 172

6.1.1 深度學習簡介 172

6.1.2 深度學習在圖像處理方面的應用 174

6.1.3 深度學習在自然語言處理方面的應用 176

6.2 支持向量機――喬布斯利用大數(shù)據(jù)對抗癌癥 178

6.2.1 喬布斯和胰腺癌的抗爭 178

6.2.2 醫(yī)學統(tǒng)計學和支持向量機 180

6.2.3 支持向量機小結 184

6.3 感知器神經(jīng)網(wǎng)絡――最佳的房產(chǎn)價格預測算法 185

6.3.1 如何預測房價 186

6.3.2 多層感知器和誤差曲面 188

6.3.3 感知器神經(jīng)網(wǎng)絡小結 191

6.4 自組織神經(jīng)網(wǎng)絡――如何又快又好地解決旅行商問題 193

6.4.1 最優(yōu)路徑問題的典型模式和解決方法 193

6.4.2 自組織神經(jīng)網(wǎng)絡的拓撲結構和權值調(diào)整 194

6.4.3 自組織神經(jīng)網(wǎng)絡小結 198

6.5 RBM算法――為新聞報道智能分類 199

6.5.1 新聞報道智能分類的難與易 199

6.5.2 RBM算法的學習目標和學習方法 201

6.5.3 RBM算法小結 204

第7章 經(jīng)典的數(shù)據(jù)挖掘案例 207

7.1 數(shù)據(jù)挖掘綜述 208

7.1.1 什么是數(shù)據(jù)挖掘 208

7.1.2 數(shù)據(jù)挖掘的主要應用領域 209

7.1.3 數(shù)據(jù)挖掘模型的評價指標 211

7.2 判別分析――美國運通構建客戶流失預測模型 213

7.2.1 美國運通公司的舊日輝煌 213

7.2.2 判別分析的假設條件和判別函數(shù) 214

7.2.3 判別分析小結 218

7.3 購物籃分析――找出零售業(yè)的最佳商品組合 220

7.3.1 名動天下的“啤酒和尿布”案例 220

7.3.2 購物籃分析的頻繁模式 222

7.3.3 購物籃分析小結 225

7.4 馬爾可夫鏈――準確預測客運市場占有率 227

7.4.1 復雜的客運市場系統(tǒng) 227

7.4.2 概率轉移矩陣的求解方法 229

7.4.3 馬爾可夫鏈小結 232

7.5 AdaBoost元算法――有效偵測欺詐交易的復合算法 233

7.5.1 弱分類器和強分類器之爭 233

7.5.2 AdaBoost元算法的分類器構建方法 235

7.5.3 AdaBoost元算法小結 238

第8章 經(jīng)典的商業(yè)智能分析案例 241

8.1 商業(yè)智能分析綜述 242

8.1.1 什么是商業(yè)智能 242

8.1.2 商業(yè)智能的主流發(fā)展與應用 244

8.2 KXEN分析軟件――構建歐洲博彩業(yè)下注預測平臺 246

8.2.1 現(xiàn)代博彩業(yè)背后的黑手 247

8.2.2 集體智慧和莊家賠率的聯(lián)系 248

8.2.3 KXEN軟件小結 252

8.3 數(shù)據(jù)廢氣再利用――物流公司數(shù)據(jù)成功用于評估客戶信用 253

8.3.1 數(shù)據(jù)廢氣和黑暗數(shù)據(jù)的異同 254

8.3.2 論如何充分利用物流公司數(shù)據(jù) 255

8.3.3 數(shù)據(jù)廢氣再利用小結 258

8.4 必應預測――使用往期信息預測自然災害 259

8.4.1 預測自然災害的必要性 260

8.4.2 微軟大數(shù)據(jù)預測的優(yōu)與劣 261

8.4.3 必應預測小結 263

8.5 點球成金――助力NBA大數(shù)據(jù)分析的多種神秘軟件 265

8.5.1 NBA的有效球員數(shù)據(jù) 265

8.5.2 有關點球成金的靠譜方法 268

8.5.3 點球成金小結 270

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號