注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)家庭與辦公軟件數(shù)據(jù)天才:數(shù)據(jù)科學(xué)家修煉之道

數(shù)據(jù)天才:數(shù)據(jù)科學(xué)家修煉之道

數(shù)據(jù)天才:數(shù)據(jù)科學(xué)家修煉之道

定 價:¥85.00

作 者: [美] Vincent Granville(文森特·格蘭維爾) 著;吳博,張曉峰,季春霖 譯
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 計算機?網(wǎng)絡(luò) 計算機期刊雜志

ISBN: 9787121308833 出版時間: 2017-05-01 包裝: 平裝
開本: 16開 頁數(shù): 356 字數(shù):  

內(nèi)容簡介

  這是一本跟數(shù)據(jù)科學(xué)和數(shù)據(jù)科學(xué)家有關(guān)的“手冊”,它還包含傳統(tǒng)統(tǒng)計學(xué)、編程或計算機科學(xué)教科書中所沒有的信息?!稊?shù)據(jù)天才:數(shù)據(jù)科學(xué)家修煉之道》有3個組成部分:一是多層次地討論數(shù)據(jù)科學(xué)是什么,以及數(shù)據(jù)科學(xué)涉及哪些其他學(xué)科;二是數(shù)據(jù)科學(xué)的技術(shù)應(yīng)用層面,包括教程和案例研究;三是給正在從業(yè)和有抱負的數(shù)據(jù)科學(xué)家介紹一些職業(yè)資源。《數(shù)據(jù)天才:數(shù)據(jù)科學(xué)家修煉之道》中有很多職業(yè)和培訓(xùn)相關(guān)資源(如數(shù)據(jù)集、網(wǎng)絡(luò)爬蟲源代碼、數(shù)據(jù)視頻和如何編寫API),所以借助《數(shù)據(jù)天才:數(shù)據(jù)科學(xué)家修煉之道》,你現(xiàn)在就可以開始數(shù)據(jù)科學(xué)實踐,并快速地提升你的職業(yè)水平?!稊?shù)據(jù)天才:數(shù)據(jù)科學(xué)家修煉之道》是寫給數(shù)據(jù)科學(xué)家和相關(guān)專業(yè)人士的(如業(yè)務(wù)分析師、計算機科學(xué)家、軟件工程師、數(shù)據(jù)工程師和統(tǒng)計學(xué)家),也適合有興趣轉(zhuǎn)投大數(shù)據(jù)科學(xué)事業(yè)的人閱讀。

作者簡介

  Vincent Granville博士,是一名富有遠見的數(shù)據(jù)科學(xué)家,有 15 年大數(shù)據(jù)、預(yù)測建模、數(shù)字分析和業(yè)務(wù)分析的經(jīng)驗。Vincent 在評分技術(shù)、欺詐檢測和網(wǎng)絡(luò)流量優(yōu)化及增長等領(lǐng)域,是舉世公認的專家。在過去的 10 年中,他曾與 Visa 一起研究實時信用卡欺詐檢測,與CNET一起研究廣告組合優(yōu)化,與Microsoft(微軟公司)一起研究“改變點檢測”,與Wells Fargo(富國銀行)一起研究在線用戶體驗,與InfoSpace一起研究搜索智能,與eBay一起研究自動競價,與各大搜索引擎、廣告網(wǎng)絡(luò)和大型廣告客戶一起研究點擊欺詐檢測。Vincent 也管理著LinkedIn上龐大的“大數(shù)據(jù)及分析數(shù)據(jù)科學(xué)家”小組,該小組擁有超過100 000名成員。近期,Vincent推出了數(shù)據(jù)科學(xué)中心(Data Science Center)這個大數(shù)據(jù)、業(yè)務(wù)分析和數(shù)據(jù)科學(xué)界的領(lǐng)先社區(qū)。Vincent曾是劍橋大學(xué)和美國國家統(tǒng)計科學(xué)學(xué)院的博士后。他曾入圍沃頓商業(yè)計劃競賽和比利時數(shù)學(xué)奧林匹克的決賽。Vincent 已經(jīng)在統(tǒng)計期刊上發(fā)表了40篇論文,并且是許多國際會議的受邀演講嘉賓。他還開發(fā)了一種新的數(shù)據(jù)挖掘技術(shù),被稱為隱性決策樹,他還擁有多項專利,是發(fā)表數(shù)據(jù)科學(xué)書籍的第1人,并籌集了600萬美元的創(chuàng)業(yè)啟動資金。根據(jù)福布斯的排名,Vincent 是大數(shù)據(jù)領(lǐng)域前20位有影響力的人物之一,被VentureBeat、MarketWatch和美國有線新聞網(wǎng)(CNN)專門報道。吳博,利茲大學(xué)博士后,具備多年機器學(xué)習(xí)研發(fā)、數(shù)據(jù)科學(xué)從業(yè)經(jīng)驗。曾任愛立信大數(shù)據(jù)高級研究員,多家公司數(shù)據(jù)科學(xué)家及數(shù)據(jù)變現(xiàn)業(yè)務(wù)負責(zé)人?,F(xiàn)任深圳市宜遠智能科技有限公司創(chuàng)始人。張曉峰,哈爾濱工業(yè)大學(xué)深圳研究生院計算機科學(xué)與技術(shù)學(xué)院副教授、博士生導(dǎo)師,主要研究方向為數(shù)據(jù)挖掘、隱私保護和機器學(xué)習(xí)等。曾在北大方正研究院、香港大學(xué)電子技術(shù)研究所工作。主持包括國家自然科學(xué)基金面上項目,以及其他省/市縱向、橫向課題十余項。已在國內(nèi)外重要學(xué)術(shù)刊物與會議上發(fā)表SCI/EI索引論文40余篇。季春霖,深圳光啟高等理工研究院聯(lián)合創(chuàng)始人,副院長;深圳市統(tǒng)計學(xué)會副會長;哈佛大學(xué)博士后,杜克大學(xué)統(tǒng)計學(xué)博士,劍橋大學(xué)碩士;廣東省自然科學(xué)基金杰青項目獲得者;發(fā)表包括Science在內(nèi)的論文60余篇,授權(quán)專利400余項。熱衷于貝葉斯統(tǒng)計學(xué)及其應(yīng)用。

圖書目錄

第1章 數(shù)據(jù)科學(xué)是什么 1
-真?zhèn)螖?shù)據(jù)科學(xué)對比 2
- - 偽數(shù)據(jù)科學(xué)的兩個例子 5
- - 新大學(xué)的面貌 7
-數(shù)據(jù)科學(xué)家 10
- - 數(shù)據(jù)科學(xué)家與數(shù)據(jù)工程師 10
- - 數(shù)據(jù)科學(xué)家與統(tǒng)計學(xué)家 12
- - 數(shù)據(jù)科學(xué)家與業(yè)務(wù)分析師 13
-13個真實世界情景中的數(shù)據(jù)科學(xué)應(yīng)用 14
- - 情景1:國家對烈性酒銷售的壟斷結(jié)束后,DUI(酒后駕駛)逮捕量減少 15
- - 情景2:數(shù)據(jù)科學(xué)與直覺 17
- - 情景3:數(shù)據(jù)故障將數(shù)據(jù)變成亂碼 19
- - 情景4:異??臻g的回歸 21
- - 情景5:分析與誘導(dǎo)在提升銷量上有何不同價值 22
- - 情景6:關(guān)于隱藏數(shù)據(jù) 24
- - 情景7:汽油中的鉛會導(dǎo)致高犯罪率。真的嗎 25
- - 情景8:波音787(夢幻客機)問題 26
- - 情景9:NLP的7個棘手句子 27
- - 情景10:數(shù)據(jù)科學(xué)家決定著我們所吃的食品 28
- - 情景11:用較好的相關(guān)性增加亞馬遜的銷售量 30
- - 情景12:檢測Facebook上的假檔案或假“喜歡”數(shù) 32
- - 情景13:餐廳的分析 33
-數(shù)據(jù)科學(xué)的歷史、開拓者和現(xiàn)代趨勢 33
- - 統(tǒng)計學(xué)將會復(fù)興 34
- - 歷史與開拓者 36
- - 現(xiàn)代的趨勢 38
- - 最近的問答討論 40
-總結(jié) 44
第2章 大數(shù)據(jù)的獨特性 45
-兩個大數(shù)據(jù)的問題 45
- - 大數(shù)據(jù)“詛咒” 45
- - 數(shù)據(jù)快速流動問題 50
-大數(shù)據(jù)技術(shù)示例 56
- - 大數(shù)據(jù)問題是數(shù)據(jù)科學(xué)所面臨挑戰(zhàn)的縮影 56
- - 大規(guī)模數(shù)據(jù)集的聚類和分類 58
- - 1億行的Excel 63
-MapReduce不能做什么 67
- - 問題 67
- - 3種解決方案 68
- - 結(jié)論:何時使用MapReduce 69
-溝通問題 70
-數(shù)據(jù)科學(xué):統(tǒng)計學(xué)的終結(jié) 72
- - 8種最差的預(yù)測建模技術(shù) 72
- - 把計算機科學(xué)、統(tǒng)計學(xué)和行業(yè)專業(yè)知識結(jié)合在一起 74
-大數(shù)據(jù)生態(tài)系統(tǒng) 78
-總結(jié) 79
第3章 成為一名數(shù)據(jù)科學(xué)家 80
-數(shù)據(jù)科學(xué)家的主要特征 80
- - 數(shù)據(jù)科學(xué)家的職能 80
- - 橫向與縱向數(shù)據(jù)科學(xué)家 83
-數(shù)據(jù)科學(xué)家的類型 86
- - 偽數(shù)據(jù)科學(xué)家 86
- - 自學(xué)成才的數(shù)據(jù)科學(xué)家 86
- - 業(yè)余數(shù)據(jù)科學(xué)家 87
- - 極限數(shù)據(jù)科學(xué)家 89
-數(shù)據(jù)科學(xué)家人群特征 90
-數(shù)據(jù)科學(xué)方面的培訓(xùn) 91
- - 大學(xué)課程 91
- - 公司和協(xié)會培訓(xùn)項目 95
- - 免費培訓(xùn)項目 96
-數(shù)據(jù)科學(xué)家職業(yè)道路 98
- - 獨立顧問 98
- - 創(chuàng)業(yè)者 105
-總結(jié) 118
第4章 數(shù)據(jù)科學(xué)的技術(shù)(I) 119
-新型指標 120
- - 優(yōu)化數(shù)字營銷活動的指標 121
- - 欺詐檢測的指標 122
-選擇合適的分析工具 124
- - 分析軟件 124
- - 可視化工具 125
- - 實時產(chǎn)品 126
- - 編程語言 128
-可視化 128
- - 用R生成數(shù)據(jù)視頻 129
- - 更復(fù)雜的視頻 133
-無模型的統(tǒng)計建模 134
- - 無模型的統(tǒng)計建模是什么 135
- - 該算法是如何工作的 135
- - 源代碼生成數(shù)據(jù)集 137
-三類指標:中心性、波動性、顛簸性 137
- - 中心性、波動性和顛簸性之間的關(guān)系 138
- - 定義顛簸性 138
- - 在Excel中計算顛簸性 139
- - 使用顛簸系數(shù) 141
-大數(shù)據(jù)的統(tǒng)計聚類 141
-大數(shù)據(jù)的相關(guān)性和擬合度 143
- - 一系列新的秩相關(guān)性 146
- - 漸近分布與歸一化 148
- - -計算復(fù)雜度 152
- - 計算q(n) 152
- - 理論上的解決方案 155
-結(jié)構(gòu)系數(shù) 156
-確定簇的數(shù)量 157
- - 方法 157
- - 例子 158
-網(wǎng)絡(luò)拓撲映射 159
-安全通信:數(shù)據(jù)加密 163
-總結(jié) 166
第5章 數(shù)據(jù)科學(xué)的技術(shù)(II) 167
-數(shù)據(jù)字典 168
- - 什么是數(shù)據(jù)字典 168
- - 建立數(shù)據(jù)字典 169
-隱性決策樹 169
- - 實現(xiàn)方法 171
- - 示例:互聯(lián)網(wǎng)流量打分 173
- - 結(jié)論 175
-與模型無關(guān)的置信區(qū)間 175
- - 方法 175
- - 分析橋第一定理 176
- - 應(yīng)用 177
- - 源代碼 178
-隨機數(shù) 179
-解決問題的4個辦法 181
- - 擁有超強直覺能力的業(yè)務(wù)分析師的直觀法 182
- - 軟件工程師的蒙特卡洛模擬法 182
- - 統(tǒng)計學(xué)家的統(tǒng)計建模方法 183
- - 計算機科學(xué)家的大數(shù)據(jù)方法 183
-因果關(guān)系和相關(guān)性 183
-怎樣檢測因果關(guān)系 184
-數(shù)據(jù)科學(xué)項目的生命周期 186
-預(yù)測模型的錯誤 189
-邏輯相關(guān)回歸 191
- - 變量之間的相互作用 191
- - 一階近似 191
- - 二階近似 193
- - 用Excel進行回歸分析 195
-實驗設(shè)計 196
- - 有趣的指標 196
- - 把患者分成不同的人群進行治療 196
- - 私人定制的治療 197
-分析即服務(wù)和應(yīng)用程序接口 198
- - 工作原理 199
- - 實施案例 199
- - 關(guān)鍵詞相關(guān)的API的源代碼 200
-其他主題 204
- - 當(dāng)數(shù)據(jù)庫改變時,保存好數(shù)值 204
- - 優(yōu)化網(wǎng)絡(luò)爬蟲 205
- - 哈希連接 206
- - 用于模擬簇的簡單源代碼 207
-Hadoop和大數(shù)據(jù)的新型合成方差 208
- - Hadoop和MapReduce的介紹 208
- - 綜合指標 209
- - Hadoop、數(shù)值的和統(tǒng)計的穩(wěn)定性 210
- - 方差的抽象概念 211
- - 一個新的大數(shù)據(jù)定理 213
- - 平移不變性的度量標準 214
- - 實現(xiàn):通信和計算成本 214
- - 最終意見 215
-總結(jié) 215
第6章 數(shù)據(jù)科學(xué)應(yīng)用案例研究 217
-股票市場 217
- - 使回報率提高500%的模式 217
- - 優(yōu)化統(tǒng)計交易策略 220
- - 股票交易的API:統(tǒng)計模型 222
- - 股票交易的API:具體實現(xiàn) 225
- - 股票市場模擬 226
- - 些許數(shù)學(xué)知識 229
- - 新趨勢 231
-加密 232
- - 數(shù)據(jù)科學(xué)應(yīng)用:隱寫術(shù) 232
- - 好的電子郵件加密 236
- - 驗證碼破解 239
-欺詐檢測 240
- - 點擊欺詐 241
- - 連續(xù)點擊評分與二進制欺詐/非欺詐 242
- - 數(shù)學(xué)模型與基準 244
- - 虛假轉(zhuǎn)化產(chǎn)生的偏差 245
- - 一些誤解 246
- - 統(tǒng)計面臨的挑戰(zhàn) 246
- - 點擊評分優(yōu)化關(guān)鍵詞出價 247
- - 組合優(yōu)化自動快速的特征選擇 249
- - 特征的預(yù)測能力:交叉驗證 250
- - 勾連檢測和僵尸網(wǎng)絡(luò)的關(guān)聯(lián)規(guī)則檢測 254
- - 模式檢測的極值理論 255
-數(shù)字分析 256
- - 在線廣告:到達率和頻率的計算公式 256
- - 電子郵件營銷:提高300%的性能 257
- - 在7天內(nèi)優(yōu)化關(guān)鍵詞廣告宣傳活動 258
- - 自動新聞提要優(yōu)化 260
- - 用bit-ly進行競爭情報分析 261
- - 測量 Twitter 哈希標簽(hashtag)的收益 263
- - 用3個修補方法提升谷歌搜索 267
- - 改進相關(guān)性的算法 270
- - 廣告循環(huán)問題 272
-雜項 273
- - 簡單模型會獲得更好的銷售預(yù)測 273
- - 更好的醫(yī)療欺詐檢測 275
- - 歸因模型 276
- - 預(yù)測隕石撞擊 277
- - 在路口停車場收集數(shù)據(jù) 281
- - 數(shù)據(jù)科學(xué)的其他應(yīng)用 282
-總結(jié) 282
第7章 踏上你的數(shù)據(jù)科學(xué)職業(yè)之路 283
-面試問題 283
- - 關(guān)于工作經(jīng)驗的問題 283
- - 技術(shù)問題 285
- - 一般性問題 286
- - 關(guān)于數(shù)據(jù)科學(xué)項目的問題 288
-測試你自己的視覺和分析思維 291
- - 通過肉眼的檢測模式 292
- - 識別偏差 294
- - 誤導(dǎo)性的時間序列和隨機游走 295
-從統(tǒng)計學(xué)家到數(shù)據(jù)科學(xué)家 296
- - 數(shù)據(jù)科學(xué)家也是統(tǒng)計從業(yè)人員 297
- - 誰應(yīng)該給數(shù)據(jù)科學(xué)家教統(tǒng)計學(xué) 298
- - 雇傭問題 298
- - 數(shù)據(jù)科學(xué)家與數(shù)據(jù)架構(gòu)師密切合作 299
- - 誰應(yīng)該參與戰(zhàn)略思考 299
- - 兩種類型的統(tǒng)計學(xué)家 300
- - 大數(shù)據(jù)與取樣 301
-數(shù)據(jù)科學(xué)家的分類 302
- - 數(shù)據(jù)科學(xué)最流行的技能集合 302
- - LinkedIn上的頂級數(shù)據(jù)科學(xué)家 306
-400個數(shù)據(jù)科學(xué)家職位頭銜 309
-薪酬調(diào)查 311
- - 根據(jù)技能和位置的薪酬分類 312
- - 創(chuàng)建自己的薪酬調(diào)查表 316
-總結(jié) 317
第8章 數(shù)據(jù)科學(xué)資源 318
-專業(yè)資源 318
- - 數(shù)據(jù)集 318
- - 書籍 319
- - 會議與組織 322
- - 網(wǎng)站 324
- - 概念定義 324
-職業(yè)建設(shè)資源 327
- - 招聘數(shù)據(jù)科學(xué)家的公司 328
- - 數(shù)據(jù)科學(xué)招聘廣告的樣本 329
- - 簡歷樣本 329
-總結(jié) 331

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號