注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡軟件與程序設計R數(shù)據(jù)科學

R數(shù)據(jù)科學

R數(shù)據(jù)科學

定 價:¥139.00

作 者: [新西蘭] 哈德利·威克姆(Hadley Wickham) 著
出版社: 人民郵電出版社
叢編項:
標 簽: 暫缺

ISBN: 9787115486394 出版時間: 2018-08-01 包裝: 平裝
開本: 16開 頁數(shù): 字數(shù):  

內(nèi)容簡介

  本書的目標是教會讀者使用重要的數(shù)據(jù)科學工具,從而為實施數(shù)據(jù)科學奠定堅實的基礎。 讀完本書后,你將掌握R語言的精華,并能夠熟練使用多種工具來解決各種數(shù)據(jù)科學難題。每一章都按照這樣的順序組織內(nèi)容:先給出一些引人入勝的示例,以便你可以整體了解這一章的內(nèi)容,然后再深入細節(jié)。本書的每一節(jié)都配有習題,以幫助你實踐所學到的知識。本書適合R數(shù)據(jù)科學家閱讀

作者簡介

  哈德利·威克姆(Hadley Wickham), RStudio首席科學家,統(tǒng)計學家,斯坦福大學、奧克蘭大學、萊斯大學兼職統(tǒng)計學教授。已被下載數(shù)百萬次的ggplot2等多款知名R包的開發(fā)者,一直致力于讓普羅大眾更容易上手數(shù)據(jù)分析,被R社區(qū)譽為“改變了R的人”。另著有《R包開發(fā)》等書。加勒特·格羅勒芒德(Garrett Grolemund),RStudio數(shù)據(jù)科學家,知名R培訓師,曾受邀在Google、eBay等諸多公司講授R語言和數(shù)據(jù)科學,在DataCamp開授的R相關課程備受R開發(fā)者喜愛。另著有《R語言入門與實踐》。譯者簡介陳光欣,畢業(yè)于清華大學并留校工作,主要興趣為數(shù)據(jù)分析與數(shù)據(jù)挖掘。

圖書目錄

前言XV
第一部分探索
第1章使用ggplot2進行數(shù)據(jù)可視化3
1.1簡介3
1.2第一步4
1.2.1mpg數(shù)據(jù)框4
1.2.2創(chuàng)建ggplot圖形5
1.2.3繪圖模板5
1.2.4練習6
1.3圖形屬性映射6
1.4常見問題10
1.5分面11
1.6幾何對象13
1.7統(tǒng)計變換18
1.8位置調(diào)整21
1.9坐標系25
1.10圖形分層語法27
第2章工作流:基礎29
2.1代碼基礎29
2.2對象名稱30
2.3函數(shù)調(diào)用30
第3章使用dplyr進行數(shù)據(jù)轉換33
3.1簡介33
3.1.1準備工作33
3.1.2nycflights1333
3.1.3dplyr基礎34
3.2使用filter()篩選行35
3.2.1比較運算符36
3.2.2邏輯運算符36
3.2.3缺失值37
3.2.4練習38
3.3使用arrange()排列行39
3.4使用select()選擇列40
3.5使用mutate()添加新變量42
3.5.1常用創(chuàng)建函數(shù)43
3.5.2練習45
3.6使用summarize()進行分組摘要46
3.6.1使用管道組合多種操作46
3.6.2缺失值48
3.6.3計數(shù)49
3.6.4常用的摘要函數(shù)52
3.6.5按多個變量分組56
3.6.6取消分組57
3.6.7練習57
3.7分組新變量(和篩選器)58
第4章工作流:腳本60
4.1運行代碼61
4.2RStudio自動診斷61
第5章探索性數(shù)據(jù)分析63
5.1簡介63
5.2問題64
5.3變動64
5.3.1對分布進行可視化表示65
5.3.2典型值67
5.3.3異常值69
5.3.4練習70
5.4缺失值71
5.5相關變動72
5.5.1分類變量與連續(xù)變量72
5.5.2兩個分類變量77
5.5.3兩個連續(xù)變量79
5.6模式和模型82
5.7ggplot2調(diào)用84
5.8更多學習資源85
第6章工作流:項目86
6.1什么是真實的86
6.2你的分析位于哪里87
6.3路徑與目錄88
6.4RStudio項目88
6.5小結90
第二部分數(shù)據(jù)處理

第7章使用tibble實現(xiàn)簡單數(shù)據(jù)框93
7.1簡介93
7.2創(chuàng)建tibble93
7.3對比tibble與data.frame95
7.3.1打印95
7.3.2取子集96
7.4與舊代碼進行交互96
第8章使用readr進行數(shù)據(jù)導入98
8.1簡介98
8.2入門98
8.2.1與R基礎包進行比較100
8.2.2練習101
8.3解析向量101
8.3.1數(shù)值102
8.3.2字符串103
8.3.3因子105
8.3.4日期、日期時間與時間105
8.3.5練習107
8.4解析文件107
8.4.1策略107
8.4.2問題108
8.4.3其他策略110
8.5寫入文件112
8.6其他類型的數(shù)據(jù)113
第9章使用dplyr處理關系數(shù)據(jù)114
9.1簡介114
9.2nycflights13115
9.3鍵117
9.4合并連接119
9.4.1理解連接120
9.4.2內(nèi)連接121
9.4.3外連接121
9.4.4重復鍵122
9.4.5定義鍵列124
9.4.6練習125
9.4.7其他實現(xiàn)方式126
9.5篩選連接127
9.6連接中的問題129
9.7集合操作130
第10章使用stringr處理字符串131
10.1簡介131
10.2字符串基礎131
10.2.1字符串長度132
10.2.2字符串組合133
10.2.3字符串取子集133
10.2.4區(qū)域設置134
10.2.5練習134
10.3使用正則表達式進行模式匹配135
10.3.1基礎匹配135
10.3.2練習136
10.3.3錨點136
10.3.4練習137
10.3.5字符類與字符選項137
10.3.6練習138
10.3.7重復138
10.3.8練習139
10.3.9分組與回溯引用140
10.3.10練習140
10.4工具140
10.4.1匹配檢測142
10.4.2練習143
10.4.3提取匹配內(nèi)容144
10.4.4練習145
10.4.5分組匹配145
10.4.6練習147
10.4.7替換匹配內(nèi)容147
10.4.8練習147
10.4.9拆分147
10.4.10練習149
10.4.11定位匹配內(nèi)容149
10.5其他類型的模式149
10.6正則表達式的其他應用152
10.7stringi152
第11章使用forcats處理因子154
11.1簡介154
11.2創(chuàng)建因子154
11.3綜合社會調(diào)查156
11.4修改因子水平157
第12章使用lubridate處理日期和時間160
12.1簡介160
12.2創(chuàng)建日期或時間161
12.2.1通過字符串創(chuàng)建161
12.2.2通過各個成分創(chuàng)建162
12.2.3通過其他類型數(shù)據(jù)創(chuàng)建164
12.2.4練習165
12.3日期時間成分165
12.3.1獲取成分165
12.3.2舍入168
12.3.3設置成分168
12.3.4練習170
12.4時間間隔170
12.4.1時期170
12.4.2階段171
12.4.3區(qū)間173
12.4.4小結173
12.4.5練習174
12.5時區(qū)174
第三部分編程
第13章使用magrittr進行管道操作179
13.1簡介179
13.2管道的替代方式179
13.2.1中間步驟180
13.2.2重寫初始對象181
13.2.3函數(shù)組合181
13.2.4使用管道182
13.3不適合使用管道的情形183
13.4magrittr中的其他工具183
第14章函數(shù)185
14.1簡介185
14.2什么時候應該使用函數(shù)186
14.3人與計算機的函數(shù)188
14.4條件執(zhí)行190
14.4.1條件191
14.4.2多重條件192
14.4.3代碼風格192
14.4.4練習193
14.5函數(shù)參數(shù)194
14.5.1選擇參數(shù)名稱195
14.5.2檢查參數(shù)值195
14.5.3點點點(...)197
14.5.4惰性求值197
14.5.5練習198
14.6返回值198
14.6.1顯式返回語句198
14.6.2使得函數(shù)支持管道199
14.7環(huán)境200
第15章向量201
15.1簡介201
15.2向量基礎202
15.3重要的原子向量203
15.3.1邏輯型203
15.3.2數(shù)值型203
15.3.3字符型204
15.3.4缺失值204
15.3.5練習204
15.4使用原子向量205
15.4.1強制轉換205
15.4.2檢驗函數(shù)206
15.4.3標量與循環(huán)規(guī)則206
15.4.4向量命名208
15.4.5向量取子集208
15.4.6練習209
15.5遞歸向量(列表)210
15.5.1列表可視化211
15.5.2列表取子集211
15.5.3調(diào)料列表212
15.5.4練習214
15.6特性214
15.7擴展向量216
15.7.1因子216
15.7.2日期和日期時間216
15.7.3tibble217
15.7.4練習218
第16章使用purrr實現(xiàn)迭代219
16.1簡介219
16.2for循環(huán)220
16.3for循環(huán)的變體222
16.3.1修改現(xiàn)有對象222
16.3.2循環(huán)模式223
16.3.3未知的輸出長度223
16.3.4未知的序列長度224
16.3.5練習225
16.4for循環(huán)與函數(shù)式編程226
16.5映射函數(shù)228
16.5.1快捷方式229
16.5.2R基礎包230
16.5.3練習231
16.6對操作失敗的處理231
16.7多參數(shù)映射233
16.8游走函數(shù)236
16.9for循環(huán)的其他模式237
16.9.1預測函數(shù)237
16.9.2歸約與累計238
16.9.3練習239
第四部分模型
第17章使用modelr實現(xiàn)基礎模型243
17.1簡介243
17.2一個簡單模型244
17.3模型可視化250
17.3.1預測250
17.3.2殘差252
17.3.3練習253
17.4公式和模型族254
17.4.1分類變量255
17.4.2交互項(連續(xù)變量與分類變量)256
17.4.3交互項(兩個連續(xù)變量)259
17.4.4變量轉換261
17.4.5練習264
17.5缺失值264
17.6其他模型族265
第18章模型構建266
18.1簡介266
18.2為什么質(zhì)量差的鉆石更貴267
18.2.1價格與重量268
18.2.2一個更復雜的模型271
18.2.3練習273
18.3哪些因素影響了每日航班數(shù)量273
18.3.1一周中的每一天274
18.3.2季節(jié)性星期六效應277
18.3.3計算出的變量280
18.3.4年度時間:另一種方法281
18.3.5練習282
18.4學習更多模型知識282
第19章使用purrr和broom處理多個模型284
19.1簡介284
19.2列表列285
19.3創(chuàng)建列表列286
19.3.1使用嵌套286
19.3.2使用向量化函數(shù)287
19.3.3使用多值摘要288
19.3.4使用命名列表288
19.3.5練習289
19.4簡化列表列290
19.4.1列表轉換為向量290
19.4.2嵌套還原291
19.4.3練習292
19.5使用broom生成整潔數(shù)據(jù)292
第五部分溝通
第20章RMarkdown295
20.1簡介295
20.2RMarkdown基礎295
20.3使用Markdown格式化文本298
20.4代碼段299
20.4.1代碼段名稱300
20.4.2代碼段選項300
20.4.3表格301
20.4.4緩存301
20.4.5全局選項302
20.4.6內(nèi)聯(lián)代碼303
20.4.7練習303
20.5排錯304
20.6YAML文件頭304
20.6.1文檔參數(shù)304
20.6.2參考文獻與引用306
20.7更多學習資源307
第21章使用ggplot2進行圖形化溝通308
21.1簡介308
21.2標簽309
21.3注釋311
21.4標度316
21.4.1坐標軸刻度與圖例項目316
21.4.2圖例布局318
21.4.3標度替換320
21.4.4練習324
21.5縮放325
21.6主題326
21.7保存圖形328
21.7.1圖形大小328
21.7.2其他重要選項330
21.8更多學習資源330
第22章RMarkdown輸出類型331
22.1簡介331
22.2輸出選項332
22.3文檔332
22.4筆記本333
22.5演示文稿333
22.6儀表盤334
22.7交互元素335
22.7.1htmlwidgets335
22.7.2Shiny336
22.8網(wǎng)站337
22.9其他類型338
22.10更多學習資源338
第23章RMarkdown工作流339
作者簡介341

封面簡介341

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號