注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡(luò)軟件與程序設(shè)計R語言數(shù)據(jù)高效處理指南

R語言數(shù)據(jù)高效處理指南

R語言數(shù)據(jù)高效處理指南

定 價:¥59.00

作 者: 黃天元 著
出版社: 北京大學出版社
叢編項:
標 簽: 暫缺

ISBN: 9787301306086 出版時間: 2019-09-01 包裝: 平裝
開本: 16開 頁數(shù): 212 字數(shù):  

內(nèi)容簡介

  R 語言在近10 年來已經(jīng)發(fā)生了日新月異的變化,不僅在內(nèi)容上更加豐富多彩,而且在計算效率上也有了大幅的提升。它被更加廣泛地用于數(shù)據(jù)可視化、統(tǒng)計建模、機器學習等領(lǐng)域,而且還能實現(xiàn)網(wǎng)絡(luò)爬蟲、網(wǎng)絡(luò)應(yīng)用開發(fā)等功能,成為數(shù)據(jù)科學領(lǐng)域的全能型工具。R 語言在學術(shù)界的地位已經(jīng)不容置疑,在大數(shù)據(jù)時代中它是保證研究可重復(fù)性的重要工具。隨著功能的日益完善,R 語言已經(jīng)進軍工業(yè)界,并在金融、保險、醫(yī)療、生物和信息計量等不同的應(yīng)用場景中大放異彩,潛力不可估量?!”M管R 語言能夠?qū)崿F(xiàn)豐富多樣的實際功能和框架,但是其本質(zhì)是面向數(shù)據(jù)的,因此數(shù)據(jù)處理是R 語言核心中的核心。如果能夠掌握高效的數(shù)據(jù)操作技術(shù),就能夠在各類數(shù)據(jù)分析任務(wù)中如魚得水。本書定位即為“R 語言數(shù)據(jù)處理101”,希望R 語言的使用者能夠在較早的階段就習得基本而有效的數(shù)據(jù)處理基本技術(shù)?! 禦語言數(shù)據(jù)高效處理指南》讀者群體包括在校的大學生、數(shù)據(jù)分析從業(yè)人員和致力于更加高效地處理數(shù)據(jù)的所有的R語言使用者。盡管對數(shù)據(jù)科學、計算機編程、統(tǒng)計學有一定基礎(chǔ)會幫助理解本書的內(nèi)容,但這不是必需的,來自包括初學者在內(nèi)的各個層次的讀者群體都能從本書中有所收獲。讀者在本書中不僅能夠?qū)W到數(shù)據(jù)處理中的實用技術(shù),還能培養(yǎng)在數(shù)據(jù)分析中的探索性思維??梢宰鳛榱慊A(chǔ)學習數(shù)據(jù)分析的教程、進階數(shù)據(jù)分析實用技巧的參考書、常備查詢的案頭工具書,以及具有一定趣味性的數(shù)據(jù)分析入門啟蒙書。

作者簡介

  黃天元,復(fù)旦大學生態(tài)學博士在讀,R語言忠實愛好者。熱愛數(shù)據(jù)科學與開源工具,致力于利用數(shù)據(jù)科學迅速積累行業(yè)經(jīng)驗優(yōu)勢和科學知識發(fā)現(xiàn),涉獵內(nèi)容包括但不限于信息計量、機器學習、數(shù)據(jù)可視化、統(tǒng)計建模、知識圖譜等。已發(fā)表SCI論文兩篇,開設(shè)有知乎專欄“R語言數(shù)據(jù)挖掘”。

圖書目錄

第1 部分 基礎(chǔ)知識...................1
第1 章 數(shù)據(jù)處理總論.......................... 2
1.1 數(shù)據(jù)處理的定義 ....................2
1.2 數(shù)據(jù)處理的意義 ...................3
1.3 數(shù)據(jù)處理基本工具 ..................3
第2 章 R 語言編程基礎(chǔ).................. 6
2.1 下載安裝 ...................6
2.2 包的使用 ..................7
2.3 數(shù)據(jù)類型 .........................8
2.4 數(shù)據(jù)結(jié)構(gòu) ........................10
2.5 程序控制 ........................15
2.6 函數(shù)式編程 ....................17
第3 章 數(shù)據(jù)處理基本范式....................... 19
第2 部分 快速入門...................24
第4 章 base-r:基本數(shù)據(jù)處理................. 25
4.1 數(shù)據(jù)集及其基本探索 .....................25
4.2 基本范式實現(xiàn) ................27
4.2.1 創(chuàng)建(read.csv/data.frame) ................................27
4.2.2 刪除(rm) .........................28
4.2.3 檢索(DF[i,j]) ...................28
4.2.4 插入(rbind/cbind) ........................31
4.2.5 排序(order) .....................33
4.2.6 過濾(DF[condition,]) ...................35
4.2.7 匯總(apply) .....................36
4.2.8 分組(aggregate) ...........................36
4.2.9 連接(merge) ....................37
第5 章 tidyverse 生態(tài)系統(tǒng):簡潔高效數(shù)據(jù)處理.................... 40
5.1 tidyverse 生態(tài)系統(tǒng)簡介 ........................40
5.2 基本范式實現(xiàn) ............................41
5.2.1 包的加載(p_load) ........................41
5.2.2 創(chuàng)建(read_csv/tibble) ..................42
5.2.3 刪除(rm) .........................45
5.2.4 檢索(select/slice) .........................46
5.2.5 插入(add/bind) ................50
5.2.6 排序(arrange) ..................54
5.2.7 過濾(filter) ......................56
5.2.8 匯總(summarise) .........................59
5.2.9 分組(group_by) ...........................61
5.2.10 連接(join) .....................63
5.3 高級處理工具 ................67
5.3.1 長寬數(shù)據(jù)變換(gather/spread) ..........................68
5.3.2 集合運算(intersect/union/setdiff) .....................70
5.3.3 窗口函數(shù)(rank/lead/lag/cum) ...........................74
5.3.4 連接數(shù)據(jù)庫:對SQL 的支持(dbplyr) .........................81
5.3.5 巧妙寫函數(shù):變量的引用 ...............85
第3 部分 高級進階...................93
第6 章 data.table:高速數(shù)據(jù)處理............... 94
6.1 data.table 簡介 ...............94
6.2 基本范式實現(xiàn) ................96
6.3 高級特性探索 ............................... 116
第7 章 sparklyr: 分布式數(shù)據(jù)處理.................................. 128
7.1 連接R 與Spark:sparklyr 包簡介 ...............................128
7.2 基本操作指南 ...............................130
7.3 存儲機制簡介 ...............................135
7.4 分布式計算 ..................136
第4 部分 實戰(zhàn)應(yīng)用................. 139
第8 章 航班飛行數(shù)據(jù)演練..................... 140
8.1 nycflights13 數(shù)據(jù)集探索 ...........................140
8.2 flights14 數(shù)據(jù)集探索 ....................148
第9 章 測試..................... 155
第10 章 實用數(shù)據(jù)處理技巧..................... 157
10.1 數(shù)據(jù)存取 ....................157
10.1.1 令人頭疼的編碼格式(encoding) ..............................157
10.1.2 讀寫性能競速賽(fst/feather & data.table/readr) ....................158
10.1.3 數(shù)據(jù)存取轉(zhuǎn)換的瑞士軍刀(rio) ...................162
10.2 并行計算(doParallel) .........................164
10.3 混合編程 ....................168
第11 章 實戰(zhàn)案例:網(wǎng)絡(luò)爬蟲與文本挖掘............................. 173
11.1 網(wǎng)絡(luò)爬?。╮vest) .....................174
11.2 文本挖掘(tidytext).................177
第12 章 實戰(zhàn)案例:數(shù)據(jù)塑型與可視化(ggplot2).....................180
12.1 數(shù)據(jù)準備 ....................181
12.2 柱狀圖(geom_bar) .................182
12.3 折線圖(geom_line) ................183
12.4 餅圖(ggpie) ............................184
12.5 一行代碼實現(xiàn)一頁多圖(gridExtra) .......................186
第13 章 實戰(zhàn)案例:機器學習.................. 193
13.1 機器學習概述 .............................193
13.2 為什么要做機器學習 .................193
13.3 如何入門機器學習 .....................194
13.4 數(shù)據(jù)處理與機器學習 .................195
13.5 案例分析:信貸風險預(yù)測模型構(gòu)建 ...........................195
致謝..............................204

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號