定 價:¥59.00
作 者: | 劉鵬,程顯毅,孫麗麗,林道榮 |
出版社: | 清華大學(xué)出版社 |
叢編項: | 大數(shù)據(jù)應(yīng)用人才培養(yǎng)系列教材 |
標(biāo) 簽: | 暫缺 |
ISBN: | 9787302610229 | 出版時間: | 2022-07-01 | 包裝: | |
開本: | 頁數(shù): | 字?jǐn)?shù): |
第1 章 緒論
1.1 R 語言概述 1
1.1.1 R 語言現(xiàn)狀 1
1.1.2 R 語言主要優(yōu)勢 2
1.1.3 學(xué)R 語言的理由 3
1.2 新手上路 4
1.3 R 語言開發(fā)環(huán)境部署 5
1.3.1 安裝R 5
1.3.2 安裝RStudio 6
1.4 獲取幫助 8
1.5 工作空間 8
1.6 腳本 9
1.7 R 包 9
習(xí)題 10
第2 章 基本語法
2.1 變量 11
2.1.1 變量及其作用 11
2.1.2 變量命名 12
2.1.3 變量賦值 12
2.1.4 變量值輸出 12
2.2 常量 13
2.2.1 邏輯常量 13
2.2.2 符號常量 13
2.2.3 標(biāo)量 13
2.3 向量 15
2.3.1 向量產(chǎn)生 15
2.3.2 向量引用 16
2.3.3 向量化運算 16
XII R 語言(第2 版)
2.3.4 向量排序 17
2.4 運算符 18
2.4.1 算術(shù)運算符 18
2.4.2 關(guān)系運算符 18
2.4.3 邏輯運算符 19
2.4.4 其他運算符 20
2.5 命令 20
2.6 重要內(nèi)置函數(shù) 21
習(xí)題 23
第3 章 數(shù)據(jù)類型
3.1 基本數(shù)據(jù)類型 27
3.2 結(jié)構(gòu)數(shù)據(jù)類型 28
3.2.1 矩陣 28
3.2.2 數(shù)組 30
3.2.3 數(shù)據(jù)框 32
3.2.4 因子 33
3.2.5 列表 34
3.3 字符串操作 35
3.3.1 分割 35
3.3.2 拼接 35
3.3.3 正則表達(dá)式 36
3.3.4 替換 39
3.3.5 提取 42
3.3.6 測定字符串長度 42
3.3.7 匹配 43
3.4 數(shù)據(jù)類型判斷和轉(zhuǎn)換 43
3.5 日期和時間數(shù)據(jù)操作 44
3.5.1 日期數(shù)據(jù)基本操作 44
3.5.2 時間數(shù)據(jù)基本操作 45
習(xí)題 45
第4 章 數(shù)據(jù)導(dǎo)入導(dǎo)出
4.1 數(shù)據(jù)導(dǎo)入 49
4.1.1 鍵盤輸入數(shù)據(jù) 49
目 錄 XIII
4.1.2 導(dǎo)入文本文件 50
4.1.3 導(dǎo)入csv 文件 51
4.1.4 導(dǎo)入Excel 文件 51
4.1.5 導(dǎo)入數(shù)據(jù)庫文件 51
4.2 數(shù)據(jù)導(dǎo)出 52
4.2.1 導(dǎo)出文本文件 52
4.2.2 保存圖片 53
習(xí)題 53
第5 章 數(shù)據(jù)可視化
5.1 一圖勝千言 55
5.2 低水平繪圖命令 56
5.2.1 點圖 56
5.2.2 線圖 58
5.2.3 面圖 60
5.3 高水平繪圖命令 63
5.3.1 認(rèn)識ggplot2 63
5.3.2 幾何對象 63
5.3.3 映射 64
5.3.4 統(tǒng)計對象 66
5.3.5 標(biāo)度 67
5.3.6 分面 68
5.3.7 其他修飾 69
5.4 交互式繪圖命令 72
5.4.1 rCharts 包 72
5.4.2 plotly 包 74
5.4.3 Shiny 76
5.5 數(shù)據(jù)可視化圖形選擇建議 83
習(xí)題 84
第6 章 數(shù)據(jù)清洗
6.1 缺失值分析 87
6.1.1 缺失值檢測 87
6.1.2 缺失數(shù)據(jù)處理 88
6.2 異常值分析 89
XIV R 語言(第2 版)
6.2.1 箱線圖檢測離群點 89
6.2.2 點圖檢測離群點 90
6.3 數(shù)據(jù)去重 91
6.4 規(guī)范化 92
6.4.1 數(shù)據(jù)的中心化 92
6.4.2 數(shù)據(jù)標(biāo)準(zhǔn)化 92
6.5 格式轉(zhuǎn)換 93
習(xí)題 95
第7 章 數(shù)據(jù)探索
7.1 單一變量分析 97
7.1.1 定量變量 97
7.1.2 定性變量 99
7.2 雙變量分析 100
7.2.1 一個定性變量和一個定量變量 100
7.2.2 兩個定性變量 100
7.2.3 兩個定量變量 101
7.3 多變量分析 102
7.3.1 集中趨勢度量 102
7.3.2 離中趨勢度量 103
7.4 相關(guān)分析 104
7.4 1 相關(guān)系數(shù) 104
7.4.2 直接繪制點圖 105
7.4.3 繪制點圖矩陣 106
習(xí)題 106
第8 章 數(shù)據(jù)變換
8.1 數(shù)據(jù)集劃分與選擇 109
8.1.1 數(shù)據(jù)集劃分 109
8.1.2 數(shù)據(jù)集選擇 110
8.2 特征工程 110
8.2.1 特征工程概述 110
8.2.2 特征構(gòu)建 111
8.2.3 特征選擇 112
8.2.4 特征抽取 115
8.2.5 自動化特征工程 117
8.3 數(shù)據(jù)整合 118
8.3.1 通過向量化重構(gòu)數(shù)據(jù) 119
8.3.2 為數(shù)據(jù)添加新變量 119
8.3.3 變形與融合 120
8.3.4 列聯(lián)表 123
8.3.5 分組匯總 123
8.3.6 連接表 125
習(xí)題 127
第9 章 高級編程
9.1 條件表達(dá)式 131
9.2 選擇結(jié)構(gòu) 132
9.3 循環(huán)結(jié)構(gòu) 135
9.4 用戶自定義函數(shù) 138
習(xí)題 139
第10 章 數(shù)據(jù)建模
10.1 Rattle 包 141
10.2 變量的類別 143
10.3 聚類分析 145
10.3.1 背景 145
10.3.2 K-means 聚類 146
10.3.3 層次聚類 148
10.4 關(guān)聯(lián)規(guī)則挖掘 150
10.4.1 背景 150
10.4.2 基本術(shù)語 151
10.4.3 關(guān)聯(lián)規(guī)則的分類 152
10.4.4 Apriori 算法 153
10.4.5 實驗指導(dǎo) 154
10.5 傳統(tǒng)決策樹模型 156
10.5.1 背景 156
10.5.2 ID3 算法 157
10.5.3 C4.5 算法 158
10.5.4 實驗指導(dǎo) 159
XVI R 語言(第2 版)
10.6 隨機(jī)森林決策樹模型 161
10.6.1 背景 161
10.6.2 隨機(jī)森林算法 161
10.6.3 實驗指導(dǎo) 163
10.7 自適應(yīng)選擇決策樹模型 166
10.7.1 背景 166
10.7.2 Boosting 算法 166
10.7.3 adaboost 算法 167
10.7.4 實驗指導(dǎo) 167
10.8 SVM 171
10.8.1 背景 171
10.8.2 SVM 算法 171
10.8.3 實驗指導(dǎo) 173
10.9 線性回歸模型 174
10.9.1 背景 174
10.9.2 一元線性回歸方法 174
10.9.3 實驗指導(dǎo) 176
10.10 神經(jīng)網(wǎng)絡(luò)模型 177
10.10.1 背景 177
10.10.2 人工神經(jīng)網(wǎng)絡(luò)模型 178
10.10.3 實驗指導(dǎo) 179
習(xí)題 181
第11 章 模型評估
11.1 Rattle 模型評估選項卡 185
11.2 混淆矩陣 186
11.2.1 二分類混淆矩陣 186
11.2.2 模型評價指標(biāo) 187
11.2.3 多分類混淆矩陣 188
11.3 風(fēng)險圖 188
11.3.1 風(fēng)險圖的作用 188
11.3.2 實驗指導(dǎo) 188
11.4 ROC 曲線 190
11.4.1 ROC 曲線概述 190
11.4.2 ROC 曲線的作用 190
11.4.3 實驗指導(dǎo) 190
11.5 交叉驗證 192
習(xí)題 193
第12 章 影響大學(xué)平均錄取分?jǐn)?shù)線因素分析
12.1 背景與目標(biāo) 195
12.2 數(shù)據(jù)說明 195
12.3 描述性分析 196
12.4 數(shù)據(jù)建模 199
12.5 總結(jié) 201
第13 章 收視率分析
13.1 背景介紹 202
13.2 數(shù)據(jù)說明 202
13.3 描述性分析 203
13.4 數(shù)據(jù)建模 209
13.5 總結(jié) 212
參考文獻(xiàn)
附錄A
附錄B