第1 章 R 語言簡介
1.1 R 語言軟件的安裝與運行.................................................................................................
1
1.1.1 R 語言軟件的安裝、啟動與關閉...........................................................................
1
1.1.2 R 語言程輯包的安裝和使用..................................................................................
4
1.2 R 語言的數(shù)據(jù)結構.............................................................................................................
6
1.2.1 R 語言對象和類型.................................................................................................
6
1.2.2 向量........................................................................................................................
7
1.2.3 數(shù)組和矩陣...........................................................................................................
12
1.2.4 列表......................................................................................................................
17
1.2.5 數(shù)據(jù)框..................................................................................................................
20
第2 章
數(shù)據(jù)的讀取與保存
2.1 數(shù)據(jù)的讀取......................................................................................................................
24
2.1.1 讀取內置數(shù)據(jù)集和文本文件................................................................................
24
2.1.2 讀取Excel 數(shù)據(jù)和CSV 格式的數(shù)據(jù)....................................................................
30
2.1.3 讀取R 語言格式數(shù)據(jù)和網頁數(shù)據(jù)........................................................................
33
2.1.4 讀取其他格式的數(shù)據(jù)...........................................................................................
34
2.2 數(shù)據(jù)保存..........................................................................................................................
36
2.2.1 寫出數(shù)據(jù)..............................................................................................................
36
2.2.2 使用函數(shù)cat()
......................................................................................................
37
2.2.3 保存為R 語言格式文件.......................................................................................
38
2.2.4 保存為其他類型文件...........................................................................................
39
第3 章
數(shù)據(jù)預處理
3.1 缺失值處理......................................................................................................................
40
3.1.1 缺失值判斷...........................................................................................................
40
3.1.2 缺失模型判斷.......................................................................................................
44
3.1.3 常用處理方法.......................................................................................................
48
3.2 數(shù)據(jù)整理..........................................................................................................................
53
3.2.1 數(shù)據(jù)合并..............................................................................................................
53
3.2.2 選取子集..............................................................................................................
56
3.2.3 數(shù)據(jù)轉換..............................................................................................................
59
第4 章
數(shù)據(jù)的探索性分析
4.1 基本繪圖函數(shù)..................................................................................................................
66
4.2 探索單個變量..................................................................................................................
74
4.2.1 單組數(shù)據(jù)的圖形描述...........................................................................................
74
4.2.2 單組數(shù)據(jù)的描述性分析.......................................................................................
79
4.3 探索多個變量..................................................................................................................
81
4.3.1 兩組數(shù)據(jù)的圖形描述...........................................................................................
81
4.3.2 多組數(shù)據(jù)的圖形描述...........................................................................................
85
4.3.3 多組數(shù)據(jù)的描述性統(tǒng)計.......................................................................................
88
4.4 其他圖像探索..................................................................................................................
90
第5 章
回歸分析
5.1 一元線性回歸..................................................................................................................
94
5.1.1 模型簡介..............................................................................................................
94
5.1.2 函數(shù)介紹..............................................................................................................
96
5.1.3 綜合案例:iris 數(shù)據(jù)集的一元回歸建模..............................................................
97
5.2 多元線性回歸..................................................................................................................
99
5.2.1 模型簡介..............................................................................................................
99
5.2.2 綜合案例:iris 數(shù)據(jù)集的多元回歸建模............................................................
100
5.3 變量的選擇....................................................................................................................
105
5.3.1 逐步回歸方法簡介及函數(shù)介紹..........................................................................
105
5.3.2 綜合案例:swiss 數(shù)據(jù)集的逐步回歸建模.........................................................
106
5.3.3 嶺回歸的方法簡介及函數(shù)介紹..........................................................................
109
5.3.4 綜合案例:longley 數(shù)據(jù)集的嶺回歸探索..........................................................
110
5.3.5 lasso 回歸方法簡介及函數(shù)介紹.........................................................................
114
5.3.6 綜合案例:longley 數(shù)據(jù)集的lasso 回歸建模....................................................
115
5.4 Logistic 回歸..................................................................................................................
117
5.4.1 模型簡介............................................................................................................
117
5.4.2 函數(shù)介紹............................................................................................................
119
5.4.3 綜合案例:iris 數(shù)據(jù)集的邏輯回歸建模............................................................
120
第6 章
方差分析
6.1 單因素方差分析............................................................................................................
124
6.1.1 模型介紹............................................................................................................
124
6.1.2 函數(shù)介紹............................................................................................................
126
6.1.3 綜合案例:不同治療方法下膽固醇降低效果的差異性分析............................ 127
6.2 雙因素方差分析............................................................................................................
130
6.2.1 模型介紹............................................................................................................
130
6.2.2 綜合案例:不同劑量下老鼠妊娠重量的差異性分析........................................ 132
6.3 協(xié)方差分析....................................................................................................................
136
6.3.1 模型簡介............................................................................................................
136
6.3.2 函數(shù)介紹............................................................................................................
136
6.3.3 綜合案例:hotdog 數(shù)據(jù)集的協(xié)方差分析...........................................................
137
第7 章
主成分分析和因子分析
7.1 降維的基本方法:主成分分析.....................................................................................
139
7.1.1 理論基礎:原始變量的線性組合......................................................................
139
7.1.2 模型介紹............................................................................................................
141
7.1.3 函數(shù)介紹............................................................................................................
143
7.1.4 綜合案例:longley 數(shù)據(jù)集的變量降維及回歸..................................................
144
7.1.5 綜合案例:longley 數(shù)據(jù)集的變量降維及回歸(主成分回歸)....................... 148
7.2 推廣發(fā)展:因子分析....................................................................................................
150
7.2.1 理論基礎:多個變量綜合為少數(shù)因子...............................................................
150
7.2.2 模型介紹............................................................................................................
151
7.2.3 函數(shù)介紹............................................................................................................
153
7.2.4 綜合案例:能力和智商測試的因子分析探索...................................................
154
第8 章
判別分析
8.1 距離判別法....................................................................................................................
160
8.1.1 理論基礎:離誰近,就屬于誰..........................................................................
160
8.1.2 函數(shù)介紹............................................................................................................
162
8.1.3 綜合案例:基于距離判別的iris 數(shù)據(jù)集分類....................................................
164
8.2 Bayes 判別法.................................................................................................................
168
8.2.1 理論基礎:先驗概率與錯判損失......................................................................
168
8.2.2 函數(shù)介紹............................................................................................................
170
8.2.3 綜合案例:基于iris 數(shù)據(jù)集的Bayes 判別分析................................................
171
8.3 Fisher 判別法.................................................................................................................
171
8.3.1 理論基礎:投影.................................................................................................
171
8.3.2 函數(shù)介紹............................................................................................................
173
8.3.3 綜合案例:基于Fisher 判別的iris 數(shù)據(jù)集分類................................................
174
第9 章
常規(guī)聚類分析
9.1 深入了解聚類分析........................................................................................................
178
9.1.1 差異與分類.........................................................................................................
178
9.1.2 主流的聚類算法.................................................................................................
179
9.2 動態(tài)聚類........................................................................................................................
180
9.2.1 聚類的基本過程.................................................................................................
180
9.2.2 函數(shù)介紹............................................................................................................
183
9.2.3 綜合案例:基于隨機生成序列的動態(tài)聚類.......................................................
184
9.3 層次聚類........................................................................................................................
194
9.3.1 聚類的基本過程.................................................................................................
194
9.3.2 函數(shù)介紹............................................................................................................
197
9.3.3 綜合案例:基于UScitiesD 數(shù)據(jù)集的層次聚類.................................................
199
9.4 密度聚類........................................................................................................................
202
9.4.1 聚類的基本過程.................................................................................................
202
9.4.2 函數(shù)介紹............................................................................................................
202
9.4.3 綜合案例:基于隨機生成序列的密度聚類.......................................................
203
9.5 EM 聚類.........................................................................................................................
204
9.5.1 聚類的基本過程.................................................................................................
205
9.5.2 函數(shù)介紹............................................................................................................
205
9.5.3 綜合案例:基于iris 數(shù)據(jù)集的EM 聚類............................................................
206
第10 章
關聯(lián)規(guī)則
10.1 簡單關聯(lián)規(guī)則..............................................................................................................
210
10.1.1 基本概念與表示形式.......................................................................................
210
10.1.2 評價簡單關聯(lián)規(guī)則的有效性和實用性.............................................................
211
10.2 序列關聯(lián)規(guī)則..............................................................................................................
212
10.2.1 差異與基本概念...............................................................................................
212
10.2.2 生成序列關聯(lián)規(guī)則...........................................................................................
213
10.3 Apriori 算法.................................................................................................................
214
10.3.1 算法介紹:挖掘頻繁項集................................................................................
214
10.3.2 函數(shù)介紹..........................................................................................................
215
10.3.3 綜合案例:基于Titanic 數(shù)據(jù)集的關聯(lián)規(guī)則挖掘............................................
216
10.4 Eclat 算法....................................................................................................................
224
10.4.1 算法介紹:自底向上的搜索............................................................................
224
10.4.2 函數(shù)介紹..........................................................................................................
224
10.4.3 綜合案例:基于美國人口調查數(shù)據(jù)的關聯(lián)規(guī)則挖掘...................................... 225
10.5 SPADE 算法.................................................................................................................
230
10.5.1 算法介紹:基于序列格的搜索和連接.............................................................
231
10.5.2 函數(shù)介紹..........................................................................................................
232
10.5.3 綜合案例:基于zaki 數(shù)據(jù)集的序列關聯(lián)規(guī)則挖掘.........................................
233
第11 章
神經網絡
11.1 深入了解人工神經網絡...............................................................................................
239
11.1.1 生物神經元.......................................................................................................
240
11.1.2 人工神經元模型...............................................................................................
241
11.1.3 人工神經網絡種類...........................................................................................
244
11.1.4 建立模型的一般步驟........................................................................................
247
11.2 B-P 反向傳播網絡.......................................................................................................
248
11.2.1 B-P 反向傳播網絡模型....................................................................................
248
11.2.2 算法介紹...........................................................................................................
249
11.2.3 函數(shù)介紹...........................................................................................................
250
11.3 綜合案例:基于Boston 數(shù)據(jù)的波士頓郊區(qū)房價預測建模........................................ 252