注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡人工智能機器學習與R語言

機器學習與R語言

機器學習與R語言

定 價:¥69.00

作 者: (美)蘭茲 著,李洪成,許金煒,李艦 譯
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 計算機/網絡 人工智能

購買這本書可以去


ISBN: 9787111491576 出版時間: 2015-03-01 包裝:
開本: 頁數: 字數:  

內容簡介

  R本身是一款十分優(yōu)秀的數據分析和數據可視化軟件?!稒C器學習與R語言》通過將實踐案例與核心的理論知識相結合,提供了你開始將機器學習應用到你自己項目中所需要的知識。《機器學習與R語言》主要內容:機器學習的基本概念和理論,用于機器學習的R軟件環(huán)境;如何應用R來管理數據,進行數據的探索分析和數據可視化;典型的機器學習算法和案例,并給出了詳細的分析步驟;模型性能評價的原理和方法;提高模型性能的幾種常用方法;其他機器學習主題。《機器學習與R語言》適用于任何希望使用數據來采取行動的人。讀者只需要具有R的一些基本知識,不需要具備機器學習的深厚基礎。不管是R初學者,還是熟練的R用戶都能從書中找到對自己有用的內容。

作者簡介

暫缺《機器學習與R語言》作者簡介

圖書目錄

 
推薦序
譯者序
前言
致謝
關于技術評審人
第1章機器學習簡介
1.1機器學習的起源
1.2機器學習的使用與濫用
1.3機器如何學習
1.3.1抽象化和知識表達
1.3.2一般化
1.3.3評估學習的成功性
1.4將機器學習應用于數據中的步驟
1.5選擇機器學習算法
1.5.1考慮輸入的數據
1.5.2考慮機器學習算法的類型
1.5.3為數據匹配合適的算法
1.6使用R進行機器學習
1.7總結
第2章數據的管理和理解
2.1R數據結構
2.2向量
2.3因子
2.3.1列表
2.3.2數據框
2.3.3矩陣和數組
2.4用R管理數據
2.4.1保存和加載R數據結構
2.4.2用CSV文件導入和保存數據
2.4.3從SQL數據庫導入數據
2.5探索和理解數據
2.5.1探索數據的結構
2.5.2探索數值型變量
2.5.3探索分類變量
2.5.4探索變量之間的關系
2.6總結
第3章懶惰學習——使用近鄰分類
3.1理解使用近鄰進行分類
3.1.1kNN算法
3.1.2為什么kNN算法是懶惰的
3.2用kNN算法診斷乳腺癌
3.2.1第1步——收集數據
3.2.2第2步——探索和準備數據
3.2.3第3步——基于數據訓練模型
3.2.4第4步——評估模型的性能
3.2.5第5步——提高模型的性能
3.3總結
第4章概率學習——樸素貝葉斯分類
4.1理解樸素貝葉斯
4.1.1貝葉斯方法的基本概念
4.1.2樸素貝葉斯算法
4.2例子——基于貝葉斯算法的手機垃圾短信過濾
4.2.1第1步——收集數據
4.2.2第2步——探索和準備數據
4.2.3數據準備——處理和分析文本數據
4.2.4第3步——基于數據訓練模型
4.2.5第4步——評估模型的性能
4.2.6第5步——提升模型的性能
4.3總結
第5章分而治之——應用決策樹和規(guī)則進行分類
5.1理解決策樹
5.1.1分而治之
5.1.2C5.0決策樹算法
5.2例子——使用C5.0決策樹識別高風險銀行貸款
5.2.1第1步——收集數據
5.2.2第2步——探索和準備數據
5.2.3第3步——基于數據訓練模型
5.2.4第4步——評估模型的性能
5.2.5第5步——提高模型的性能
5.3理解分類規(guī)則
5.3.1獨立而治之
5.3.2單規(guī)則(1R)算法
5.3.3RIPPER算法
5.3.4來自決策樹的規(guī)則
5.4例子——應用規(guī)則學習識別有毒的蘑菇
5.4.1第1步——收集數據
5.4.2第2步——探索和準備數據
5.4.3第3步——基于數據訓練模型
5.4.4第4步——評估模型的性能
5.4.5第5步——提高模型的性能
5.5總結
第6章預測數值型數據——回歸方法
6.1理解回歸
6.1.1簡單線性回歸
6.1.2普通最小二乘估計
6.1.3相關系數
6.1.4多元線性回歸
6.2例子——應用線性回歸預測醫(yī)療費用
6.2.1第1步——收集數據
6.2.2第2步——探索和準備數據
6.2.3第3步——基于數據訓練模型
6.2.4第4步——評估模型的性能
6.2.5第5步——提高模型的性能
6.3理解回歸樹和模型樹
6.4例子——用回歸樹和模型樹估計葡萄酒的質量
6.4.1第1步——收集數據
6.4.2第2步——探索和準備數據
6.4.3第3步——基于數據訓練模型
6.4.4第4步——評估模型的性能
6.4.5第5步——提高模型的性能
6.5總結
第7章黑箱方法——神經網絡和支持向量機
7.1理解神經網絡
7.1.1從生物神經元到人工神經元
7.1.2激活函數
7.1.3網絡拓撲
7.1.4用后向傳播訓練神經網絡
7.2用人工神經網絡對混凝土的強度進行建模
7.2.1第1步——收集數據
7.2.2第2步——探索和準備數據
7.2.3第3步——基于數據訓練模型
7.2.4第4步——評估模型的性能
7.2.5第5步——提高模型的性能
7.3理解支持向量機
7.3.1用超平面分類
7.3.2尋找最大間隔
7.3.3對非線性空間使用核函數
7.4用支持向量機進行光學字符識別
7.4.1第1步——收集數據
7.4.2第2步——探索和準備數據
7.4.3第3步——基于數據訓練模型
7.4.4第4步——評估模型的性能
7.4.5第5步——提高模型的性能
7.5總結
第8章探尋模式——基于關聯規(guī)則的購物籃分析
8.1理解關聯規(guī)則
8.2例子——用關聯規(guī)則確定經常一起購買的食品雜貨
8.2.1第1步——收集數據
8.2.2第2步——探索和準備數據
8.2.3第3步——基于數據訓練模型
8.2.4第4步——評估模型的性能
8.2.5第5步——提高模型的性能
8.3總結
第9章尋找數據的分組——k均值聚類
9.1理解聚類
9.1.1聚類——一種機器學習任務
9.1.2k均值聚類算法
9.1.3用k均值聚類探尋青少年市場細分
9.1.4第1步——收集數據
9.1.5第2步——探索和準備數據
9.1.6第3步——基于數據訓練模型
9.1.7第4步——評估模型的性能
9.1.8第5步——提高模型的性能
9.2總結
第10章模型性能的評價
10.1度量分類方法的性能
10.1.1在R中處理分類預測數據
10.1.2深入探討混淆矩陣
10.1.3使用混淆矩陣度量性能
10.1.4準確度之外的其他性能評價指標
10.1.5性能權衡的可視化
10.2評估未來的性能
10.2.1保持法
10.2.2交叉驗證
10.2.3自助法抽樣
10.3總結
第11章提高模型的性能
11.1調整多個模型來提高性能
11.2使用元學習來提高模型的性能
11.2.1理解集成學習
11.2.2bagging
11.2.3boosting
11.2.4隨機森林
11.3總結
第12章其他機器學習主題
12.1分析專用數據
12.1.1用RCurl添加包從網上獲取數據
12.1.2用XML添加包讀/寫XML格式數據
12.1.3用rjson添加包讀/寫JSON
12.1.4用xlsx添加包讀/寫MicrosoftExcel電子表格
12.1.5生物信息學數據
12.1.6社交網絡數據和圖數據
12.2提高R語言的性能
12.2.1處理非常大的數據集
12.2.2使用并行處理來加快學習過程
12.2.3GPU計算
12.2.4部署最優(yōu)的學習算法
12.3總結  

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號