注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)程序設(shè)計(jì)綜合Mahout實(shí)踐指南

Mahout實(shí)踐指南

Mahout實(shí)踐指南

定 價(jià):¥49.00

作 者: (美)Piero Giacomelli 著,靳小波 譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 編程語言與程序設(shè)計(jì) 計(jì)算機(jī)與互聯(lián)網(wǎng)

ISBN: 9787111467144 出版時(shí)間: 2014-06-01 包裝:
開本: 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  《Mahout實(shí)踐指南》是軟件開發(fā)專家數(shù)十年行業(yè)經(jīng)驗(yàn)的結(jié)晶,深入淺出地論述如何使用Mahout進(jìn)行數(shù)據(jù)分類、聚類和預(yù)測,涉及Mahout開發(fā)環(huán)境、序列文件使用方式、整合Mahout和外部資源、實(shí)現(xiàn)樸素貝葉斯分類器、股市預(yù)測、頂棚聚類、頻譜預(yù)測、K-均值聚類等。本書是面向編程的,不涉及深?yuàn)W的理論,簡單、易學(xué),可以幫助讀者快速掌握Mahout的基本用法,實(shí)用性強(qiáng)。全書共分10章。第1章介紹如何在單臺(tái)機(jī)器上創(chuàng)建完整的Mahout開發(fā)環(huán)境。第2章重點(diǎn)介紹序列文件的使用方式。第3章詳細(xì)介紹如何使用命令行工具和代碼從RDBMS中讀寫數(shù)據(jù)。第4章詳細(xì)討論樸素貝葉斯分類器和互補(bǔ)樸素貝葉斯分類器的使用方法。第5章介紹如何使用logistic回歸和隨機(jī)森林預(yù)測股市。第6章描述Mahout框架中最常用的算法,包括大數(shù)據(jù)的聚類分析和分類。第7章描述頻譜聚類的使用方式。第8章描述使用K-均值(包括序列方式和MapReduce方式)對主題中的文本文檔進(jìn)行分類。第9章介紹頻繁模式挖掘算法的使用方式。第10章描述使用遺傳算法解決旅行商問題和提取規(guī)則。

作者簡介

  Piero Giacomelli,資深軟件技術(shù)專家,精通Java、.NET和PHP等多種編程語言,尤其對Java語言有獨(dú)到見解。他曾先后在多家大中型公司擔(dān)任行政和技術(shù)職務(wù),包括航空航天、網(wǎng)絡(luò)服務(wù)、塑料制造業(yè)和電子健康協(xié)會(huì)。他在FP7歐盟項(xiàng)目中參與了多項(xiàng)歐盟研究基金資助的工程,如CHRONIOUS、I-DONT-FALL、FEARLESS和CHROMED等。他在科研期刊上發(fā)表了若干篇論文,并兩次獲得由IARIA頒發(fā)的最佳論文獎(jiǎng)。2012年,他出版了Apache HornetQ框架標(biāo)準(zhǔn)參考書《HornetQ Messaging Developer’s Guide》。

圖書目錄

第1章 Mahout入門 / 1 秘笈1 安裝Java和Hadoop / 1 秘笈2 設(shè)置Maven和NetBeans開發(fā)環(huán)境 / 6 秘笈3 編寫一個(gè)基本的推薦系統(tǒng) / 9 第2章 使用序列文件——什么時(shí)候和為什么 / 19 秘笈4 從命令行創(chuàng)建序列文件 / 20 秘笈5 編寫代碼創(chuàng)建序列文件 / 23 秘笈6 編碼實(shí)現(xiàn)讀取序列文件 / 28 第3章 將Mahout和外部資源整合 / 33 秘笈7 導(dǎo)入外部資源到HDFS / 34 秘笈8 將數(shù)據(jù)從HDFS導(dǎo)入到RDBMS / 43 秘笈9 創(chuàng)建一個(gè)Sqoop作業(yè)來處理RDBMS / 45 秘笈10 使用Sqoop API導(dǎo)入數(shù)據(jù) / 47 第4章 實(shí)現(xiàn)樸素貝葉斯分類器 / 49 秘笈11 使用Mahout文本分類器演示基本的使用樣例 / 50 秘笈12 編碼實(shí)現(xiàn)樸素貝葉斯分類器 / 60 秘笈13 通過命令行使用互補(bǔ)樸素貝葉斯 / 64 秘笈14 編碼使用互補(bǔ)樸素貝葉斯分類器 / 65 第5章 股市預(yù)測 / 67 秘笈15 為logistic回歸準(zhǔn)備數(shù)據(jù) / 67 秘笈16 使用logistic預(yù)測GOOG股票動(dòng)態(tài) / 71 秘笈17 通過Java編碼使用自適應(yīng)的logistic回歸 / 76 秘笈18 在大規(guī)模的數(shù)據(jù)集上使用logistic回歸 / 79 秘笈19 使用隨機(jī)森林預(yù)測市場動(dòng)態(tài) / 83 第6章 頂棚聚類 / 87 秘笈20 基于命令行的頂棚聚類 / 87 秘笈21 基于帶參數(shù)命令行的頂棚聚類 / 91 秘笈22 通過Java代碼使用頂棚聚類 / 95 秘笈23 編寫你自己的距離估計(jì) / 98 第7章 頻譜聚類 / 101 秘笈24 通過命令行使用EigenCuts / 101 秘笈25 在Java代碼中使用EigenCuts / 104 秘笈26 從原始數(shù)據(jù)創(chuàng)建相似度矩陣 / 108 秘笈27 使用頻譜聚類進(jìn)行圖像分割 / 114 第8章 K-均值聚類 / 119 秘笈28 在Java代碼中使用K-均值聚類 / 119 秘笈29 使用K-均值聚類對交通事故進(jìn)行聚類 / 124 秘笈30 使用MapReduce進(jìn)行K-均值聚類 / 128 秘笈31 命令行方式使用K-均值聚類 / 132 第9章 軟計(jì)算 / 139 秘笈32 使用Mahout進(jìn)行頻繁模式挖掘 / 139 秘笈33 為頻繁模式挖掘創(chuàng)建評價(jià)準(zhǔn)則 / 142 秘笈34 在Java代碼中使用頻繁模式挖掘 / 147 秘笈35 使用LDA創(chuàng)建主題 / 153 第10章 實(shí)現(xiàn)遺傳算法 / 159 秘笈36 設(shè)置Mahout以便使用遺傳算法 / 159 秘笈37 在圖上使用遺傳算法 / 163 秘笈38 在Java代碼中使用遺傳算法 / 167

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)