注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書教育/教材/教輔教材高職高專教材Hadoop+HBase技術項目教程

Hadoop+HBase技術項目教程

Hadoop+HBase技術項目教程

定 價:¥59.00

作 者: 張立輝,李明革
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787111705239 出版時間: 2022-06-01 包裝:
開本: 16開 頁數(shù): 218 字數(shù):  

內(nèi)容簡介

  本書詳細介紹了大數(shù)據(jù)技術中的Hadoop 集群部署、MapReduce、Hive和HBase 等的基本知識和應用,本書采用了大量案例,可以更好地幫助讀者學習和理解大數(shù)據(jù)的核心技術。 \n本書從實用的角度出發(fā),設計了9 個項目,從虛擬機安裝入手,結(jié)合實際工作中的典型項目和案例,全面介紹了Hadoop 集群部署、HDFS、MapReduce 編程、Hive、HBase 和Sqoop 的相關知識和基本操作。 \n本書圍繞Linux 操作系統(tǒng)和Hadoop 集群部署,按照初學者的思維習慣,循序漸進地設計和安排學習內(nèi)容,采用將基礎知識融入項目教學的方式,在完成項目學習的同時,實現(xiàn)從理論知識到能力的轉(zhuǎn)化,幫助學習者牢固掌握Hadoop 集群部署等相關知識的實踐技能。 \n本書適合作為職業(yè)類院校計算機、大數(shù)據(jù)等相關專業(yè)的教材,也適用于計算機培訓班教學,以及有構(gòu)建大數(shù)據(jù)知識體系需求的讀者學習。

作者簡介

  張立輝,2003年畢業(yè)于吉林工程技術師范學院計算機科學與技術專業(yè),發(fā)表核心論文一篇,論文10余篇,主持和參與課題5個,指導學生參加吉林省大數(shù)據(jù)比賽多次獲得一等獎,實用新型專利3個,軟件著作權4個。帶領團隊參與公司實際項目3個以上。

圖書目錄

目錄 \n
\n
前言 \n
項目1 Hadoop 安裝 \n
1.1 大數(shù)據(jù)認知 \n
1.1.1 大數(shù)據(jù)是什么 \n
1.1.2 大數(shù)據(jù)應用領域 \n
1.1.3 大數(shù)據(jù)的特點 \n
1.1.4 大數(shù)據(jù)的技術架構(gòu) \n
1.2 Hadoop 認知 \n
1.2.1 Hadoop 起源 \n
1.2.2 Hadoop 的特點 \n
1.2.3 Hadoop 生態(tài)圈 \n
1.2.4 Hadoop 核心架構(gòu) \n
項目實現(xiàn) \n
任務1 安裝前準備 \n
任務2 虛擬機的安裝 \n
任務3 Ubuntu 的安裝 \n
任務4 解壓與壓縮命令 \n
任務5 JDK 安裝和配置 \n
任務6 Hadoop 的安裝 \n
拓展項目 \n
課后練習 \n
項目2 Hadoop 集群部署 \n
2.1 Linux 環(huán)境設置 \n
2.1.1 Linux 常用命令 \n
2.1.2 用戶(組)創(chuàng)建 \n
2.1.3 FileZilla 文件傳輸 \n
2.1.4 apt 更新 \n
2.1.5 vim 編輯器的應用 \n
2.1.6 網(wǎng)絡配置 \n
2.2 Hadoop 配置文件 \n
2.2.1 環(huán)境變量的配置 \n
2.2.2 SSH 安裝 \n
2.2.3 core-site.xml 配置文件 \n
2.2.4 hdfs-site.xml 配置文件 \n
2.2.5 Hadoop 偽分布式運行實例 \n
2.3 YARN 認知 \n
2.3.1 初識YARN \n
2.3.2 YARN 基本服務組件 \n
2.3.3 YARN 執(zhí)行過程 \n
項目實現(xiàn) \n
任務1 部署前準備 \n
任務2 集群網(wǎng)絡配置 \n
任務3 配置文件的設置 \n
任務4 集群部署 \n
拓展項目 \n
課后練習 \n
項目3 HDFS-電影信息管理 \n
3.1 HDFS 認知 \n
3.1.1 HDFS 簡介 \n
3.1.2 HDFS 特點 \n
3.1.3 HDFS 設計原則 \n
3.1.4 HDFS 核心概念 \n
3.2 HDFS 常用Shell 命令和基礎編程開發(fā) \n
3.2.1 HDFS 常用Shell 命令 \n
3.2.2 用HDFS API 實現(xiàn)上傳本地文件 \n
3.2.3 用HDFS API 實現(xiàn)創(chuàng)建HDFS 文件 \n
3.2.4 用HDFS API 實現(xiàn)讀取和寫入文件 \n
3.2.5 用HDFS API 實現(xiàn)創(chuàng)建HDFS 目錄 \n
3.2.6 用HDFS API 實現(xiàn)查找文件所在位置 \n
3.3 HDFS 工作機制 \n
3.3.1 HDFS 寫數(shù)據(jù)流程 \n
3.3.2 HDFS 讀數(shù)據(jù)流程 \n
3.3.3 NameNode 工作機制 \n
3.3.4 DataNode 工作機制 \n
項目實現(xiàn) \n
任務1 環(huán)境搭建 \n
任務2 寫入電影信息 \n
任務3 讀取電影信息 \n
拓展項目 \n
課后練習 \n
項目4 用MapReduce 統(tǒng)計網(wǎng)站最大訪問次數(shù) \n
4.1 MapReduce 認知 \n
4.1.1 MapReduce 的由來 \n
4.1.2 MapReduce 的執(zhí)行過程 \n
4.1.3 Mapper 過程 \n
4.1.4 Reduce 過程 \n
4.1.5 Shuffle 過程 \n
4.2 MapReduce 程序開發(fā) \n
4.2.1 IDEA 安裝 \n
4.2.2 MapReduce 輸入/輸出類型 \n
4.2.3 MapReduce 輸入處理類 \n
4.2.4 MapReduce 輸出處理類 \n
4.2.5 典型案例:WordCount \n
項目實現(xiàn) \n
任務1 POJO 類編寫 \n
任務2 Map 網(wǎng)站訪問數(shù)據(jù) \n
任務3 Reduce 網(wǎng)站訪問數(shù)據(jù) \n
任務4 項目驅(qū)動類編寫 \n
拓展項目 \n
課后練習 \n
項目5 用MapReduce 實現(xiàn)課程名稱和成績的二次排序 \n
5.1 MapReduce 高級開發(fā)一 \n
5.1.1 Combiner 合并編程 \n
5.1.2 Partitioner 分區(qū)編程 \n
5.1.3 RecordReader 編程 \n
5.2 MapReduce 高級開發(fā)二 \n
5.2.1 MapReduce 連接操作 \n
5.2.2 MapReduce 排序操作 \n
5.2.3 MapReduce 多文件聯(lián)合查詢 \n
項目實現(xiàn) \n
任務1 POJO 類編寫 \n
任務2 Map 課程和成績數(shù)據(jù) \n
任務3 Reduce 課程和成績數(shù)據(jù) \n
任務4 項目驅(qū)動類編寫 \n
拓展項目 \n
課后練習 \n
項目6 用Hive 實現(xiàn)購物用戶數(shù)據(jù)清洗 \n
6.1 Hive 認知 \n
6.1.1 Hive 簡介 \n
6.1.2 Hive 體系結(jié)構(gòu) \n
6.1.3 Hive 設計特征 \n
6.2 Hive 安裝 \n
6.2.1 偽分布式安裝與配置Hive \n
6.2.2 安裝與配置MySQL \n
6.3 Hive 基本操作 \n
6.3.1 Hive 數(shù)據(jù)類型 \n
6.3.2 數(shù)據(jù)庫操作 \n
6.3.3 內(nèi)部表操作 \n
6.3.4 外部表操作 \n
6.3.5 分區(qū)表操作 \n
6.3.6 分桶表操作 \n
6.3.7 Hive 數(shù)據(jù)操作 \n
項目實現(xiàn) \n
任務1 導入數(shù)據(jù) \n
任務2 數(shù)據(jù)分析 \n
任務3 數(shù)據(jù)導出 \n
拓展項目 \n
課后練習 \n
項目7 用HBase 實現(xiàn)學生成績管理 \n
7.1 HBase 認知 \n
7.1.1 HBase 簡介 \n
7.1.2 HBase 體系結(jié)構(gòu) \n
7.1.3 HBase 寫數(shù)據(jù)流程 \n
7.1.4 HBase 讀數(shù)據(jù)流程 \n
7.2 HBase 安裝 \n
7.2.1 下載軟件 \n
7.2.2 偽分布式安裝與配置 \n
7.3 HBase shell 操作命令 \n
7.3.1 HBase 數(shù)據(jù)模型 \n
7.3.2 數(shù)據(jù)表空間操作 \n
7.3.3 數(shù)據(jù)表操作 \n
7.3.4 數(shù)據(jù)操作 \n
7.4 HBase API 操作 \n
7.4.1 HBase 常用的API \n
7.4.2 Configuration 對象 \n
7.4.3 HTable 句柄創(chuàng)建 \n
7.4.4 HBase 數(shù)據(jù)的CRUD 操作 \n
項目實現(xiàn) \n
任務1 學生成績表數(shù)據(jù)準備 \n
任務2 學生成績表設計分析 \n
任務3 學生成績表代碼實現(xiàn) \n
拓展項目 \n
課后練習 \n
項目8 Sqoop 導入導出 \n
8.1 概述 \n
8.1.1 Sqoop 產(chǎn)生背景 \n
8.1.2 Sqoop 是什么 \n
8.1.3 為什么選擇 Sqoop \n
8.2 工作原理 \n
8.2.1 導入機制 \n
8.2.2 導出機制 \n
8.3 安裝 \n
8.4 Sqoop 的基本命令 \n
8.4.1 基本操作 \n
8.4.2 示例 \n
項目實現(xiàn) \n
任務1 從RDBMS 導入到HDFS \n
任務2 從MySQL 導入到Hive \n
任務3 從MySQL 導入到HBase \n
課后練習 \n
Hadoop 綜合實例—網(wǎng)絡交易數(shù)據(jù)統(tǒng)計 \n
9.1 項目概述 \n
9.1.1 項目實現(xiàn)的思路 \n
9.1.2 項目流程 \n
9.2 準備工作 \n
9.2.1 項目環(huán)境的搭建 \n
9.2.2 Hadoop+HBase+Hive 集成 \n
9.2.3 HBase 數(shù)據(jù)庫設計原則 \n
9.2.4 數(shù)據(jù)概況 \n
項目實現(xiàn) \n
項目9 \n
任務1 POJO 類編寫 \n
任務2 統(tǒng)計不同品牌手機的銷售數(shù)量 \n
任務3 統(tǒng)計不同品牌手機銷量和銷售額占比 \n
任務4 統(tǒng)計某年每個月的手機銷售數(shù)量的比例 \n
任務5 統(tǒng)計每個月份各市區(qū)縣的手機銷售數(shù)量 \n
任務6 統(tǒng)計購買手機的男女比例 \n
任務7 統(tǒng)計不同手機品牌購買用戶的年齡區(qū)間人數(shù) \n
課后練習

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號