注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡操作系統(tǒng)數據星河:構建現代化數據倉庫之路

數據星河:構建現代化數據倉庫之路

數據星河:構建現代化數據倉庫之路

定 價:¥59.00

作 者: 程志遠、左巖、翟文麟
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787302686668 出版時間: 2025-05-01 包裝: 平裝-膠訂
開本: 16開 頁數: 字數:  

內容簡介

  本書以數據倉庫建設內容為主線,以理論基礎為核心,引導讀者漸進式地學習數據倉庫建設版圖中所需知識。通過認識數據基建、數據質量、數據安全、實時技術、數據治理、數據資產、數據服務、數據應用等8個模塊及常見遇到項目,使讀者能夠了解日常數據倉庫開發(fā)流程及數據倉庫工作具體內容,從而快速上手數據倉庫建設工作。本書共14章,分為基礎篇、基建篇、應用篇、評價篇、展望篇?;A篇(第1章和第2章)介紹數據倉庫框架和數據模型建設知識點;基建篇(第3~8章)詳細講述數據倉庫中每個板塊建設,由簡入深剖析搭建背景及搭建中細節(jié);應用篇(第9~11章)通過實戰(zhàn)講解,快速上手數據倉庫常見項目;評價篇(第12章和第13章)結合數據倉庫基建和項目,闡述完整數據倉庫需要具備的條件,并補充評價體系指標;展望篇(第14章)結合當前AIGC應用衍生出數據倉庫未來發(fā)展探索;本書示例代碼豐富,實際性和系統(tǒng)性較強,并配有視頻講解,助力讀者透徹理解書中的重點、難點。本書適合初學者入門,也適合工作多年數據倉庫開發(fā)者借鑒學習,亦可作為高等院校和培訓機構相關專業(yè)的教學參考書。

作者簡介

  程志遠,前阿里巴巴數據技術及產品部下數據研發(fā)工程師,現某大型互聯網公司數據倉庫工程師,數據倉庫全局版圖規(guī)劃者,全鏈路數據保障提出者及建設者,主導過2021阿里巴巴某業(yè)務線雙十一實時鏈路建設,能夠對多場景業(yè)務線提供解決架構方案。左巖,中國電信股份有限公司技術專家,有著多年的數據領域從業(yè)經驗,擅長實時數據、數據治理、數據分析等方面的設計與實施。Apache Flink、Apache Doris、Flink CDC 、StarRocks、Fluss等開源項目Contributor,對于流式計算、實時數倉等技術有深入的研究。翟文麟,曾擔任美團點評、京東等互聯網大廠資深數據研發(fā)工程師。負責部門數據架構制定與規(guī)劃,參與集團數據治理與數據應用的規(guī)劃和制定。從業(yè)務角度出發(fā),將數據轉化為資產,最終實現技術價值。

圖書目錄

本書源碼
 
基礎篇
第1章認識數據倉庫00
1.1大數據在如今社會中的運用00
1.2大數據相關崗位介紹00
1.2.1數據倉庫崗位介紹00
1.2.2數據平臺崗位介紹00
1.2.3數據分析崗位介紹00
1.2.4數據產品崗位介紹00
1.2.5數據挖掘崗位介紹00
1.3大數據在企業(yè)中的組織架構00
1.3.1數據中臺00
1.3.2業(yè)務線數據00
1.4數據倉庫崗在大數據生態(tài)中的定位00
1.4.1數據倉庫概念00
1.4.2數據倉庫定位00
1.5數據倉庫發(fā)展史00
1.5.1數倉1.0傳統(tǒng)數據倉庫時代00
1.5.2數倉2.0 Hadoop生態(tài)時代00
1.5.3數倉3.0云端及數據平臺時代00
1.5.4數倉4.0湖倉一體時代00
1.6數據倉庫建設內容簡介00
1.6.1數據倉庫建設版圖0
1.6.2數據基建簡介0
1.6.3數據資產簡介0
1.6.4數據服務簡介 0
1.6.5數據應用簡介0
1.7數據倉庫架構介紹0
1.7.1Lambda架構0
1.7.2HSAP架構0
1.7.3流批一體架構0
1.7.4Doris架構0
1.8數據倉庫所使用的技術棧0
第2章數據倉庫模型建設0
2.1OLTP與OLAP0
2.1.1什么是OLTP0
2.1.2什么是OLAP0
2.1.3OLTP與OLAP的區(qū)別0
2.2數據倉庫分層0
2.2.1數據倉庫分層原理0
2.2.2數據倉庫分層內容0
2.3數據倉庫模型介紹0
2.4數據倉庫模型建設方法0
2.4.1三范式建模與維度建模介紹0
2.4.2三范式建模與維度建模區(qū)別0
2.5數據模型建設的具體流程0
2.5.1數據模型設計的基本原則0
2.5.2數據模型設計過程0
2.5.3數據模型建設五要素0
2.6數據域與主題域0
2.7事實表設計0
2.7.1事實表類型0
2.7.2三類事實表區(qū)別0
2.7.3全量和增量0
2.7.4拉鏈表0
2.7.5完整的數據模型內容案例0
2.8數據標準介紹0
2.8.1數據模型命名規(guī)范0
2.8.2數據模型命名詞根0
2.8.3字段命名規(guī)范0
2.8.4字段類型規(guī)范0
2.8.5數據模型元數據規(guī)范0
2.8.6數據模型分區(qū)生命周期0
2.9數據模型發(fā)展周期0
2.10數據模型分層新式方法0
基建篇
第3章元數據0
3.1元數據定義及分類0
3.1.1元數據定義0
3.1.2元數據分類0
3.2元數據模型0
3.2.1確定元數據對象0
3.2.2確定元數據屬性0
3.2.3確定元數據關系0
3.2.4創(chuàng)建元數據模型0
3.3元數據管理0
3.3.1元數據采集與收集0
3.3.2元數據存儲0
3.3.3元數據維護0
3.3.4元數據使用0
3.4元數據管理工具0
3.5數據血緣0
3.5.1數據血緣功能0
3.5.2數據血緣類型0
第4章數據指標體系0
4.1數據指標概念0
4.2數據指標分類0
4.2.1按用途分類0
4.2.2按計算方法分類0
4.2.3按時間范圍分類0
4.3數據指標設計0
4.3.1明確目標0
4.3.2選擇方法0
4.3.3確保一致性0
4.3.4詞根分類0
4.4數據指標的應用場景0
4.4.1數據明細報表0
4.4.2數據可視化圖0
4.4.3數據挖掘0
4.4.4指標監(jiān)控0
4.5數據指標中心建設0
4.5.1數據指標中心建設的目的0
4.5.2數據指標中心解決的痛點問題0
4.5.3數據指標中心建設流程0
第5章數據質量0
5.1數據質量背景0
5.1.1數據質量概念0
5.1.2數據質量存在的痛點問題0
5.2數據質量保障措施0
5.2.1制定數據模型及指標的上線變更規(guī)范0
5.2.2數據質量監(jiān)控0
5.2.3數據基線及SLA0
5.2.4容災備份快速恢復能力0
5.2.5數據問題上報平臺0
5.2.6源頭數據質量長期監(jiān)測跟蹤體系0
5.3推動上下游開展數據質量建設活動0
5.3.1數據倉庫發(fā)展期0
5.3.2數據倉庫成熟期0
5.4數據質量思考0
第6章數據安全0
6.1數據安全背景0
6.2數據安全實施難點0
6.2.1數據安全要做什么0
6.2.2數據安全現狀梳理0
6.2.3數據安全保障方向0
6.3數據安全保障流程0
6.3.1角色權限管理0
6.3.2數據使用權限管理0
6.3.3數據模型分級0
6.3.4數據展示0
6.3.5數據風險預期管理0
6.3.6數據脫敏0
6.4數據安全實施階段0
6.4.1早期數據安全實施0
6.4.2成熟期數據安全實施0
6.5數據安全思考0
第7章數據治理0
7.1數據治理背景0
7.1.1合規(guī)治理0
7.1.2資源治理0
7.2數據倉庫發(fā)展階段0
7.3數據治理內容0
7.3.1數據模型合規(guī)治理0
7.3.2數據質量合規(guī)治理0
7.3.3數據安全合規(guī)治理0
7.3.4存儲資源治理0
7.3.5計算資源治理0
7.3.6小文件治理
7.4推動上下游開展數據治理活動方法
7.5數據治理思考與沉淀
第8章實時技術
8.1實時數據倉庫搭建背景
8.2實時架構及組件
8.2.1實時數據倉庫架構
8.2.2實時數據倉庫組件
8.3實時開發(fā)流程
8.4實時鏈路優(yōu)化
8.5實時技術產出量化
應用篇
第9章數據資產
9.1數據資產介紹
9.2風險名單數據資產(消費金融業(yè)務)
9.2.1項目背景
9.2.2項目流程介紹
9.2.3項目流程
9.2.4項目難點
9.2.5項目思考
9.3各場景下用戶畫像體系建設
9.3.1用戶畫像介紹
9.3.2項目背景
9.3.3項目流程介紹
9.3.4項目流程
9.3.5項目難點
9.3.6項目思考
第10章數據服務
10.1數據服務介紹
10.1.1數據服務概念
10.1.2當前數據應用時存在的痛點問題
10.2數據服務建設內容
10.2.1指標中心
10.2.2標簽畫像管理平臺
10.2.3數據資產門戶
10.2.4數據質量中心
10.2.5數據安全中心
10.2.6數據模型設計中心
10.2.7OneID
10.2.8數據治理360
10.3數據服務建設周期
10.3.1探索期
10.3.2擴張期
第11章數據應用
11.1數據應用介紹
11.2神策明星榜數據(視頻行業(yè)業(yè)務)
11.2.1項目背景
11.2.2項目流程介紹
11.2.3項目流程
11.2.4項目難點
11.2.5項目思考
11.3員工離職動因專項分析(人力資源業(yè)務)
11.3.1項目背景
11.3.2業(yè)務視角分析
11.3.3項目流程
11.3.4項目思考
11.4征信系統(tǒng)專題分析
11.4.1項目背景
11.4.2項目流程
11.4.3項目產出
11.4.4項目思考
評價篇
第12章評價數據倉庫的好壞
12.1數據質量層面評估
12.1.1數據質量問題產生的原因
12.1.2數據質量評估方法
12.2數據模型層面評估
12.2.1數據模型問題產生的原因
12.2.2數據模型評估方法
12.3數據安全層面評估
12.3.1數據安全問題產生的原因
12.3.2數據安全評估方法
12.4數據成本及性能層面評估
12.4.1數據成本過高及性能過低的原因
12.4.2數據成本及性能層面評估方法
第13章數據價值
13.1抽象的數據能力架構
13.1.1數據傳輸能力
13.1.2數據計算能力
13.1.3數據資產能力
13.1.4數據算法能力
13.2數據能力對數據價值的呈現
13.3數據價值對業(yè)務的幫助
13.3.1用戶增長/經營性分析
13.3.2數據質量/產出穩(wěn)定
13.3.3查數/用數提效
13.3.4降低部門支出
 
展望篇
第14章AIGC對數據發(fā)展的影響
14.1數據與AI的關系
14.2網易ChatBI介紹
14.3網易ChatBI功能
14.3.1需求理解能力
14.3.2提供用戶所需內容的預測能力
14.3.3多輪對話能力
14.3.4圖表繪制能力
14.3.5多端互通能力
14.3.6過程可驗證能力
14.3.7用戶可干預能力
14.4數據產品未來規(guī)劃
14.4.1網易ChatBI產品未來規(guī)劃
14.4.2其他數據產品未來規(guī)劃
 

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號