注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡軟件與程序設計O'Reilly:基于AWS的數據科學實踐

O'Reilly:基于AWS的數據科學實踐

O'Reilly:基于AWS的數據科學實踐

定 價:¥148.00

作 者: [美]克里斯·弗雷格利(Chris Fregly),[美]安杰·巴斯(Antje Barth),孟然 譯
出版社: 中國電力出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787519869663 出版時間: 2022-10-01 包裝: 平裝-膠訂
開本: 16開 頁數: 字數:  

內容簡介

  將Amazon AI和ML服務棧應用到真實世界的應用場景,如自然語言處理、計算機視覺、欺詐檢測、對話式設備等。使用Amazon SageMaker Autopilot,通過自動化機器學習(AutoML)實現(xiàn)特定應用場景的子集。深入理解一個基于BERT的自然語言處理場景的模型開發(fā)的完整生命周期,包括數據接入、數據分析以及更多。將所有組件包裝成一個可重復的機器學習運維流水線。通過Amazon Kinesis和Amazon Managed Streaming for Apache Kafka(MSK),在實時數據流中探索實時機器學習、異常檢測和流分析。了解數據科學項目和工作流中的最佳安全實踐,包括在數據接入和分析、模型訓練和部署過程中應用AWS Identity and Access Management(IAM)、鑒權、授權。

作者簡介

  Chris Fregly是AWS的首席AI和機器學習開發(fā)者和布道者,居住在舊金山。他經常在全世界的AI和機器學習會議上演講,包括O’Reilly AI Superstream系列。之前,Chris曾是PipelineAI的創(chuàng)建者,Databricks的解決方案工程師,以及Netflix的軟件工程師。Antje Barth是AWS的高級AI和機器學習開發(fā)者和倡導者,居住于德國杜塞爾多夫。Antje是“Women in Big Data”杜塞爾多夫分部的聯(lián)合創(chuàng)始人,她頻繁在全世界的AI和機器學習會議和聚會上演講。她同時也任職于O’Reilly AI Superstream大會并策劃內容。

圖書目錄

目錄
前言 . 1
第1 章 基于AWS 的數據科學概述 . 9
1.1 云計算的益處 9
1.2 數據科學流水線與工作流 12
1.3 機器學習運維最佳實踐 15
1.4 使用Amazon SageMaker 實現(xiàn)Amazon 人工智能服務和機器學習
自動化 19
1.5 在AWS 上實現(xiàn)數據接入、探索與準備21
1.6 使用Amazon SageMaker 訓練和調試模型 .27
1.7 使用Amazon SageMaker 和AWS Lambda 函數部署模型 30
1.8 AWS 上的流分析和機器學習 31
1.9 AWS 基礎設施和定制化硬件 32
1.10 使用標簽、預算和告警減少開銷 .36
1.11 小結 .36
第2 章 數據科學的應用場景 39
2.1 在每個行業(yè)實現(xiàn)創(chuàng)新 .39
2.2 個性化產品推薦 40
2.3 使用Amazon Rekognition 檢測不當視頻 47
2.4 需求預測 49
2.5 使用Amazon Fraud Detector 識別虛假賬號 53
2.6 使用Amazon Macie 檢測隱私泄漏 54
2.7 對話裝置和語音助手 .56
2.8 文本分析和自然語言處理 56
2.9 認知式搜索和自然語言理解 62
2.10 智能客戶支持中心 63
2.11 工業(yè)人工智能服務和預測性維護 64
2.12 使用AWS IoT 和Amazon SageMaker 實現(xiàn)家庭自動化 65
2.13 從醫(yī)療衛(wèi)生檔案中提取醫(yī)療信息 .66
2.14 自我優(yōu)化的智能云基礎設施 67
2.15 認知式的預測性商業(yè)智能 .69
2.16 培養(yǎng)下一代人工智能和機器學習開發(fā)者 73
2.17 使用量子計算實現(xiàn)大自然的操作系統(tǒng) 78
2.18 提升性能并節(jié)省開支 83
2.19 小結 .85
第3 章 自動化機器學習 87
3.1 用SageMaker Autopilot 實現(xiàn)自動化機器學習 88
3.2 用SageMaker Autopilot 跟蹤實驗 90
3.3 用SageMaker Autopilot 訓練并部署文本分類器 .90
3.4 用Amazon Comprehend 實現(xiàn)自動化機器學習 105
3.5 小結 .109
第4 章 將數據接入云 111
4.1 數據湖 112
4.2 用Amazon Athena 查詢Amazon S3 數據湖 119
4.3 用AWS Glue Crawler 持續(xù)接入新數據 .125
4.4 用Amazon Redshift Spectrum 構建數據湖倉 .127
4.5 在Amazon Athena 和Amazon Redshift 之間選擇 135
4.6 降低開銷并提升性能 135
4.7 小結 .143
第5 章 探索數據集 145
5.1 AWS 上可用于瀏覽數據的工具 .146
5.2 使用 SageMaker Studio 可視化數據湖 147
5.3 查詢數據倉庫 .161
5.4 使用Amazon QuickSight 創(chuàng)建數據儀表170
5.5 使用Amazon SageMaker 和Apache Spark 檢測數據質量問題 .171
5.6 數據集的偏差檢測 179
5.7 使用 SageMaker Clarify 檢測不同類別的數據偏移問題 188
5.8 使用AWS Glue DataBrew 分析數據 189
5.9 節(jié)省開支并提升性能 191
5.10 小結 194
第6 章 為模型訓練準備數據集 195
6.1 特征選擇和特征工程 195
6.2 使用 SageMaker 處理任務進行規(guī)?;卣鞴こ?210
6.3 通過 SageMaker 特征存儲(Feature Store)共享特征 218
6.4 使用 SageMaker Data Wrangler 接入并轉換數據 .222
6.5 使用Amazon SageMaker 追蹤構件和實驗譜系 223
6.6 使用 AWS Glue DataBrew 接入并轉換數據 228
6.7 小結 .231
第7 章 訓練第一個模型 . 233
7.1 理解SageMaker 基礎設施 233
7.2 使用SageMaker JumpStart 部署預先訓練的BERT 模型 238
7.3 開發(fā)一個SageMaker 模型 240
7.4 自然語言處理簡史 242
7.5 BERT 轉換器架構 .245
7.6 從頭訓練 BERT .247
7.7 微調預先訓練的 BERT 模型 249
7.8 創(chuàng)建訓練腳本 .253
7.9 從SageMaker 筆記本啟動訓練腳本 260
7.10 評估模型 .267
7.11 使用SageMaker 調試器調試和剖析模型訓練 272
7.12 闡述和解釋模型預測 278
7.13 檢測模型偏差并解釋預測 284
7.14 BERT 的更多訓練選項 290
7.15 節(jié)省開支并提升性能 300
7.16 小結 306
第8 章 規(guī)?;柧毰c優(yōu)化模型 307
8.1 自動發(fā)現(xiàn)模型的最優(yōu)超參數 307
8.2 對額外的 SageMaker 超參數調優(yōu)任務應用熱啟動 315
8.3 使用SageMaker 分布式訓練擴大訓練規(guī)模 .319
8.4 節(jié)省開支并提升性能 327
8.5 小結 .331
第9 章 部署模型到生產環(huán)境 . 333
9.1 選擇實時預測或批量預測 .333
9.2 使用 SageMaker Endpoints 進行實時預測 335
9.3 使用Amazon CloudWatch 控制 SageMaker Endpoints 自動伸縮 .343
9.4 部署新模型與更新模型的策略 348
9.5 測試與比較新模型 352
9.6 模型性能監(jiān)控與漂移檢測 .364
9.7 監(jiān)控已部署的 SageMaker Endpoints 數據質量 .368
9.8 監(jiān)控已部署的 SageMaker Endpoints 模型質量 .374
9.9 監(jiān)控已部署的 SageMaker Endpoints 偏差漂移 .379
9.10 監(jiān)控已部署的SageMaker Endpoints 特征歸因(Feature Attribution)
漂移 382
9.11 使用SageMaker 批量轉換進行批量預測 385
9.12 AWS Lambda 函數與Amazon API 網關 .391
9.13 優(yōu)化和管理邊緣模型 392
9.14 使用TorchServe 部署PyTorch 模型 .392
9.15 使用AWS Deep Java 庫進行TensorFlow-BERT 推理 .395
9.16 節(jié)省開支并提升性能 397
9.17 小結 403
第10 章 流水線和機器學習運維 . 405
10.1 機器學習運維 405
10.2 軟件流水線 407
10.3 機器學習流水線 408
10.4 使用SageMaker 流水線進行流水線編排 412
10.5 使用SageMaker 流水線實現(xiàn)自動化 .424
10.6 更多流水線選項 429
10.7 人機回圈工作流 439
10.8 節(jié)省開支并提升性能 445
10.9 小結 447
第11 章 流分析與機器學習 449
11.1 在線學習與離線學習 450
11.2 流應用 450
11.3 對流數據實現(xiàn)窗口查詢451
11.4 AWS 上的流分析和機器學習 455
11.5 使用Amazon Kinesis,AWS Lambda 和Amazon SageMaker 進行
實時產品評價分類 .457
11.6 使用Amazon Kinesis Data Firehose 實現(xiàn)流數據接入 .458
11.7 使用流分析匯總實時產品評價 463
11.8 設置Amazon Kinesis 數據分析 464
11.9 Amazon Kinesis 數據分析應用 473
11.10 使用Apache Kafka, AWS Lambda 和Amazon SageMaker 進行
產品評價分類 480
11.11 節(jié)省開支并提升性能 .482
11.12 小結 484
第12 章 用AWS 保證數據科學安全 485
12.1 AWS 與客戶的責任共擔模型485
12.2 應用 AWS 身份和訪問管理(IAM) 486
12.3 隔離計算和網絡環(huán)境 495
12.4 安全訪問Amazon S3 的數據 498
12.5 數據靜態(tài)加密 507
12.6 數據傳輸加密 511
12.7 安全使用 SageMaker Notebook 實例 .513
12.8 安全使用 SageMaker Studio .515
12.9 安全運行SageMaker 任務和模型 517
12.10 安全使用 AWS Lake Formation 522
12.11 通過 AWS 加密信息管理服務安全使用數據庫憑據 522
12.12 治理 523
12.13 可審計性 527
12.14 節(jié)省開支并提升性能 .528
12.15 小結 530

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號