注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)數(shù)據(jù)采集與預(yù)處理

數(shù)據(jù)采集與預(yù)處理

數(shù)據(jù)采集與預(yù)處理

定 價(jià):¥42.00

作 者: 周勇,楊倩,廖寧,余秋蓮 編
出版社: 西安電子科技大學(xué)出版社
叢編項(xiàng): 新工科應(yīng)用型人才培養(yǎng)計(jì)算機(jī)類系列教材
標(biāo) 簽: 暫缺

ISBN: 9787560663562 出版時(shí)間: 2022-02-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 288 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  隨著國(guó)家大數(shù)據(jù)相關(guān)政策、規(guī)劃的密集出臺(tái),大數(shù)據(jù)、人工智能商業(yè)落地速度加快,其在各個(gè)領(lǐng)域的應(yīng)用也越來(lái)越廣泛,其中面向企業(yè)服務(wù)、金融、醫(yī)療健康、電子政務(wù)、電子商務(wù)等細(xì)分領(lǐng)域的大數(shù)據(jù)應(yīng)用展現(xiàn)出巨大的潛力。大數(shù)據(jù)是需要新處理模式才能適應(yīng)的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn),被譽(yù)為“未來(lái)的新石油”,以至于數(shù)據(jù)的獲取、存儲(chǔ)、搜索、共享、分析以及可視化呈現(xiàn)都成為當(dāng)前重要的研究課題。本書重點(diǎn)講述數(shù)據(jù)采集與預(yù)處理的相關(guān)內(nèi)容,并以真實(shí)案例介紹不同數(shù)據(jù)源的采集方式及基本的數(shù)據(jù)預(yù)處理方法。全書共lO章。其中,第1章為概述,第2~5章介紹靜態(tài)網(wǎng)頁(yè)數(shù)據(jù)爬取,第6章介紹動(dòng)態(tài)網(wǎng)頁(yè)數(shù)據(jù)爬取,第7、8章介紹爬蟲(chóng)(Scrapy)框架應(yīng)用,第9章介紹數(shù)據(jù)預(yù)處理,第10章給出了一個(gè)綜合項(xiàng)目實(shí)訓(xùn)。本書可作為高校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)相關(guān)課程的教材或教學(xué)參考書,也可作為人工智能、大數(shù)據(jù)領(lǐng)域從業(yè)者的自學(xué)參考書。

作者簡(jiǎn)介

暫缺《數(shù)據(jù)采集與預(yù)處理》作者簡(jiǎn)介

圖書目錄

第1章 概述
1.1 大數(shù)據(jù)采集
1.1.1 大數(shù)據(jù)來(lái)源
1.1.2 大數(shù)據(jù)采集方式
1.1.3 數(shù)據(jù)預(yù)處理
1.2 網(wǎng)絡(luò)爬蟲(chóng)原理和分類
1.2.1 爬蟲(chóng)原理
1.2.2 爬蟲(chóng)分類
1.2.3 常用爬蟲(chóng)工具
1.3 網(wǎng)絡(luò)爬蟲(chóng)法律規(guī)范
1.3.1 數(shù)據(jù)隱私保護(hù)
1.3.2 Robots協(xié)議
1.3.3 法律法規(guī)
本章小結(jié)
本章習(xí)題
第2章 Python基礎(chǔ)
2,1 Python環(huán)境搭建
2.1.1 Python解釋器
2.1.2 PyCharm的安裝
2.2 Python基礎(chǔ)
2.2.1 Python語(yǔ)法基礎(chǔ)
2.2.2 數(shù)據(jù)類型
2.2.3 程序結(jié)構(gòu)
2.2.4 函數(shù)
2.2.5 面向?qū)ο?br /> 本章小結(jié)
本章習(xí)題
第3章 靜態(tài)網(wǎng)頁(yè)爬取
3.1 HTTP協(xié)議概述
3.1.1 請(qǐng)求響應(yīng)模型
3.1.2 請(qǐng)求報(bào)文
3.1.3 響應(yīng)報(bào)文
3.2 使用Requests庫(kù)提取網(wǎng)頁(yè)數(shù)據(jù)
3.2.1 Requests庫(kù)的安裝
3.2.2 Requests庫(kù)的請(qǐng)求方法
3.2.3 使用Requests庫(kù)發(fā)送GET請(qǐng)求
3.2.4 使用Requests庫(kù)發(fā)送POST請(qǐng)求
3.2.5 Requests庫(kù)的響應(yīng)對(duì)象
3.2.6 HTTP狀態(tài)碼
3.2.7 定制請(qǐng)求頭
3.2.8 Requests庫(kù)發(fā)送GET請(qǐng)求的通用代碼
3.3 使用urllib庫(kù)提取網(wǎng)頁(yè)數(shù)據(jù)
3.3.1 使用urllib庫(kù)發(fā)送GET請(qǐng)求
3.3.2 使用urllib庫(kù)發(fā)送POST請(qǐng)求
3.3.3 urllib庫(kù)的用戶代理
3.4 案例1 QQ表情包圖片爬取
3.4.1 任務(wù)描述
3.4.2 任務(wù)分析
3.4.3 任務(wù)實(shí)現(xiàn)
3.5 案例 2手機(jī)號(hào)碼歸屬地查詢
3.5.1 任務(wù)描述
3.5.2 任務(wù)分析
3.5.3 任務(wù)實(shí)現(xiàn)
本章小結(jié)
本章習(xí)題
第4章 網(wǎng)頁(yè)解析
4.1 使用BeautifulSoup解析網(wǎng)頁(yè)
4.1.1 BeautifulSoup庫(kù)的安裝
4.1.2 BeautifulSoup解析器
……
第5章 數(shù)據(jù)存儲(chǔ)
第6章 動(dòng)態(tài)網(wǎng)頁(yè)爬取
第7章 Scrpay框架初探
第8章 Scrpay框架深入
第9章 數(shù)據(jù)預(yù)處理
第10章 招聘網(wǎng)站數(shù)據(jù)分析
參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)