《中公版·Python高效開發(fā)指南:Python網絡爬蟲綜合開發(fā)》共分為十二章,涵蓋了Python網絡爬蟲綜合開發(fā)的相關知識,對重難點內容進行了針對性講解。本書面向Python網絡爬蟲開發(fā)的初學者,按照由淺入深、循序漸進的規(guī)律,從講解網絡爬蟲開發(fā)基礎知識,到講解如何開發(fā)單個.py文件的Python爬蟲程序,后講解基于Scrapy爬蟲框架的網絡爬蟲開發(fā)?!?網絡爬蟲概述(章)介紹了網絡爬蟲的基礎知識,包括定義、分類、原理和搜索策略等概念性內容?!?Python網絡爬蟲開發(fā)基礎(第二章)介紹了Python開發(fā)環(huán)境的搭建,重點介紹了PyCharm的使用。另外,還詳細介紹了HTTP協議的相關知識,并介紹了HTML、JavaScript和XPath?!?開發(fā)單個.py文件的爬蟲程序(第三章、第四章)介紹了如何開發(fā)單個.py文件的Python爬蟲程序,該程序采用Request模塊獲取數據,并采用XPath、BeautifulSoup4和PyQuery模塊進行解析。● 開發(fā)Python網絡爬蟲相關技術(第五章至第十章)介紹了Python網絡爬蟲開發(fā)中廣泛應用的技術,包括正則表達式、數據接口、數據庫的使用、表單的使用、模擬登錄、反反爬蟲方法和Selenium模擬瀏覽器等,并結合豐富的小案例來展示知識點?!?Scrapy爬蟲框架(第十一章、第十二章)介紹了基于Scrapy爬蟲框架的爬蟲開發(fā)和分布式爬蟲框架scrapy-redis,以及爬蟲的部署。