本書主要以純案例驅動的形式,分別使用和結合使用requests庫、selenium庫,從互聯(lián)網上收集數(shù)據(jù)。主要內容包括收集靜態(tài)網頁數(shù)據(jù),網頁解析,JSON數(shù)據(jù),JSON解析,多級翻頁,cookie和session,驗證登錄,多線程,數(shù)據(jù)的存儲,收集到的數(shù)據(jù)包括靜態(tài)網頁數(shù)據(jù)、json、圖片、音頻、視頻等數(shù)據(jù),并對獲取的數(shù)據(jù)進行清洗。適合Python初學者,也適合研究Python的廣大科研人員、學者、工程技術人員。本教材采用純的案例,和簡單的注釋,其他一些先修的知識是在其他課程有開設。