注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)Python數(shù)據(jù)分析實(shí)戰(zhàn):從Excel輕松入門Pandas

Python數(shù)據(jù)分析實(shí)戰(zhàn):從Excel輕松入門Pandas

Python數(shù)據(jù)分析實(shí)戰(zhàn):從Excel輕松入門Pandas

定 價(jià):¥79.00

作 者: 曾賢志
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787302602811 出版時(shí)間: 2022-05-01 包裝: 平裝-膠訂
開本: 16開 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書從零開始系統(tǒng)講解了使用Pandas導(dǎo)入Excel數(shù)據(jù),然后使用Pandas技術(shù)對(duì)數(shù)據(jù)做整理和分析,后導(dǎo)出為不同形式的Excel文件。完整實(shí)現(xiàn)了數(shù)據(jù)的導(dǎo)入、處理、輸出的處理流程。 全書共10章。第1章為Pandas數(shù)據(jù)處理環(huán)境的搭建,第2章為使用Pandas對(duì)Excel數(shù)據(jù)讀取與保存,第3章介紹與Pandas底層數(shù)據(jù)相關(guān)的NumPy庫(kù),第4章介紹了Pandas中DataFrame表格的增、刪、改、查等常用操作,第5章介紹了對(duì)Series與DataFrame兩種數(shù)據(jù)的運(yùn)算、分支、遍歷等處理,第6章介紹了字符串的各種清洗技術(shù),第7章介紹時(shí)間戳與時(shí)間差數(shù)據(jù)的處理,第8章介紹Pandas中分層索引及與索引相關(guān)的操作,第9章介紹了對(duì)數(shù)據(jù)的分組處理及做數(shù)據(jù)透視表處理,第10章介紹了表格的數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換,以及多表讀取與保存。書中包含相應(yīng)示例,不僅可以學(xué)會(huì)理論知識(shí)還可以靈活應(yīng)用。 本書可作為Excel愛好者和數(shù)據(jù)分析初學(xué)者的入門書籍,以及想提高數(shù)據(jù)分析效率,拓展數(shù)據(jù)分析手段相關(guān)人員的參考書籍。

作者簡(jiǎn)介

  曾賢志,Office技術(shù)培訓(xùn)專家,我要自學(xué)網(wǎng)專家講師,特邀技術(shù)圖書作者,擅長(zhǎng)使用VBA、SQL、Power BI、Python等技術(shù)做數(shù)據(jù)分析。著有《Power Query For Excel讓工作化繁為簡(jiǎn)》《加薪不加班:174個(gè)Excel函數(shù)案例闖職場(chǎng)》《從Excel到Python:用Python輕松處理Excel數(shù)據(jù)》等與數(shù)據(jù)分析相關(guān)的技術(shù)圖書。

圖書目錄

第1章Pandas數(shù)據(jù)處理環(huán)境搭建
1.1Pandas環(huán)境配置
1.1.1安裝Python發(fā)行版本Anaconda
1.1.2程序編寫工具Jupyter Notebook
1.2Python基礎(chǔ)操作
1.2.1變量
1.2.2注釋
1.2.3代碼縮進(jìn)
1.2.4數(shù)據(jù)結(jié)構(gòu)
1.2.5控制語(yǔ)句
1.2.6函數(shù)
第2章Pandas中數(shù)據(jù)的存取
2.1讀取Excel文件數(shù)據(jù)
2.2讀取CSV文件數(shù)據(jù)
2.3保存為Excel文件格式
2.4保存為CSV文件格式
2.5Pandas中表格的結(jié)構(gòu)
2.5.1DataFrame數(shù)據(jù)結(jié)構(gòu)
2.5.2Series數(shù)據(jù)結(jié)構(gòu)
第3章NumPy數(shù)據(jù)處理基石
3.1NumPy的定義
3.2NumPy數(shù)組的創(chuàng)建與轉(zhuǎn)換
3.2.1普通數(shù)組
3.2.2序列數(shù)組
3.2.3隨機(jī)數(shù)組
3.2.4轉(zhuǎn)換數(shù)組
3.3NumPy數(shù)組的預(yù)處理
3.3.1類型轉(zhuǎn)換
3.3.2缺失值處理
3.3.3重復(fù)值處理
3.4NumPy數(shù)組維度轉(zhuǎn)換
3.4.1數(shù)組維度轉(zhuǎn)換
3.4.2數(shù)組合并
3.5Series數(shù)據(jù)的創(chuàng)建
3.6DataFrame表格的創(chuàng)建
3.6.1使用NumPy數(shù)組創(chuàng)建DataFrame表格
3.6.2使用Python列表創(chuàng)建DataFrame表格
3.6.3使用Python字典創(chuàng)建DataFrame表格
第4章表格管理技術(shù)
4.1表格屬性獲取與修改
4.1.1表格屬性的獲取
4.1.2表格屬性修改
4.2表格的切片選擇
4.2.1切片法
4.2.2篩選法
4.2.3loc切片法
4.2.4iloc切片法
4.3添加表格的行和列
4.3.1添加行
4.3.2添加列
4.4刪除表格的行和列
4.4.1刪除行
4.4.2刪除列
4.4.3刪除有缺失值的行和列
4.5表格數(shù)據(jù)的修改
4.6鞏固案例
第5章數(shù)據(jù)處理基礎(chǔ)
5.1數(shù)據(jù)運(yùn)算處理
5.1.1運(yùn)算符與運(yùn)算函數(shù)
5.1.2Series與單值的運(yùn)算
5.1.3DataFrame與單值運(yùn)算
5.1.4Series與Series運(yùn)算
5.1.5DataFrame與DataFrame運(yùn)算
5.1.6DataFrame與Series運(yùn)算
5.1.7數(shù)據(jù)運(yùn)算時(shí)的對(duì)齊特性
5.2數(shù)據(jù)分支判斷
5.2.1條件判斷處理1(mask()與where())
5.2.2條件判斷處理2(np.where())
5.3數(shù)據(jù)遍歷處理
5.3.1遍歷Series元素(map())
5.3.2遍歷DataFrame行和列(apply())
5.3.3遍歷DataFrame元素(applymap())
5.4數(shù)據(jù)統(tǒng)計(jì)處理
5.4.1聚合統(tǒng)計(jì)
5.4.2邏輯統(tǒng)計(jì)
5.4.3極值統(tǒng)計(jì)
5.4.4排名統(tǒng)計(jì)
5.5鞏固案例
5.5.1根據(jù)不同蔬菜的采購(gòu)數(shù)量統(tǒng)計(jì)每天采購(gòu)金額
5.5.2篩選出成績(jī)表中各科目均大于或等于100的記錄
5.5.3篩選出成績(jī)表中各科目的和大于或等于300的記錄
5.5.4統(tǒng)計(jì)每個(gè)人各科目總分之和的排名
5.5.5統(tǒng)計(jì)每個(gè)人所有考試科目的科目
第6章字符串清洗技術(shù)
6.1正則
6.1.1正則表達(dá)式的導(dǎo)入與創(chuàng)建
6.1.2正則表達(dá)式處理函數(shù)
6.1.3正則表達(dá)式編寫規(guī)則
6.2拆分
6.2.1普通拆分
6.2.2正則拆分
6.2.3拆分次數(shù)
6.2.4拆為表格
6.2.5實(shí)例應(yīng)用
6.3提取
6.3.1將數(shù)據(jù)提取到列方向
6.3.2將數(shù)據(jù)提取到行方向
6.3.3實(shí)例應(yīng)用
6.4查找
6.4.1查找位置
6.4.2查找判斷
6.4.3查找數(shù)據(jù)
6.4.4實(shí)例應(yīng)用
6.5替換
6.5.1Series數(shù)據(jù)替換
6.5.2DataFrame表格替換
6.5.3實(shí)例應(yīng)用
6.6長(zhǎng)度
6.7重復(fù)
6.8修剪
6.9填充
6.9.1元素填充
6.9.2字符填充
6.10去重
6.10.1重復(fù)項(xiàng)判斷
6.10.2重復(fù)項(xiàng)刪除
6.11排序
6.11.1單列排序
6.11.2多列排序
6.11.3自定義排序
6.12合并
6.12.1Series數(shù)據(jù)自身元素合并
6.12.2Series數(shù)據(jù)與其他數(shù)據(jù)合并
6.13擴(kuò)展
6.14鞏固案例
6.14.1篩選出分?jǐn)?shù)中至少有3個(gè)大于或等于90分的記錄
6.14.2兩表查詢合并應(yīng)用
6.14.3給關(guān)鍵信息加掩碼
6.14.4提取文本型單價(jià)后與數(shù)量做求和統(tǒng)計(jì)
6.14.5提取不重復(fù)名單
6.14.6對(duì)文本中的多科目成績(jī)排序
第7章日期和時(shí)間處理技術(shù)
7.1時(shí)間戳
7.1.1單個(gè)時(shí)間戳
7.1.2時(shí)間戳序列
7.1.3時(shí)間戳轉(zhuǎn)換
7.1.4時(shí)間戳信息獲取
7.2時(shí)間差
7.2.1單個(gè)時(shí)間差
7.2.2時(shí)間差序列
7.2.3時(shí)間差信息獲取
7.2.4時(shí)間差偏移
7.3鞏固案例
7.3.1根據(jù)出生日期計(jì)算年齡
7.3.2將不規(guī)范日期整理為標(biāo)準(zhǔn)日期
7.3.3根據(jù)開始時(shí)間到結(jié)束時(shí)間的時(shí)長(zhǎng)計(jì)算金額
7.3.4根據(jù)借書起始時(shí)間及租借天數(shù)計(jì)算歸還日期
第8章高級(jí)索引技術(shù)
8.1Pandas索引
8.1.1Series索引
8.1.2DataFrame索引
8.2分層索引的設(shè)置
8.2.1Series的分層索引設(shè)置
8.2.2DataFrame的分層索引設(shè)置
8.3分層索引設(shè)置的4種方法
8.4文件導(dǎo)入導(dǎo)出時(shí)分層索引設(shè)置
8.5行索引與列數(shù)據(jù)的相互轉(zhuǎn)換
8.5.1列數(shù)據(jù)設(shè)置為行索引
8.5.2行索引設(shè)置為列數(shù)據(jù)
8.6分層索引切片
8.6.1選擇單行
8.6.2選擇單列
8.6.3選擇單值
8.6.4選擇多行多列
8.6.5選擇指定級(jí)別數(shù)據(jù)
8.6.6篩選索引
8.7索引的修改
8.7.1索引重命名
8.7.2索引重置
8.7.3索引排序
8.7.4索引層級(jí)交換
8.7.5索引刪除
8.8鞏固案例
8.8.1篩選出下半年總銷量大于上半年的記錄
8.8.2對(duì)文本型數(shù)字月份排序
8.8.3根據(jù)分?jǐn)?shù)返回等級(jí)設(shè)置索引
第9章數(shù)據(jù)匯總技術(shù)
9.1分組處理
9.1.1分組
9.1.2聚合
9.1.3轉(zhuǎn)換
9.1.4過(guò)濾
9.1.5高級(jí)分組
9.2數(shù)據(jù)透視表
9.2.1指定索引方向分組聚合
9.2.2多列執(zhí)行單種聚合
9.2.3單列執(zhí)行多種聚合
9.2.4多列執(zhí)行多種聚合
9.2.5指定列做指定聚合
9.2.6行索引和列索引分組聚合
9.2.7跟列數(shù)據(jù)長(zhǎng)度相同的數(shù)組做分組
9.2.8數(shù)據(jù)透視表缺失值處理
9.2.9數(shù)據(jù)透視表的行和列總計(jì)設(shè)置
9.3鞏固案例
9.3.1提取各分組的前兩名記錄
9.3.2按條件篩選各分組的記錄
9.3.3提取各分組下的值
9.3.4分組批量拆分表格到Excel文件
9.3.5將數(shù)據(jù)透視表拆分為Excel文件
第10章表格轉(zhuǎn)換技術(shù)
10.1表格方向轉(zhuǎn)換
10.1.1列索引數(shù)據(jù)轉(zhuǎn)換成行索引數(shù)據(jù)
10.1.2將行索引數(shù)據(jù)轉(zhuǎn)換成列索引數(shù)據(jù)
10.2表格縱橫拼接
10.2.1表格縱向拼接(初級(jí))
10.2.2表格縱向拼接(進(jìn)階)
10.2.3表格橫向拼接(初級(jí))
10.2.4表格橫向拼接(進(jìn)階)
10.3表格數(shù)據(jù)存取
10.3.1批量讀取
10.3.2批量保存
10.4鞏固案例
10.4.1多個(gè)工作表數(shù)據(jù)合并
10.4.2工資條制作
10.4.3特殊的縱向表格拼接
10.4.4多工作表合并與聚合處理
10.4.5跨表查詢后再聚合匯總
10.4.6將匯總結(jié)果分發(fā)到不同工作表
 

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)