第1章 數(shù)據(jù)分析與Python 語言
1.1 數(shù)據(jù)分析概述
1.1.1 數(shù)據(jù)分析方法
1.1.2 數(shù)據(jù)分析工具
1.2 數(shù)據(jù)及其來源
1.2.1 數(shù)據(jù)及其分類
1.2.2 數(shù)據(jù)的來源
1.3 Python 的初步使用
1.3.1 Python 的下載與安裝
1.3.2 模塊的安裝與加載
1.3.3 查看幫助文件
1.3.4 編寫代碼腳本
1.3.5 數(shù)據(jù)讀取和保存
第2章 Python 數(shù)據(jù)處理
2.1 Python 的基本數(shù)據(jù)結構
2.1.1 數(shù)字和字符串
2.1.2 元組和列表
2.1.3 字典和集合
2.2 數(shù)組、序列和數(shù)據(jù)框
2.2.1 numpy 中的數(shù)組
2.2.2 pandas 中的序列和數(shù)據(jù)框
2.3 數(shù)據(jù)抽樣和篩選
2.3.1 抽取簡單隨機樣本
2.3.2 數(shù)據(jù)篩選
2.3.3 生成隨機數(shù)
2.4 生成頻數(shù)分布表
2.4.1 類別數(shù)據(jù)的頻數(shù)表
2.4.2 數(shù)值數(shù)據(jù)的類別化
第3章 數(shù)據(jù)可視化分析
3.1 Python 繪圖基礎
3.1.1 Python 的主要繪圖模塊
3.1.2 基本繪圖函數(shù)
3.1.3 圖形布局
3.1.4 圖形顏色、線型和標記
3.2 類別數(shù)據(jù)可視化
3.2.1 條形圖
3.2.2 瀑布圖和漏斗圖
3.2.3 餅圖和環(huán)形圖
3.2.4 樹狀圖
3.3 數(shù)值數(shù)據(jù)可視化
3.3.1 分布特征可視化
3.3.2 變量間關系可視化
3.3.3 樣本相似性可視化
3.4 時間序列可視化
3.4.1 折線圖
3.4.2 面積圖
3.5 合理使用圖表
第4章 數(shù)據(jù)的描述分析
4.1 數(shù)據(jù)水平的描述
4.1.1 平均數(shù)
4.1.2 分位數(shù)
4.1.3 眾數(shù)
4.2 數(shù)據(jù)差異的描述
4.2.1 極差和四分位差
4.2.2 方差和標準差
4.2.3 離散系數(shù)
4.2.4 標準分數(shù)
4.3 分布形狀的描述
4.3.1 偏度系數(shù)
4.3.2 峰度系數(shù)
4.4 Python 的綜合描述函數(shù)
第5 章 推斷分析基本方法
5.1 推斷的理論基礎
5.1.1 隨機變量和概率分布
5.1.2 統(tǒng)計量的抽樣分布
5.2 參數(shù)估計
5.2.1 估計方法和原理
5.2.2 總體均值的區(qū)間估計
5.2.3 總體比例的區(qū)間估計
5.3 假設檢驗
5.3.1 假設檢驗的步驟
5.3.2 總體均值的檢驗
5.3.3 總體比例的檢驗
第6章 相關與回歸分析
6.1 變量間關系的分析
6.1.1 變量間的關系
6.1.2 相關關系的描述
6.1.3 相關關系的度量
6.2 一元線性回歸建模
6.2.1 回歸模型與回歸方程
6.2.2 參數(shù)的最小平方估計
6.3 模型評估和檢驗
6.3.1 模型評估
6.3.2 顯著性檢驗
6.4 回歸預測和殘差分析
6.4.1 回歸預測
6.4.2 殘差分析
第7章 時間序列分析
7.1 增長率分析
7.1.1 增長率與平均增長率
7.1.2 年化增長率
7.2 時間序列的成分和預測方法
7.2.1 時間序列的成分
7.2.2 預測方法的選擇與評估
7.3 簡單指數(shù)平滑預測
7.4 趨勢預測
7.4.1 線性趨勢預測
7.4.2 非線性趨勢預測
7.5 時間序列平滑
參考文獻