图书介绍

数据挖掘教程PDF|Epub|txt|kindle电子书版本网盘下载

数据挖掘教程
  • 李保坤,张丽娟编著 著
  • 出版社: 成都:西南财经大学出版社
  • ISBN:9787811384406
  • 出版时间:2009
  • 标注页数:136页
  • 文件大小:16MB
  • 文件页数:147页
  • 主题词:数据采集-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘教程PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一章 介绍1

1.1 这本书的读者对象1

1.2 什么是数据挖掘1

1.3 数据挖掘的用途2

1.4 数据挖掘的起源3

1.5 术语和注释3

1.6 数据集合的组织5

1.7 数据挖掘迅速发展的因素5

第二章 数据挖掘过程概览7

2.1 数据挖掘的核心思想7

2.2 有约束学习和无约束学习10

2.3 数据挖掘的步骤10

2.4 SEMMA12

2.5 预备阶段12

附录:数据分块方法18

2.6 建立模型——线性回归的一个例子20

第三章 有约束学习——分类和预测26

3.1 一个分两类的分类法26

3.2 贝叶斯最小误差法则27

3.3 采用分类误差作为标准的分类方法评价29

3.4 不对称错误分类代价和贝叶斯风险31

3.5 分层采样和不对称代价32

3.6 推广到多于两类的情况32

3.7 提升图33

3.8 波士顿住房(两类)33

3.9 采用三分(Triage)策略的分类37

第四章 多元线性回归38

4.1 多元线性回归复习38

4.2 回归过程举例40

4.3 线性回归的自变量选择43

4.4 线性回归分析的一般步骤48

第五章 Logistic回归50

5.1 一个简单例子50

5.2 Logistic回归模型52

5.3 机会比(Odds Ratio)54

5.4 概率56

5.5 模型拟合的又一个例子57

附录A:同归系数的极大似然估计和置信区间计算60

附录B:使用西南财大数据挖掘系统对波士顿住宅区的数据处理62

第六章 神经网络65

6.1 神经元(一个数学模型)65

6.2 神经网络66

6.3 费歇尔(Fisher)的鸢尾花数据68

6.4 后向传播算法——分类70

6.5 调整网络用于预测71

6.6 多个区域最优和遍数71

6.7 过分拟合和训练遍数的选择72

6.8 结构的适应性选择72

6.9 成功应用的例子72

附录:使用西南财大数据挖掘系统的神经网络分类演示73

第七章 分类与回归树75

7.1 分类树75

7.2 递归分区75

7.3 骑乘式割草机(Riding Mowers)76

7.4 剪枝(Pruning)81

7.5 最小误差树(Minimum Error Tree)84

7.6 最佳剪枝树(Best Pruned Tree)85

7.7 树的分类规则86

7.8 回归树(Regression Trees)86

附录:西南财大数据挖掘系统分类树介绍87

第八章 判别分析91

8.1 骑乘式割草机91

8.2 Fisher的线性判别函数91

8.3 贝叶斯线性分类函数93

8.4 距离度量95

8.5 分类误差96

8.6 鸢尾花的分类96

附录A:马氏距离99

附录B:西南财大数据挖掘系统的判别分析99

第九章 其他有约束学习方法102

9.1 K—最近邻点(K-NN)102

9.2 简单贝叶斯(Naive Bayes)105

9.3 简单贝叶斯分类实例108

第十章 关联分析——关联法则110

10.1 发现交易数据库里的关联法则110

10.2 支持度和置信度110

10.3 增益和重要性113

10.4 相关系数和负关联法则113

10.5 先验算法114

10.6 缺点117

第十一章 数据精简和探索118

11.1 降维——主成分分析118

11.2 成年长子的头部测量数值118

11.3 主成分119

11.4 葡萄酒的特征121

11.5 数据标准化124

11.6 主成分和正交最小二乘125

第十二章 聚类分析126

12.1 什么是聚类分析?126

12.2 电力公司数据126

12.3 层次聚类法129

12.4 k—均值算法130

12.5 相似测度131

12.6 其他的距离测度133

附录:西南财大数据挖掘系统的聚类分析134

热门推荐