图书介绍

图灵程序设计丛书 预测分析与数据挖掘 RapidMiner实现PDF|Epub|txt|kindle电子书版本网盘下载

图灵程序设计丛书 预测分析与数据挖掘 RapidMiner实现
  • (美)瓦杰·考图(Vijay Kotu)著;严云译 著
  • 出版社: 北京:人民邮电出版社
  • ISBN:9787115473660
  • 出版时间:2018
  • 标注页数:326页
  • 文件大小:44MB
  • 文件页数:342页
  • 主题词:数据处理软件

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

图灵程序设计丛书 预测分析与数据挖掘 RapidMiner实现PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 引言1

1.1什么是数据挖掘2

1.1.1有意义模式的提取2

1.1.2代表性模型的构建2

1.1.3统计、机器学习和计算的搭配3

1.1.4算法4

1.2对数据挖掘的误解4

1.3数据挖掘的初衷5

1.3.1海量数据5

1.3.2多维6

1.3.3复杂问题6

1.4数据挖掘的种类7

1.5数据挖掘的算法8

1.6后续章节导览9

1.6.1数据挖掘的序曲9

1.6.2小插曲10

1.6.3主要内容:预测分析和数据挖掘算法10

1.6.4特别应用12

参考文献13

第2章 数据挖掘流程14

2.1先验知识16

2.1.1目标16

2.1.2研究问题的背景17

2.1.3数据17

2.1.4因果性与相关性18

2.2数据准备19

2.2.1数据探索19

2.2.2数据质量20

2.2.3缺失值20

2.2.4数据类型和转换20

2.2.5数据转换21

2.2.6离群点21

2.2.7特征选择21

2.2.8 数据采样22

2.3建模22

2.3.1训练集和测试集23

2.3.2建模算法24

2.3.3模型评估25

2.3.4 集成建模26

2.4应用27

2.4.1生产准备27

2.4.2方法整合27

2.4.3响应时间28

2.4.4重构模型28

2.4.5知识融合28

2.5新旧知识29

2.6后续章节预告29

参考文献29

第3章 数据探索31

3.1数据探索的目标31

3.2走进数据32

3.3描述性统计分析34

3.3.1单变量探索35

3.3.2多变量探索36

3.4数据可视化39

3.4.1一个维度内数据频率分布的可视化39

3.4.2直角坐标系内多变量的可视化43

3.4.3高维数据通过投影的可视化48

3.5数据探索导览50

参考文献51

第4章 分类52

4.1决策树52

4.1.1算法原理53

4.1.2算法实现59

4.1.3小结71

4.2规则归纳72

4.2.1建立规则方法73

4.2.2算法原理74

4.2.3算法实现77

4.2.4小结81

4.3 k近邻算法81

4.3.1算法原理82

4.3.2算法实现88

4.3.3小结91

4.4朴素贝叶斯91

4.4.1算法原理93

4.4.2算法实现100

4.4.3小结102

4.5人工神经网络102

4.5.1算法原理105

4.5.2 算法实现108

4.5.3小结110

4.6支持向量机111

4.6.1概念和术语111

4.6.2算法原理114

4.6.3算法实现116

4.6.4小结122

4.7集成学习模型122

4.7.1集体的智慧123

4.7.2算法原理124

4.7.3算法实现126

4.7.4小结134

参考文献134

第5章 回归方法137

5.1线性回归139

5.1.1算法原理139

5.1.2使用RapidMiner实战的目标与数据141

5.1.3算法实现142

5.1.4线性回归建模要点148

5.2 Logistic回归149

5.2.1快速入门Logistic回归150

5.2.2模型原理151

5.2.3模型实现155

5.2.4 Logistic回归小结158

5.3总结158

参考文献158

第6章 关联分析160

6.1挖掘关联规则的基本概念161

6.1.1项集162

6.1.2生成关联规则的一般步骤164

6.2 Apriori算法166

6.2.1使用Apriori算法找出高频项集167

6.2.2生成关联规则169

6.3 FP-Growth算法169

6.3.1生成FP树170

6.3.2高频项集的生成172

6.3.3 FP-Growth算法实现173

6.4总结176

参考文献176

第7章 聚类178

7.1聚类方法的种类179

7.2 k均值聚类182

7.2.1 k均值聚类原理183

7.2.2算法实现187

7.3 DBSCAN聚类191

7.3.1算法原理192

7.3.2算法实现195

7.3.3小结197

7.4 SOM197

7.4.1算法原理199

7.4.2算法实现202

7.4.3小结208

参考文献208

第8章 模型评估210

8.1混淆矩阵210

8.2 ROC曲线和AUC212

8.3提升曲线214

8.4评估预测结果217

8.5总结221

参考文献221

第9章 文本挖掘222

9.1文本挖掘算法的原理223

9.1.1 TF-IDF223

9.1.2术语和概念225

9.2使用聚类和分类算法实现文本挖掘229

9.2.1实例1:关键词聚类229

9.2.2实例2:预测博客作者的性别232

9.3总结241

参考文献242

第10章 时间序列预测243

10.1基于数据的时序分析245

10.1.1朴素预测法245

10.1.2简单平均法246

10.1.3移动平均法246

10.1.4加权移动平均法247

10.1.5指数平滑法247

10.1.6 Holt双参数指数平滑法248

10.1.7 Holt-Winter三参数指数平滑法249

10.2基于模型的预测方法250

10.2.1线性回归251

10.2.2多项式回归252

10.2.3考虑季节性的线性回归模型252

10.2.4自回归模型与ARIMA254

10.2.5基于RapidMiner的实现254

10.3总结261

参考文献261

第11章 异常检测262

11.1异常检测的基本概念262

11.1.1出现离群点的原因262

11.1.2异常检测的方法264

11.2基于距离的离群点检测方法266

11.2.1方法原理267

11.2.2方法实现268

11.3基于密度的离群点检测方法270

11.3.1方法原理270

11.3.2方法实现271

11.4局部离群因子272

11.5总结274

参考文献275

第12章 特征选择276

12.1特征选择方法概览276

12.2主成分分析278

12.2.1算法原理279

12.2.2 算法实现280

12.3以信息论为基础对数值型数据进行筛选284

12.4以卡方检验为基础对类别型数据进行筛选286

12.5基于封装器的特征选择289

12.5.1向后消除法以缩减数据集大小290

12.5.2哪些变量被消除了292

12.6总结293

参考文献294

第13章RapidMiner入门295

13.1用户操作界面以及介绍295

13.1.1图形用户操作界面的介绍295

13.1.2 RapidMiner软件的术语296

13.2数据导入和导出工具299

13.3数据可视化工具302

13.3.1单一变量可视化304

13.3.2二维数据可视化304

13.3.3多维数据可视化304

13.4数据转换工具305

13.5数据抽样与处理缺失值工具309

13.6最优化工具312

13.7总结317

参考文献317

数据挖掘算法的比较319

热门推荐