图书介绍
数据挖掘原理与算法PDF|Epub|txt|kindle电子书版本网盘下载
![数据挖掘原理与算法](https://www.shukui.net/cover/53/30023898.jpg)
- 毛国君,段立娟编著 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302415817
- 出版时间:2016
- 标注页数:334页
- 文件大小:47MB
- 文件页数:346页
- 主题词:数据采集-高等学校-教材
PDF下载
下载说明
数据挖掘原理与算法PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 绪论1
1.1 数据挖掘技术的产生与发展2
1.1.1 数据挖掘技术的商业需求分析2
1.1.2 数据挖掘产生的技术背景分析3
1.1.3 大数据时代的数据挖掘技术需求分析5
1.2 数据挖掘研究的发展趋势7
1.3 数据挖掘概念10
1.3.1 从商业角度看数据挖掘技术10
1.3.2 数据挖掘的技术含义10
1.3.3 数据挖掘研究的理论基础12
1.4 数据挖掘技术的分类问题13
1.5 数据挖掘常用的知识表示模式与方法15
1.5.1 广义知识挖掘15
1.5.2 关联知识挖掘17
1.5.3 类知识挖掘17
1.5.4 预测型知识挖掘22
1.5.5 特异型知识挖掘23
1.6 不同数据存储形式下的数据挖掘问题24
1.6.1 事务数据库中的数据挖掘24
1.6.2 关系型数据库中的数据挖掘25
1.6.3 数据仓库中的数据挖掘26
1.6.4 在关系模型基础上发展的新型数据库中的数据挖掘27
1.6.5 面向应用的新型数据源中的数据挖掘27
1.6.6 Web数据源中的数据挖掘27
1.7 粗糙集方法及其在数据挖掘中的应用29
1.7.1 粗糙集的一些重要概念29
1.7.2 粗糙集应用举例31
1.7.3 粗糙集方法在KDD中的应用范围32
1.8 数据挖掘的应用分析33
1.8.1 数据挖掘与CRM33
1.8.2 数据挖掘与社会网络34
1.8.3 数据挖掘应用的成功案例分析35
1.9 本章小结和文献注释37
习题142
第2章 知识发现过程与应用结构44
2.1 知识发现的基本过程44
2.1.1 数据抽取与集成技术要点46
2.1.2 数据清洗与预处理技术要点46
2.1.3 数据的选择与整理技术要点47
2.1.4 数据挖掘技术要点47
2.1.5 模式评估技术要点47
2.2 数据库中的知识发现处理过程模型48
2.2.1 阶梯处理过程模型48
2.2.2 螺旋处理过程模型49
2.2.3 以用户为中心的处理模型50
2.2.4 联机KDD模型52
2.2.5 支持多数据源多知识模式的KDD处理模型54
2.3 知识发现软件或工具的发展57
2.3.1 独立的知识发现软件57
2.3.2 横向的知识发现工具集57
2.3.3 纵向的知识发现解决方案58
2.3.4 KDD系统介绍58
2.4 知识发现项目的过程化管理60
2.5 数据挖掘语言介绍62
2.5.1 数据挖掘语言的分类62
2.5.2 数据挖掘查询语言63
2.5.3 数据挖掘建模语言64
2.5.4 通用数据挖掘语言65
2.5.5 DMQL挖掘查询语言介绍66
2.6 本章小结和文献注释69
习题271
第3章 关联规则挖掘理论和算法72
3.1 基本概念与解决方法72
3.2 经典的频繁项目集生成算法分析73
3.2.1 项目集空间理论73
3.2.2 经典的发现频繁项目集算法74
3.2.3 关联规则生成算法76
3.3 Apriori算法的性能瓶颈问题78
3.4 Apriori的改进算法79
3.4.1 基于数据分割的方法79
3.4.2 基于散列的方法80
3.4.3 基于采样的方法81
3.5 项目集空间理论的发展82
3.5.1 Close算法83
3.5.2 FP-tree算法87
3.6 项目集格空间和它的操作90
3.7 基于项目集操作的关联规则挖掘算法92
3.7.1 关联规则挖掘空间92
3.7.2 三个实用算子92
3.7.3 最大频繁项目集格的生成算法94
3.7.4 ISS-DM算法执行示例94
3.8 改善关联规则挖掘质量问题95
3.8.1 用户主观层面95
3.8.2 系统客观层面96
3.9 约束数据挖掘问题96
3.9.1 约束在数据挖掘中的作用96
3.9.2 约束的类型97
3.10 时态约束关联规则挖掘100
3.11 关联规则挖掘中的一些更深入的问题103
3.11.1 多层次关联规则挖掘103
3.11.2 多维关联规则挖掘104
3.11.3 数量关联规则挖掘105
3.12 数量关联规则挖掘方法106
3.12.1 数量关联规则挖掘问题106
3.12.2 数量关联规则的分类107
3.12.3 数量关联规则挖掘的一般步骤108
3.12.4 数值属性离散化问题及算法111
3.13 本章小结和文献注释114
习题3116
第4章 分类方法119
4.1 分类的基本概念与步骤120
4.2 基于距离的分类算法122
4.3 决策树分类方法125
4.3.1 决策树基本算法概述126
4.3.2 ID3算法128
4.3.3 C4.5 算法133
4.4 贝叶斯分类138
4.4.1 贝叶斯定理138
4.4.2 朴素贝叶斯分类138
4.4.3 EM算法141
4.5 规则归纳145
4.5.1 AQ算法145
4.5.2 CN2算法149
4.5.3 FOIL算法156
4.6 与分类有关的其他问题160
4.6.1 分类数据预处理160
4.6.2 分类器性能的表示与评估161
4.7 本章小结和文献注释163
习题4165
第5章 聚类方法169
5.1 概述169
5.1.1 聚类分析在数据挖掘中的应用171
5.1.2 聚类分析算法的概念与基本分类171
5.1.3 距离与相似性的度量174
5.2 划分聚类方法177
5.2.1 k-平均算法177
5.2.2 PAM180
5.2.3 其他方法184
5.3 层次聚类方法184
5.3.1 AGNES算法185
5.3.2 DIANA算法186
5.3.3 其他聚类方法188
5.4 密度聚类方法189
5.5 其他聚类方法193
5.5.1 STING算法193
5.5.2 SOM算法194
5.5.3 COBWEB算法194
5.5.4 模糊聚类算法FCM195
5.6 本章小结和文献注释195
习题5197
第6章 时间序列和序列模式挖掘199
6.1 时间序列及其应用199
6.2 时间序列预测的常用方法200
6.2.1 确定性时间序列预测方法200
6.2.2 随机时间序列预测方法201
6.2.3 其他方法201
6.3 基于ARMA模型的序列匹配方法201
6.3.1 基本概念201
6.3.2 利用基本概念建立模型202
6.3.3 构造判别函数203
6.4 基于离散傅里叶变换的时间序列相似性查找204
6.4.1 完全匹配205
6.4.2 子序列匹配206
6.5 基于规范变换的查找方法208
6.5.1 基本概念209
6.5.2 查找方法209
6.6 序列挖掘211
6.6.1 基本概念212
6.6.2 数据源的形式212
6.6.3 序列模式挖掘的一般步骤214
6.7 AprioriAll算法215
6.8 AprioriSome算法218
6.9 GSP算法222
6.1 0本章小结和文献注释224
习题6227
第7章 Web挖掘技术229
7.1 Web挖掘的意义229
7.2 Web挖掘的分类230
7.3 Web挖掘的含义232
7.3.1 Web挖掘与信息检索232
7.3.2 Web挖掘与信息抽取232
7.4 Web挖掘的数据来源233
7.4.1 服务器日志数据233
7.4.2 在线市场数据234
7.4.3 Web页面234
7.4.4 Web页面超链接关系235
7.4.5 其他信息235
7.5 Web内容挖掘方法235
7.5.1 爬虫与Web内容挖掘236
7.5.2 虚拟的Web视图236
7.5.3 个性化与Web内容挖掘237
7.5.4 对Web页面内文本信息的挖掘237
7.5.5 对Web页面内多媒体信息挖掘238
7.5.6 Web页面内容的预处理238
7.6 Web访问信息挖掘方法239
7.6.1 Web访问信息挖掘的特点239
7.6.2 Web访问信息挖掘的意义241
7.6.3 Web访问信息挖掘的数据源242
7.6.4 Web访问信息挖掘的一般过程245
7.6.5 Web访问信息挖掘的数据清理246
7.6.6 用户识别方法247
7.6.7 会话识别方法249
7.6.8 其他预处理技术252
7.6.9 Web访问挖掘的应用方法252
7.6.10 Web访问信息挖掘的要素构成254
7.6.11 Web访问信息挖掘应用255
7.7 Web结构挖掘方法264
7.7.1 页面等级(分级)的评价方法264
7.7.2 PageRank算法265
7.7.3 权威页面和中心页面268
7.7.4 Web站点结构的预处理269
7.8 本章小结和文献注释271
习题7275
第8章 空间挖掘277
8.1 引言277
8.2 空间数据概要278
8.2.1 空间数据的复杂性特征278
8.2.2 空间查询问题279
8.2.3 空间数据结构280
8.2.4 专题地图284
8.3 空间数据挖掘基础284
8.4 空间统计学286
8.5 泛化与特化287
8.5.1 逐步求精287
8.5.2 泛化287
8.5.3 最临近方法289
8.5.4 统计信息网格方法289
8.6 空间规则291
8.7 空间分类算法293
8.7.1 ID3扩展293
8.7.2 空间决策树293
8.8 空间聚类算法294
8.8.1 基于随机搜索的聚类方法CLARANS扩展295
8.8.2 大型空间数据库基于距离分布的聚类算法DBCLASD296
8.8.3 BANG297
8.8.4 小波聚类297
8.8.5 近似值297
8.9 空间挖掘的其他问题299
8.10 空间数据挖掘原型系统介绍302
8.11 空间数据挖掘的研究现状304
8.12 空间数据挖掘的研究与发展方向305
8.13 空间数据挖掘与相关学科的关系307
8.13.1 空间数据挖掘与空间数据库307
8.13.2 空间数据挖掘与空间数据仓库308
8.13.3 空间数据挖掘与空间联机分析处理308
8.13.4 空间数据挖掘与地理信息系统309
8.14 数字地球310
8.15 本章小结和文献注释310
习题8313
参考文献314