图书介绍
数据挖掘PDF|Epub|txt|kindle电子书版本网盘下载
![数据挖掘](https://www.shukui.net/cover/27/32477059.jpg)
- 宋万清,杨寿渊,陈剑雪,高永彬编著 著
- 出版社: 北京:中国铁道出版社
- ISBN:7113251673
- 出版时间:2019
- 标注页数:180页
- 文件大小:64MB
- 文件页数:189页
- 主题词:
PDF下载
下载说明
数据挖掘PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据挖掘概述1
1.1 什么是数据挖掘1
1.1.1 数据、信息和知识1
1.1.2 数据挖掘的定义2
1.1.3 数据挖掘的发展简史3
1.2 数据挖掘的基本流程及方法概述4
1.2.1 数据挖掘的基本流程4
1.2.2 数据挖掘的任务和方法概述6
1.3 数据挖掘的应用9
1.3.1 数据挖掘在商务领域的应用9
1.3.2 数据挖掘在医疗和医学领域的应用10
1.3.3 数据挖掘在银行和保险领域的应用10
1.3.4 数据挖掘在社交媒体领域的应用11
习题11
第2章 数据的描述与可视化12
2.1 概述12
2.2 数据对象与属性类型12
2.2.1 什么是属性12
2.2.2 标称属性12
2.2.3 二元属性13
2.2.4 序数属性13
2.2.5 数值属性14
2.2.6 离散属性与连续属性14
2.3 数据的基本统计描述15
2.3.1 中心趋势度量15
2.3.2 度量数据散布:极差、四分位数、方差、标准差和四分位数极差17
2.3.3 数据基本统计的图形描述19
2.4 数据可视化23
2.4.1 基于像素的可视化23
2.4.2 几何投影可视化25
2.4.3 基于图符的可视化27
2.4.4 层次可视化28
2.4.5 可视化复杂对象和关系30
2.5 数据相似性和相异性度量32
2.5.1 数据矩阵与相异性矩阵32
2.5.2 标称属性的邻近性度量33
2.5.3 二元属性的邻近性度量34
2.5.4 数值属性的相异性:闵可夫斯基距离36
2.5.5 序数属性的邻近性度量37
2.5.6 混合类型属性的相异性38
2.5.7 余弦相似性40
习题40
第3章 数据的采集和预处理42
3.1 概述42
3.1.1 大数据采集的特点42
3.1.2 大数据采集的方法43
3.2 数据预处理的目的和任务44
3.3 数据清洗45
3.3.1 缺失值清洗46
3.3.2 异常值清洗48
3.3.3 格式内容清洗50
3.3.4 逻辑错误清洗50
3.3.5 非需求数据清洗51
3.3.6 关联性验证51
3.4 数据集成52
3.5 数据变换53
习题56
第4章 数据的归约57
4.1 概述57
4.2 属性的选择与数值归约57
4.2.1 属性的评估准则58
4.2.2 属性子集选择方法59
4.2.3 数值归约60
4.3 线性回归61
4.4 主成分分析63
习题66
第5章 关联规则挖掘67
5.1 概述67
5.2 关联规则的分类68
5.3 关联规则的研究步骤68
5.3.1 关联规则挖掘算法的分类69
5.3.2 各种算法类型的对比70
5.4 Apriori算法分析70
5.5 实例分析70
5.6 关联规则的推广(GRI)72
5.7 关联规则的深入挖掘74
习题75
第6章 分类与预测76
6.1 概述76
6.1.1 基本概念76
6.1.2 数据分类的一般方法77
6.2 决策树模型77
6.2.1 决策树的工作原理78
6.2.2 决策树的适用问题78
6.2.3 ID3算法79
6.2.4 决策树的结点划分80
6.3 贝叶斯分类模型81
6.3.1 贝叶斯定理81
6.3.2 贝叶斯模型的特点82
6.4 线性判别模型82
6.5 逻辑回归模型83
6.5.1 逻辑回归模型概述83
6.5.2 逻辑回归模型的基本概念83
6.6 模型的评估与选择85
6.6.1 评估分类器性能的度量85
6.6.2 保持方法和随机二次抽样90
6.6.3 交叉验证90
6.6.4 自助法91
6.6.5 使用统计显著性检验选择模型91
习题93
第7章 非线性预测模型94
7.1 概述94
7.2 支持向量机94
7.2.1 支持向量机分类原理95
7.2.2 非线性支持向量机99
7.2.3 支持向量机回归预测102
7.2.4 基于支持向量机的预测分析106
7.3 神经网络108
7.3.1 人工神经网络模型与分类108
7.3.2 BP神经网络112
7.3.3 RBF神经网络117
7.3.4 基于神经网络的预测分析121
习题124
第8章 聚类分析125
8.1 概述125
8.2 k-均值聚类126
8.3 k-中心聚类129
8.4 聚类评估130
8.4.1 外部法130
8.4.2 内部法131
8.4.3 可视化方法131
习题131
第9章 深度学习简介133
9.1 概述133
9.2 来自人类视觉机理的启发134
9.3 深层神经网络136
9.4 卷积神经网络137
9.4.1 卷积和池化138
9.4.2 CNN网络框架141
9.4.3 CNN的应用142
9.5 RNN循环神经网络144
9.5.1 RNN的结构145
9.5.2 RNN的缺陷146
9.5.3 RNN的应用147
9.6 生成对抗网络147
9.6.1 GAN的原理与架构148
9.6.2 GAN的应用150
习题151
第10章 使用Weka进行数据挖掘153
10.1 概述153
10.2 Weka关联数据挖掘的基本操作153
10.3 数据格式158
10.4 关联规则挖掘160
10.5 分类与回归163
10.6 聚类分析166
习题167
附录A 拉格朗日优化法169
参考文献177