图书介绍
数据仓库与数据挖掘PDF|Epub|txt|kindle电子书版本网盘下载
![数据仓库与数据挖掘](https://www.shukui.net/cover/58/31206456.jpg)
- 陈志泊主编;韩慧,王建新,孙俏等编著 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302197102
- 出版时间:2009
- 标注页数:250页
- 文件大小:53MB
- 文件页数:267页
- 主题词:数据库系统-高等学校-教材;数据采集-高等学校-教材
PDF下载
下载说明
数据仓库与数据挖掘PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据仓库的概念与体系结构1
1.1 数据仓库的概念、特点与组成1
1.1.1 数据仓库的特点2
1.1.2 数据仓库的组成2
1.2 数据挖掘的概念与方法4
1.2.1 数据挖掘的分析方法4
1.2.2 数据仓库与数据挖掘的关系4
1.3 数据仓库的技术、方法与产品4
1.3.1 OLAP技术4
1.3.2 数据仓库实施的关键环节和技术6
1.3.3 数据仓库实施方法论8
1.3.4 常用的数据仓库产品8
1.4 数据仓库系统的体系结构11
1.4.1 独立的数据仓库体系结构13
1.4.2 基于独立数据集市的数据仓库体系结构14
1.4.3 基于依赖型数据集市和操作型数据存储的数据仓库体系结构15
1.4.4 基于逻辑型数据集市和实时数据仓库的体系结构17
1.5 数据仓库的产生、发展与未来19
1.5.1 数据仓库的产生19
1.5.2 数据仓库的发展20
1.5.3 数据仓库的未来23
1.6 小结24
1.7 习题24
第2章 数据仓库的数据存储与处理26
2.1 数据仓库的数据结构26
2.2 数据仓库的数据特征27
2.2.1 状态数据与事件数据27
2.2.2 当前数据与周期数据27
2.2.3 元数据29
2.3 数据仓库的数据ETL过程30
2.3.1 ETL的目标30
2.3.2 ETL过程描述31
2.3.3 数据抽取32
2.3.4 数据清洗32
2.3.5 数据转换34
2.3.6 数据加载和索引35
2.4 多维数据模型36
2.4.1 多维数据模型及其相关概念37
2.4.2 多维数据模型的实现38
2.4.3 多维建模技术40
2.4.4 星型模式举例43
2.5 小结44
2.6 习题45
第3章 数据仓库系统的设计与开发46
3.1 数据仓库系统的设计与开发概述46
3.1.1 建立数据仓库系统的步骤46
3.1.2 数据仓库系统的生命周期47
3.1.3 建立数据仓库系统的思维模式48
3.1.4 数据仓库数据库的设计步骤48
3.2 基于SQL Server 2005的数据仓库数据库设计49
3.2.1 分析组织的业务状况及数据源结构50
3.2.2 组织需求调研,收集分析需求53
3.2.3 采用信息包图法设计数据仓库的概念模型56
3.2.4 利用星形图设计数据仓库的逻辑模型60
3.2.5 数据仓库的物理模型设计69
3.3 使用SQL Server 2005建立多维数据模型71
3.3.1 SQL Server 2005示例数据仓库环境的配置与使用72
3.3.2 基于SQL Server 2005示例数据库的多维数据模型74
3.4 小结87
3.5 习题87
第4章 关联规则89
4.1 概述89
4.2 引例90
4.3 经典算法93
4.3.1 Apriori算法93
4.3.2 FP-growth算法96
4.4 相关研究与应用99
4.4.1 分类99
4.4.2 SQL Server 2005中的关联规则应用99
4.5 小结105
4.6 习题106
第5章 数据分类107
5.1 引例107
5.2 分类问题概述108
5.2.1 分类的过程108
5.2.2 分类的评价准则109
5.3 决策树111
5.3.1 决策树的基本概念111
5.3.2 决策树算法ID3112
5.3.3 ID3算法应用举例114
5.3.4 决策树算法C4.5116
5.3.5 SQL Server 2005中的决策树应用118
5.3.6 决策树剪枝124
5.4 支持向量机124
5.5 近邻分类方法127
5.5.1 最近邻分类方法127
5.5.2 k-近邻分类方法127
5.5.3 近邻分类方法应用举例128
5.6 小结129
5.7 习题129
第6章 数据聚类130
6.1 引例130
6.2 聚类分析概述131
6.3 聚类分析中相似度的计算方法133
6.3.1 连续型属性的相似度计算方法133
6.3.2 二值离散型属性的相似度计算方法134
6.3.3 多值离散型属性的相似度计算方法135
6.3.4 混合类型属性的相似度计算方法136
6.4 k-means聚类算法137
6.4.1 k-means聚类算法的基本概念137
6.4.2 SQL server 2005中的k-means应用139
6.5 层次聚类方法143
6.5.1 层次聚类方法的基本概念143
6.5.2 层次聚类方法应用举例144
6.6 小结145
6.7 习题146
第7章 贝叶斯网络147
7.1 引例147
7.2 贝叶斯概率基础148
7.2.1 先验概率、后验概率和条件概率148
7.2.2 条件概率公式148
7.2.3 全概率公式149
7.2.4 贝叶斯公式150
7.3 贝叶斯网络概述151
7.3.1 贝叶斯网络的组成和结构151
7.3.2 贝叶斯网络的优越性151
7.3.3 贝叶斯网络的三个主要议题152
7.4 贝叶斯网络的预测、诊断和训练算法153
7.4.1 概率和条件概率数据153
7.4.2 贝叶斯网络的预测算法154
7.4.3 贝叶斯网络的诊断算法156
7.4.4 贝叶斯网络预测和诊断的综合算法157
7.4.5 贝叶斯网络的建立和训练算法158
7.5 SQL Server 2005中的贝叶斯网络应用160
7.6 小结165
7.7 习题165
第8章 粗糙集166
8.1 引例166
8.2 分类与知识167
8.2.1 等价关系和等价类167
8.2.2 分类168
8.3 粗糙集169
8.3.1 分类的运算169
8.3.2 分类的表达能力169
8.3.3 上近似集和下近似集169
8.3.4 正域、负域和边界170
8.3.5 粗糙集应用举例170
8.3.6 粗糙集的性质171
8.4 辨识知识的简化172
8.4.1 集合近似精度的度量172
8.4.2 分类近似的度量172
8.4.3 等价关系的可省略、独立和核173
8.4.4 等价关系简化举例174
8.4.5 知识的相对简化174
8.4.6 知识的相对简化举例175
8.5 决策规则简化175
8.5.1 知识依赖性的度量175
8.5.2 简化决策规则176
8.5.3 可辨识矩阵178
8.6 小结179
8.7 习题180
第9章 神经网络181
9.1 引例181
9.2 人工神经网络182
9.2.1 人工神经网络概述182
9.2.2 神经元模型183
9.2.3 网络结构184
9.3 BP算法185
9.3.1 网络结构和数据示例185
9.3.2 有序导数186
9.3.3 计算误差信号对参数的有序导数187
9.3.4 梯度下降188
9.3.5 BP算法描述188
9.4 SQL Server 2005中的神经网络应用189
9.5 小结195
9.6 习题196
第10章 遗传算法197
10.1 概述197
10.2 相关概念198
10.3 基本步骤199
10.3.1 概述199
10.3.2 引例200
10.4 算法设计202
10.4.1 编码方式202
10.4.2 种群规模203
10.4.3 适应度函数204
10.4.4 遗传算子204
10.4.5 终止条件206
10.5 相关研究与应用206
10.6 小结208
10.7 习题208
第11章 统计分析210
11.1 线性回归模型210
11.1.1 线性回归模型的参数估计211
11.1.2 线性回归方程的判定系数212
11.1.3 线性回归方程的检验213
11.1.4 统计软件中的线性回归分析214
11.1.5 SQL Server 2005中的线性回归应用215
11.2 Logistic回归模型221
11.2.1 Logistic回归模型的参数估计221
11.2.2 统计软件中Logistic回归的结果分析221
11.2.3 SQL Server 2005中的Logistic回归应用222
11.3 时间序列模型228
11.3.1 ARIMA模型229
11.3.2 建立ARIMA模型的步骤230
11.3.3 使用统计软件估计ARIMA模型230
11.3.4 SQL Server 2005中的时间序列分析232
11.4 小结237
11.5 习题237
第12章 文本和Web挖掘238
12.1 引例238
12.2 文本挖掘239
12.2.1 文本信息检索概述239
12.2.2 基于关键字的关联分析242
12.2.3 文档自动聚类242
12.2.4 自动文档分类243
12.2.5 自动摘要243
12.3 Web挖掘245
12.3.1 Web内容挖掘246
12.3.2 Web结构挖掘246
12.3.3 Web使用挖掘248
12.4 小结249
12.5 习题249
参考文献250