图书介绍
基于机器学习算法的分类知识发现及其在文本分析中的应用PDF|Epub|txt|kindle电子书版本网盘下载
- 祁瑞华著 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302415763
- 出版时间:2015
- 标注页数:178页
- 文件大小:20MB
- 文件页数:188页
- 主题词:数据处理
PDF下载
下载说明
基于机器学习算法的分类知识发现及其在文本分析中的应用PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 概述1
1.1 分类知识发现1
1.1.1 知识发现的概念和过程1
1.1.2 数据挖掘中的知识表示模式4
1.1.3 分类知识发现主要算法7
1.1.4 不完整数据分类知识发现15
1.2 文本挖掘17
1.3 本书内容组织21
第2章 不完整数据分类算法研究23
2.1 不完整数据分类知识发现24
2.1.1 不完整数据的类型24
2.1.2 不完整数据的处理25
2.1.3 不完整数据分类算法29
2.1.4 健壮贝叶斯分类30
2.1.5 朴素信念分类32
2.2 对现有方法的思考34
2.2.1 朴素信念分类算法的权重假设简单34
2.2.2 缺乏属性数据和类标记同时缺失情况下分类知识发现的研究35
2.2.3 半监督算法的效率问题35
2.3 不完整数据加权朴素信念分类算法36
2.3.1 相关分析及相关系数37
2.3.2 加权保守推理规则39
2.3.3 加权朴素信念算法分类过程41
2.4 标准数据集UCI上的对比实验44
2.4.1 实验数据集及实验设计44
2.4.2 实验结果分析45
2.5 本章小结48
第3章 两阶段半监督加权朴素信念分类算法研究49
3.1 半监督分类知识发现研究现状49
3.2 问题分析52
3.2.1 未标记样本在分类学习中的作用52
3.2.2 现有半监督分类方法分析54
3.3 两阶段分类方法相关思路57
3.3.1 基于规则模型的两阶段分类58
3.3.2 两阶段半监督文本分类59
3.4 两阶段半监督加权朴素信念分类59
3.4.1 TSS-WNC分类主要过程60
3.4.2 时间复杂度分析63
3.5 在标准数据集UCI上的实验64
3.5.1 分类对比实验64
3.5.2 实验结果及分析64
3.5 本章小结65
第4章 放松区间优势的朴素信念分类算法研究66
4.1 问题分析66
4.2 区间优势比较66
4.3 基于放松区间优势推理规则的不完整数据分类73
4.3.1 放松的区间优势73
4.3.2 放松的区间优势推理规则74
4.3.3 基于放松区间优势推理规则的分类过程78
4.4 在标准数据集UCI上的实验78
4.4.1 RCIR-NCC分类对比实验78
4.4.2 实验结果分析82
4.5 本章小结84
第5章 典籍英译文体风格识别研究85
5.1 文体风格特征85
5.2 文体风格识别算法87
5.3 典籍英译文体风格向量空间模型89
5.3.1 典籍英译语料特点89
5.3.2 典籍英译多层面文体风格模型90
5.4 文体风格特征选择95
5.4.1 信息增益95
5.4.2 x2统计量97
5.4.3 典籍英译文体风格识别特征选择97
5.5 特征数据项缺失文体识别实验99
5.5.1 加权朴素信念文体风格识别实验102
5.5.2 两阶段半监督文体风格识别实验106
5.5.3 放松区间优势朴素信念文体风格识别实验114
5.5.4 类别不平衡文体识别实验116
5.6 本章小结123
第6章 基于特征缺失补偿最大熵模型的文本分类124
6.1 最大熵模型124
6.2 基于Gaussian先验平滑特征补偿的最大熵模型125
6.3 混合特征选择算法126
6.4 基于特征缺失补偿最大熵模型的文本分类127
6.5 本章小结130
第7章 基于文本分析的网络舆情研究131
7.1 基于微博客的网络舆情指标体系131
7.1.1 网络舆情指标体系132
7.1.2 基于微博客的网络舆情指标体系136
7.1.3 微博客舆情预警对策140
7.2 基于关键字的微博客舆情传播规律141
7.2.1 网络舆情传播规律141
7.2.2 微博客网络舆情传播规律和对策143
7.3 基于关键字的网络舆情个案研究144
7.3.1 个案研究环境及实验数据144
7.3.2 大连地区抢盐潮个案分析145
7.4 微博客舆情的跨语言特征148
7.4.1 跨语言微博客特征表示150
7.4.2 跨语言微博客舆情预警研究框架153
7.5 网络文本情感倾向154
7.5.1 网络文本情感分析粒度154
7.5.2 网络文本情感分析基本问题158
7.5.3 网络文本情感分析前沿问题161
7.5.4 网络文本情感分析研究框架162
7.6 本章小结164
参考文献165