图书介绍

智能搜索 大数据搜索引擎原理及算法解析PDF|Epub|txt|kindle电子书版本网盘下载

智能搜索 大数据搜索引擎原理及算法解析
  • 沙芸编著 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302535508
  • 出版时间:2019
  • 标注页数:199页
  • 文件大小:87MB
  • 文件页数:208页
  • 主题词:搜索引擎-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

智能搜索 大数据搜索引擎原理及算法解析PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 智能搜索引擎开发1

1.1 人工智能与智能搜索引擎1

1.2 Linux操作系统基础2

1.2.1 SSH远程登录2

1.2.2 Micro文本编辑器4

1.2.3 Linux Shell脚本基础4

1.2.4 Shell脚本5

1.2.5 AWK8

1.3 Java基础8

1.3.1 使用Ant9

1.3.2 使用Maven11

1.3.3 使用Gradle13

1.3.4 使用Groovy Shell16

1.3.5 使用JShell17

1.4 Python基础17

1.4.1 Windows下安装Python17

1.4.2 Linux下安装Python17

1.4.3 开发环境18

1.5 C#基础19

1.6 硬件基础21

1.7 本章小结22

第2章 搜索引擎理解语义23

2.1 处理文本23

2.2 基于文法的语言模型24

2.3 正则表达式查找文本25

2.4 中文词语切分与词性标注27

2.4.1 使用中文分词28

2.4.2 正向最大长度匹配法30

2.4.3 未登录串识别31

2.4.4 基本的N元模型34

2.5 隐马尔可夫模型43

2.5.1 数据基础43

2.5.2 维特比算法44

2.6 英文文本切分与标注48

2.6.1 句子切分48

2.6.2 标注词性50

2.7 命名实体识别52

2.7.1 人名识别52

2.7.2 人名识别规则53

2.8 文本归一化61

2.9 依存树模型62

2.10 情感分析63

2.11 本章小结66

第3章 搜索引擎听懂语音67

3.1 语音识别总体结构67

3.2 Kaldi快速入门68

3.2.1 安装Kaldi69

3.2.2 yesno例子69

3.2.3 数据准备70

3.2.4 词典准备71

3.2.5 构建一个简单的ASR74

3.3 使用FFmpeg提取音频82

3.4 时间序列82

3.5 动态时间规整84

3.6 傅里叶变换86

3.6.1 离散傅里叶变换86

3.6.2 快速傅里叶变换89

3.7 MFCC特征92

3.8 在线解码93

3.8.1 使用现成的模型93

3.8.2 使用Alex-ASR94

3.9 加权有限状态转换95

3.9.1 FSA96

3.9.2 FST97

3.9.3 WFST98

3.10 语音识别语料库99

3.10.1 TIMIT语音库99

3.10.2 中文语音库99

3.11 本章小结100

第4章 Elasticsearch分布式搜索引擎101

4.1 搭建Elasticsearch集群101

4.2 索引数据103

4.3 实现搜索接口107

4.4 搜索界面开发108

4.4.1 使用Spring Boot开发搜索界面109

4.4.2 使用.NET开发搜索界面132

4.5 检索模型142

4.5.1 使用BM25检索模型146

4.5.2 参数调优146

4.6 搜索中文优化147

4.7 Elasticsearch源代码分析152

4.7.1 导入源代码到Eclipse152

4.7.2 Guice框架152

4.7.3 Netty异步IO框架154

4.7.4 分布式设计与实现155

4.7.5 使用Lucene156

4.8 本章小结159

第5章 分布式计算平台160

5.1 Atomix框架160

5.1.1 Raft协议160

5.1.2 使用Atomix162

5.2 gRPC框架164

5.3 本章小结167

第6章 智能搜索案例分析168

6.1 医药垂直搜索引擎168

6.1.1 网络爬虫169

6.1.2 抓取PubMed177

6.1.3 MVC搜索界面开发179

6.1.4 构建知识库183

6.1.5 自动问答185

6.2 电商搜索188

6.2.1 电商爬虫188

6.2.2 商品搜索192

6.2.3 在线客服195

6.3 本章小结198

参考文献199

热门推荐