图书介绍

轻松学大数据挖掘 算法、场景与数据产品PDF|Epub|txt|kindle电子书版本网盘下载

轻松学大数据挖掘 算法、场景与数据产品
  • 汪榕著 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121329265
  • 出版时间:2018
  • 标注页数:198页
  • 文件大小:62MB
  • 文件页数:212页
  • 主题词:数据采集

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

轻松学大数据挖掘 算法、场景与数据产品PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 数据情怀篇1

1.1数据之禅1

1.2数据情怀1

1.2.1数据情怀这股劲2

1.2.2对数据情怀的理解2

1.3大数据时代的我们4

1.4成为DT时代的先驱者6

1.4.1数据没有寒冬6

1.4.2数据生态问题7

1.4.3健康的数据生态8

1.4.4结尾8

第2章 数据入门9

2.1快速掌握SQL的基础语法9

2.1.1初识SQL9

2.1.2学会部署环境10

2.1.3常用的SQL语法(上篇)13

2.1.4常用的SQL语法(下篇)17

2.2在Windows 7操作系统上搭建IPython Notebook25

2.2.1学习Python的初衷25

2.2.2搭建IPython Notebook26

2.2.3 IPython.exe Notebook的使用说明27

2.2.4配置IPython Notebook远程调用27

2.3快速掌握Python的基本语法30

2.4用Python搭建数据分析体系38

2.4.1构建的初衷38

2.4.2构建思路39

2.4.3开发流程39

2.5 Python学习总结44

2.5.1关于Python45

2.5.2 Python其他知识45

第3章 大数据工具篇48

3.1 Hadoop伪分布式的安装配置48

3.1.1部署CentOS环境48

3.1.2部署Java环境50

3.1.3部署Hadoop伪分布式环境51

3.2数据挖掘中的MapReduce编程54

3.2.1学习MapReduce编程的目的54

3.2.2 MapReduce的代码规范55

3.2.3简单的案例58

3.3利用MapReduce中的矩阵相乘60

3.3.1矩阵的概念60

3.3.2不同场景下的矩阵相乘61

3.4数据挖掘中的Hive技巧67

3.4.1面试心得67

3.4.2用Python执行HQL命令67

3.4.3必知的HQL知识69

3.5数据挖掘中的HBase技巧75

3.5.1知晓相关依赖包75

3.5.2从HBase中获取数据76

3.5.3往HBase中存储数据77

第4章 大数据挖掘基础篇81

4.1 MapReduce和Spark做大数据挖掘的差异81

4.1.1初识Hadoop生态系统81

4.1.2知晓Spark的特点83

4.1.3编程的差异性85

4.1.4它们之间的灵活转换88

4.1.5选择合适的工具89

4.2搭建大数据挖掘开发环境90

4.3动手实现算法工程99

4.3.1知晓Spark On Yam的运作模式101

4.3.2创作第一个数据挖掘算法102

4.3.3如何理解“朴素”二字103

4.3.4如何动手实现朴素贝叶斯算法103

第5章 大数据挖掘认知篇107

5.1理论与实践的差异107

5.2数据挖掘中的数据清洗110

5.2.1数据清洗的那些事110

5.2.2大数据的必杀技111

5.2.3实践中的数据清洗112

5.3数据挖掘中的工具包120

5.3.1业务模型是何物120

5.3.2想做一个好的模型121

第6章 大数据挖掘算法篇123

6.1时间衰变算法123

6.1.1何为时间衰变123

6.1.2如何理解兴趣和偏好124

6.1.3时间衰变算法的抽象124

6.1.4采用Spark实现模型126

6.2熵值法130

6.2.1何为信息熵130

6.2.2熵值法的实现过程130

6.2.3业务场景的介绍132

6.2.4算法逻辑的抽象133

6.3预测响应算法136

6.3.1业务场景的介绍136

6.3.2构建模型的前期工作137

6.3.3常用的预测模型138

6.4层次分析算法140

6.5工程能力的培养与实践142

6.5.1工程能力的重要性142

6.5.2利用Python实现层次分析法144

第7章 用户画像实践148

7.1用户画像的应用场景148

7.1.1背景描述148

7.1.2需求调研149

7.2用户画像的标签体系150

7.2.1需求分析151

7.2.2标签的构建151

7.3用户画像的模块化思维152

7.3.1何为模块化思维152

7.3.2用户画像与模块化思维153

7.4用户画像的工程开发154

7.4.1对于开发框架的选择154

7.4.2模块化功能的设计156

7.5用户画像的智能营销158

7.5.1业务营销158

7.5.2营销构思159

7.5.3技术难点160

第8章 反欺诈实践篇162

8.1“羊毛党”监控的业务162

8.1.1“羊毛党”的定义与特点162

8.1.2“羊毛”存在的必然性163

8.1.3“羊毛党”的进化164

8.1.4“羊毛党”存在的利与弊165

8.1.5“羊毛党”监控平台的意义165

8.2“羊毛党”监控的设备指纹166

8.2.1何为设备指纹166

8.2.2底层参数167

8.2.3应用场景168

8.2.4移动端的数据持久化169

8.2.5设备指纹生成算法169

8.3“羊毛党”监控的数据驱动170

8.3.1监控的目的170

8.3.2数据如何“食用”172

8.4“羊毛党”监控的实践分享173

第9章 大数据挖掘践行篇178

9.1如何从0到1转型到大数据圈子178

9.2数据挖掘从业者综合能力评估180

9.2.1度量的初衷180

9.2.2综合能力评估181

9.2.3个人指标体系(大数据挖掘)182

9.3给想要进入数据挖掘圈子的新人一点建议183

9.3.1诚信与包装184

9.3.2筹备能力185

9.3.3投好简历186

9.3.4把握面试186

9.3.5结尾187

后记 数据价值探索与数据产品实践188

热门推荐