图书介绍

深入浅出数据科学PDF|Epub|txt|kindle电子书版本网盘下载

深入浅出数据科学
  • (美)斯楠·奥兹德米尔著;张星辰译 著
  • 出版社: 北京:人民邮电出版社
  • ISBN:9787115481269
  • 出版时间:2018
  • 标注页数:311页
  • 文件大小:29MB
  • 文件页数:336页
  • 主题词:数据处理

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

深入浅出数据科学PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 如何听起来像数据科学家1

1.1 什么是数据科学3

1.1.1 基本的专业术语3

1.1.2 为什么是数据科学4

1.1.3 案例:西格玛科技公司4

1.2 数据科学韦恩图5

1.2.1 数学7

1.2.2 计算机编程8

1.2.3 为什么是Python9

1.2.4 领域知识13

1.3 更多的专业术语14

1.4 数据科学案例15

1.4.1 案例:自动审核政府文件16

1.4.2 案例:市场营销费用17

1.4.3 案例:数据科学家的岗位描述18

1.5 总结21

第2章 数据的类型23

2.1 数据的“味道”23

2.2 为什么要进行区分24

2.3 结构化数据和非结构化数据24

2.4 定量数据和定性数据28

2.4.1 案例:咖啡店数据28

2.4.2 案例:世界酒精消费量30

2.4.3 更深入的研究32

2.5 简单小结33

2.6 数据的4个尺度33

2.6.1 定类尺度34

2.6.2 定序尺度35

2.6.3 定距尺度37

2.6.4 定比尺度41

2.7 数据是旁观者的眼睛42

2.8 总结43

第3章 数据科学的5个步骤44

3.1 数据科学简介44

3.2 5个步骤概览45

3.2.1 提出有意思的问题45

3.2.2 获取数据45

3.2.3 探索数据45

3.2.4 数据建模46

3.2.5 可视化和分享结果46

3.3 探索数据46

3.3.1 数据探索的基本问题47

3.3.2 数据集1:Yelp点评数据48

3.3.3 数据集2:泰坦尼克56

3.4 总结60

第4章 基本的数学知识61

4.1 数学学科61

4.2 基本的数学符号和术语62

4.2.1 向量和矩阵62

4.2.2 算术符号65

4.2.3 图表68

4.2.4 指数/对数69

4.2.5 集合论71

4.3 线性代数74

4.4 总结78

第5章 概率论入门:不可能,还是不太可能79

5.1 基本的定义79

5.2 概率80

5.3 贝叶斯VS频率论81

5.4 复合事件84

5.5 条件概率86

5.6 概率定理87

5.6.1 加法定理87

5.6.2 互斥性88

5.6.3 乘法定理88

5.6.4 独立性89

5.6.5 互补事件89

5.7 再进一步91

5.8 总结92

第6章 高等概率论93

6.1 互补事件93

6.2 重温贝叶斯思想94

6.2.1 贝叶斯定理94

6.2.2 贝叶斯定理的更多应用97

6.3 随机变量100

6.3.1 离散型随机变量101

6.3.2 连续型随机变量110

6.4 总结113

第7章 统计学入门114

7.1 什么是统计学114

7.2 如何获取数据115

7.3 数据抽样118

7.3.1 概率抽样118

7.3.2 随机抽样119

7.3.3 不等概率抽样120

7.4 如何描述统计量120

7.4.1 测度中心120

7.4.2 变异测度121

7.4.3 变异系数125

7.4.4 相对位置测度126

7.5 经验法则132

7.6 总结134

第8章 高等统计学135

8.1 点估计135

8.2 抽样分布139

8.3 置信区间142

8.4 假设检验145

8.4.1 实施假设检验146

8.4.2 单样本t检验147

8.4.3 Ⅰ型错误和Ⅱ型错误151

8.4.4 分类变量的假设检验151

8.5 总结155

第9章 交流数据156

9.1 为什么交流数据很重要156

9.2 识别有效和无效的可视化157

9.2.1 散点图157

9.2.2 折线图159

9.2.3 条形图160

9.2.4 直方图162

9.2.5 箱形图163

9.3 当图表和统计在说谎166

9.3.1 相关性VS因果关系166

9.3.2 辛普森悖论168

9.3.3 如果相关性不等于因果关系,那什么导致了因果关系169

9.4 语言交流170

9.4.1 关键在于讲故事170

9.4.2 正式场合的注意事项170

9.5 为什么演示、如何演示和演示策略171

9.6 总结172

第10章 机器学习精要:你的烤箱在学习吗173

10.1 什么是机器学习173

10.2 机器学习并不完美175

10.3 机器学习如何工作176

10.4 机器学习的分类176

10.4.1 监督学习177

10.4.2 无监督学习182

10.4.3 强化学习183

10.5 统计模型如何纳入以上分类186

10.6 线性回归186

10.6.1 增加更多预测因子191

10.6.2 回归指标193

10.7 Logistic回归199

10.8 概率、几率和对数几率201

10.9 哑变量206

10.10 总结210

第11章 树上无预言,真的吗212

11.1 朴素贝叶斯分类212

11.2 决策树220

11.2.1 计算机如何生成回归树221

11.2.2 计算机如何拟合分类树222

11.3 无监督学习226

11.3.1 无监督学习的使用场景226

11.3.2 K均值聚类227

11.3.3 如何选择最佳的K值,并对簇进行评价233

11.4 特征提取和主成分分析235

11.5 总结246

第12章 超越精要247

12.1 偏差-方差权衡247

12.1.1 偏差导致的误差248

12.1.2 方差导致的误差248

12.1.3 两种极端的偏差-方差权衡情况255

12.1.4 偏差-方差如何组成误差函数256

12.2 K层交叉验证257

12.3 网格搜索算法261

12.4 集成技术266

12.4.1 随机森林268

12.4.2 随机森林VS决策树273

12.5 神经网络274

12.6 总结279

第13章 案例280

13.1 案例1:基于社交媒体预测股票价格280

13.1.1 文本情感分析280

13.1.2 探索性数据分析281

13.1.3 超越案例294

13.2 案例2:为什么有些人会对配偶撒谎295

13.3 案例3:初试TensorFlow301

13.4 总结311

热门推荐