图书介绍

Python数据分析与应用 从数据获取到可视化PDF|Epub|txt|kindle电子书版本网盘下载

Python数据分析与应用 从数据获取到可视化
  • 黑马程序员编著 著
  • 出版社: 北京:中国铁道出版社
  • ISBN:9787113251451
  • 出版时间:2019
  • 标注页数:262页
  • 文件大小:102MB
  • 文件页数:273页
  • 主题词:软件工具-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Python数据分析与应用 从数据获取到可视化PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 数据分析概述1

1.1 数据分析的背景1

1.2 什么是数据分析2

1.3 数据分析的应用场景2

1.4 数据分析的流程3

1.5 为什么选择Python做数据分析4

1.6 创建新的Python环境——Anaconda5

1.6.1 Anaconda发行版本概述5

1.6.2 在Windows系统中安装Anaconda5

1.6.3 通过Anaconda管理Python包7

1.7 启用Jupyter Notebook9

1.7.1 启动Anaconda自带的Jupyter Notebook9

1.7.2 Jupyter Notebook界面详解10

1.7.3 Jupyter Notebook的基本使用13

1.8 常见的数据分析工具16

小结17

习题17

第2章 科学计算库NumPy19

2.1 认识NumPy数组对象19

2.2 创建NumPy数组21

2.3 ndarray对象的数据类型22

2.3.1 查看数据类型22

2.3.2 转换数据类型23

2.4 数组运算24

2.4.1 矢量化运算24

2.4.2 数组广播25

2.4.3 数组与标量间的运算25

2.5 ndarray的索引和切片26

2.5.1 整数索引和切片的基本使用26

2.5.2 花式(数组)索引的基本使用28

2.5.3 布尔型索引的基本使用29

2.6 数组的转置和轴对称30

2.7 NumPy通用函数32

2.8 利用NumPy数组进行数据34

处理34

2.8.1 将条件逻辑转为数组运算34

2.8.2 数组统计运算34

2.8.3 数组排序35

2.8.4 检索数组元素36

2.8.5 唯一化及其他集合逻辑36

2.9 线性代数模块37

2.10 随机数模块38

2.11 案例——酒鬼漫步39

小结40

习题40

第3章 数据分析工具Pandas42

3.1 Pandas的数据结构分析42

3.1.1 Series42

3.1.2 DataFrame44

3.2 Pandas索引操作及高级索引46

3.2.1 索引对象46

3.2.2 重置索引47

3.2.3 索引操作49

3.3 算术运算与数据对齐53

3.4 数据排序54

3.4.1 按索引排序54

3.4.2 按值排序55

3.5 统计计算与描述56

3.5.1 常用的统计计算57

3.5.2 统计描述58

3.6 层次化索引59

3.6.1 认识层次化索引59

3.6.2 层次化索引的操作64

3.7 读写数据操作68

3.7.1 读写文本文件68

3.7.2 读写Excel文件70

3.7.3 读取HTML表格数据72

3.7.4 读写数据库73

3.8 案例——北京高考分数线统计分析77

2.8.1 案例需求77

2.8.2 数据准备77

2.8.3 功能实现78

小结81

习题81

第4章 数据预处理83

4.1 数据清洗83

4.1.1 空值和缺失值的处理83

4.1.2 重复值的处理88

4.1.3 异常值的处理90

4.1.4 更改数据类型94

4.2 数据合并96

4.2.1 轴向堆叠数据96

4.2.2 主键合并数据99

4.2.3 根据行索引合并数据103

4.2.4 合并重叠数据105

4.3 数据重塑106

4.3.1 重塑层次化索引106

4.3.2 轴向旋转109

4.4 数据转换110

4.4.1 重命名轴索引110

4.4.2 离散化连续数据112

4.4.3 哑变量处理类别型数据113

4.5 案例——预处理部分地区信息115

4.5.1 案例需求115

4.5.2 数据准备115

4.5.3 功能实现116

小结123

习题123

第5章 数据聚合与分组运算125

5.1 分组与聚合的原理125

5.2 通过groupby()方法将数据拆分成组126

5.3 数据聚合132

5.3.1 使用内置统计方法聚合数据132

5.3.2 面向列的聚合方法132

5.4 分组级运算136

5.4.1 数据转换136

5.4.2 数据应用138

5.5 案例——运动员信息的分组与聚合141

5.5.1 案例需求141

5.5.2 数据准备141

5.5.3 功能实现142

小结146

习题147

第6章 数据可视化149

6.1 数据可视化概述149

6.1.1 什么是数据可视化149

6.1.2 常见的图表类型150

6.1.3 数据可视化的工具154

6.2 Matplotlib——绘制图表155

6.2.1 通过figure()函数创建画布155

6.2.2 通过subplot()函数创建单个子图157

6.2.3 通过subplots0函数创建多个子图158

6.2.4 通过add_subplot()方法添加和选中子图160

6.2.5 添加各类标签161

6.2.6 绘制常见图表162

6.2.7 本地保存图形167

6.3 Seabom——绘制统计图形168

6.3.1 可视化数据的分布168

6.3.2 用分类数据绘图174

6.4 Bokeh——交互式可视化库178

6.4.1 认识Bokeh库178

6.4.2 通过Plotting绘制图形179

6.5 案例——画图分析某年旅游景点数据180

6.5.1 案例需求181

6.5.2 数据准备181

6.5.3 功能实现181

小结185

习题185

第7章 时间序列分析187

7.1 时间序列的基本操作187

7.1.1 创建时间序列187

7.1.2 通过时间戳索引选取子集189

7.2 固定频率的时间序列191

7.2.1 创建固定频率的时间序列191

7.2.2 时间序列的频率、偏移量193

7.2.3 时间序列的移动195

7.3 时间周期及计算196

7.3.1 创建时期对象196

7.3.2 时期的频率转换198

7.4 重采样198

7.4.1 重采样方法(resample)199

7.4.2 降采样200

7.4.3 升采样201

7.5 数据统计——滑动窗口203

7.6 时序模型——ARIMA206

7.7 案例——股票收盘价分析207

7.7.1 案例需求207

7.7.2 数据准备207

7.7.3 功能实现208

小结213

习题214

第8章 文本数据分析216

8.1 文本数据分析工具216

8.1.1 NLTK与jieba概述216

8.1.2 安装NLTK和下载语料库217

8.1.3 jieba库的安装219

8.2 文本预处理220

8.2.1 预处理的流程220

8.2.2 分词221

8.2.3 词性标注223

8.2.4 词形归一化224

8.2.5 删除停用词226

8.3 文本情感分析227

8.4 文本相似度229

8.5 文本分类232

8.6 案例——商品评价分析235

8.6.1 案例需求235

8.6.2 数据准备236

8.6.3 功能实现236

小结240

习题240

第9章 数据分析实战——北京租房数据统计分析242

9.1 数据来源242

9.2 数据读取243

9.3 数据预处理244

9.3.1 重复值和空值处理244

9.3.2 数据转换类型246

9.4 图表分析247

9.4.1 房源数量、位置分布分析248

9.4.2 户型数量分析255

9.4.3 平均租金分析258

9.4.4 面积区间分析260

小结262

热门推荐