图书介绍
基于Apache Kylin构建大数据分析平台PDF|Epub|txt|kindle电子书版本网盘下载
![基于Apache Kylin构建大数据分析平台](https://www.shukui.net/cover/21/31983687.jpg)
- 蒋守壮著 著
- 出版社: 北京:清华大学出版社
- ISBN:7302454522
- 出版时间:2017
- 标注页数:260页
- 文件大小:50MB
- 文件页数:273页
- 主题词:
PDF下载
下载说明
基于Apache Kylin构建大数据分析平台PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第—部分 Apache Kylin基础部分3
第1章 Apache Kylin前世今生3
1.1 Apache Kylin的背景3
1.2 Apache Kylin的应用场景3
1.3 Apache Kylin的发展历程4
第2章 Apache Kylin前奏7
2.1 事实表和维表7
2.2 星型模型和雪花型模型7
2.2.1 星型模型7
2.2.2 雪花型模型8
2.2.3 星型模型示例8
2.3 OLAP9
2.3.1 OLAP分类9
2.3.2 OLAP的基本操作10
2.4 数据立方体(Data Cube)11
第3章 Apache Kylin工作原理和体系架构12
3.1 Kylin工作原理12
3.2 Kylin体系架构13
3.3 Kylin中的核心部分:Cube构建15
3.4 Kylin的SQL查询16
3.5 Kylin的特性和生态圈16
第4章 搭建CDH大数据平台18
4.1 系统环境和安装包19
4.1.1 系统环境19
4.1.2 安装包的下载20
4.2 准备工作:系统环境搭建21
4.2.1 网络配置(CDH集群所有节点)21
4.2.2 打通SSH,设置ssh无密码登录(所有节点)21
4.3 正式安装CDH:准备工作29
4.4 正式安装CDH5:安装配置30
4.4.1 CDH5的安装配置30
4.4.2 对Hive、HBase执行简单操作39
第5章 使用Kylin构建企业大数据分析平台的4种部署方式41
5.1 Kylin部署的架构41
5.2 Kylin的四种典型部署方式42
第6章 单独为Kylin部署HBase集群44
第7章 部署Kylin集群环境58
7.1 部署Kylin的先决条件58
7.2 部署Kylin集群环境61
7.3 为Kylin集群搭建负载均衡器70
7.3.1 搭建Nginx环境70
7.3.2 配置Nginx实现Kylin的负载均衡73
第二部分 Apache Kylin进阶部分77
第8章 Demo案例实战77
8.1 Sample Cube案例描述77
8.2 Sample Cube案例实战78
8.2.1 准备数据78
8.2.2 构建Cube81
第9章 多维分析的Cube创建实战89
9.1 Cube模型89
9.2 创建Cube的流程90
9.2.1 步骤一:Hive中事实表,以及多张维表的处理90
9.2.2 步骤二:Kylin中建立项目(Project)95
9.2.3 步骤三:Kylin中建立数据源(Data Source)95
9.2.4 步骤四:Kylin中建立数据模型(Model)98
9.2.5 步骤五:Kylin中建立Cube104
9.2.6 步骤六:Build Cube114
9.2.7 步骤七:查询Cube118
第10章 Build Cube的来龙去脉120
10.1 流程分析120
10.2 小结134
第三部分 Apache Kylin高级部分137
第11章 Cube优化137
第12章 备份Kylin的Metadata142
12.1 Kylin的元数据142
12.2 备份元数据143
12.3 恢复元数据146
第13章 使用Hive视图147
13.1 使用Hive视图147
13.2 使用视图实战149
第14章 Kylin的垃圾清理153
14.1 清理元数据153
14.2 清理存储器数据154
第15章 JDBC访问方式157
第16章 通过RESTful访问Kylin161
第17章 Kylin版本之间升级179
17.1 从1.5.2 升级到最新版本1.5.3179
17.2 从1.5.1 升级到1.5.2 版本180
17.3 从Kylin 1.5.2.1 升级到Kylin 1.5.3实战181
17.4 补充内容187
第18章 大数据可视化实践189
18.1 可视化工具简述189
18.2 安装Kylin ODBC驱动190
18.3 通过Excel访问Kylin192
18.4 通过PowerBI访问Kylin194
18.4.1 安装配置Power BI194
18.4.2 实战操作198
18.5 通过Tableau访问Kylin199
18.6 Kylin+Mondrian+Saiku205
18.7 实战演练:通过Saiku访问Kylin211
18.7.1 第一个Schema例子:myproject_pvuv_cube的演示211
18.7.2 第二个Schema例子:kylin_sales_cube的演示219
18.7.3 Saiku使用的一些问题223
18.8 通过Apache Zepplin访问Kylin229
18.9 通过Kylin的“Insight”查询232
第19章 使用Streaming Table构建准实时Cube236
第20章 快速数据立方算法251
20.1 快速数据立方算法概述251
20.2 快速数据立方算法优点和缺点253
20.3 获取Fast Cubing算法的优势254
第四部分 Apache Kylin的扩展部分257
第21章 大数据智能分析平台KAP257
21.1 大数据智能分析平台KAP概述257
21.2 KAF的安装部署259