部分:
1、Spark的架构设计
1.1 Spark的速度为什么如此的快?
1.2 Spark的架构设计剖析
1.3 RDD计算流程解析
1.4 Spark的出色容错机制
2、实战使用三种语言开发Spark
2.1 Scala简介、为什么Spark会使用Scala作为开发语言?
2.2 在Spark中使用Scala
2.3 使用Java开发Spark程序
2.4 使用Python开发Spark程序
2.5 深入使用Spark Shell
3、快速掌握Scala
3.1 Scala变量声明、操作符、函数的使用实战
3.2 apply方法
3.3 Scal的控制结构和函数
3.4 Scala数组的操作、Map的操作
3.5 Scala中的类
3.6 Scala中对象的使用;
3.7 Scala中的继承
3.8 Scala中的特质
3.9 Scala中集合操作
4、Spark集群的安装和设置
4.1 在一台机器上运行Spark
4.2 在EC2上运行Spark
4.3 在Mesos上部署Spark
4.4 在YARN上部署Spark
4.5 通过SSH在众多机器上部署Spark
4.6 Spark集群设置
5、编写Spark程序
5.1 程序数据的来源:File、HDFS、HBase、S3等
5.2 IDE环境构建
5.3 Maven
5.4 sbt.
5.5 编写并部署Spark程序的实例
第二部分
6、SparkContext解析和数据加载以及存储
6.1 源码剖析SparkContext
6.2 Scala、Java、Python使用SparkContext
6.4 加载数据成为RDD
6.5 把数据物化
7、深入实战RDD
7.1 DAG
7.2 深入实战各种Scala RDD Function
7.3 Spark Java RDD Function
7.4 RDD的优化问题
8、Shark的原理和使用
8.1 Shark与Hive
8.2 安装和配置Shark
8.3 使用Shark处理数据
8.4 在Spark程序中使用Shark Queries
8.5 SharkServer
8.6 思考Shark架构
9、Spark程序的测试
9.1 编写可测试的Spark程序
9.2 Spark测试框架解析
9.3 Spark测试代码实战
10、Spark的优化
10.1 Logs
10.2 并发
10.3 内存
10.4 垃圾回收
10.5 序列化
10.6 安全
第三部分
11、Spark的机器学习
11.1 LinearRegression
11.2 K-Means
11.3 Collaborative Filtering
12、Spark的图计算GraphX
12.1 Table Operators
12.2 Graph Operators
12.3 GraphX
13、Spark SQL
13.1 Parquet支持
13.2 DSL
13.3 SQL on RDD
14、Spark实时流处理
14.1 DStream
14.2 transformation
14.3 checkpoint
14.4 性能优化
面向企事业单位实际需求,我们能提供各类针对性的软件技术培训或技术支持,也能按需订制,北上广深,成都,武汉,苏州等大城市都可以提供针对性的专家技术服务。
可以公开课,可以按需求订制服务,也可以上门技术服务。海量专家资源,精准匹配专家,10多年知名企事业单位服务经验,信誉保证。
详细信息请登陆官网了解
官网1:www.zksoft.org
官网2:www.info-soft.cn
电话咨询:010-62883247,62884854
邮件咨询:soft@info-soft.cn
中科信软技术服务培训地址:北京市海淀区羊坊店路18号光耀东方广场N座520/521。