申请免费体验一次课程

Spark企业级开发最佳实践

本课程是在对Spark的13个不同版本源码彻底研究基础之上提炼而成;涵盖Spark所有内核精髓的剖析和大量的核心源码解读;讲师将带您深入了解Spark内核机制和核心优化技巧,商业级别Spark项目的架构设计、实现和优化。并通过商业实战案例真正了解Spark的规划、部署、开发和管理技术。

适合群体

本课程适合任何渴望进入大数据领域,想跟上并使用Spark和相关技术快速高效的处理不断增长的数据量的人士,具体包含:

  • 大数据爱好者

  • 软件架构师,工程师和开发人员

  • 数据科学家和专业分析人员

  • 其他大数据从业者和使用者;

对函数式编程和面向对象编程有基本理解的话,将对你参与此课程有所帮助。

课程周期
3天
课程内容

1. Scala for Apache Spark简介

在本单元中,您将了解编写Spark应用程序所需的Scala基础知识。您可以了解Scala的基本结构,如变量类型,控制结构,集合等。

2. Scala中的OOPS和函数式编程

在本单元中,您将了解Scala中面向对象的编程和函数式编程技术。

3.大数据和Apache Spark的介绍

在本单元中,您将了解什么是大数据,与之相关的挑战以及可用的不同框架。该模块还包括Spark的第一手介绍。

4. Spark常用操作

在本单元中,您将学习如何调用Spark Shell并将其用于各种常见操作。

5.使用RDDs

在本单元中,您将学习Spark - RDDs的基本构建块和实现业务逻辑的相关操作。

6. Spark Streaming和MLlib

在本单元中,您将了解Spark提供的主要API。您将有机会使用Spark流式处理,这使得轻松构建可扩展容错流传输应用程序MLlib是Spark的机器学习库。

7. Spark中的GraphX,SparkSQL和性能调优

在本单元中,您将了解用于使用SQL查询处理结构化数据的Spark SQL,使用Spark,GraphX进行图形分析以及图形并行计算。您还将有机会了解在Spark中优化性能的各种方法。

8.一个关于Apache Spark的完整项目

在本模块中,您将有机会在一个实时Spark项目上工作,您可以在此实践以前的模块的学习,并解决实时用例。

本门课程提供半天的免费试听名额,感兴趣请填写以下表格

姓名: *
联系电话: *
邮箱: *
补充咨询:
扫一扫