Apache Spark3.0什么样?一文读懂Apache Spark最新技术发展与展望

开源大数据EMR 2019-08-02

云栖社区 系统软件 系统研发与运维 网络与数据通信 linux 深度学习 大数据 性能 Apache 数据仓库 Cache Image spark 分布式计算 安全问道

2019阿里云峰会·上海开发者大会于7月24日盛大开幕,在本次峰会的开源大数据专场上,阿里巴巴高级技术专家李呈祥带来了《Apache Spark 最新技术发展和3.0+ 展望》的全面解析,为大家介绍了Spark在整体IT基础设施上云背景下的新挑战和最新技术进展,同时预测了Spark 3.0即将重磅发布的新功能。

开源大数据专场PPT下载

以下内容根据演讲视频以及PPT整理而成。


自2009年伯克利的AMP LAB将 Spark开源以来,Spark在大数据处理领域获得了巨大的成功。Spark的定位是大数据处理的统一分析引擎,具有非常通用的分布式计算引擎,基于这个分布式计算引擎, Spark在不同领域方向提供了高层的DSL,比如针对关系型数据的Spark SQL,针对实时数据的Spark streaming,针对机器学习的MLlib, 以及

登录 后评论
下一篇
阿里巴巴云原生小助手
8073人浏览
2020-02-11
相关推荐
独家 | 一文读懂Apache Kudu
3801人浏览
2017-09-01 14:35:00
一文读懂分布式系统
1058人浏览
2017-08-01 15:50:00
0
1
0
5060