独家 | 寻找数据统治力:比较Spark和Flink

初商 2019-08-27

数据派

作者:王海涛

文章来源:微信公众号 数据派THU

翻译:张玲

校对:王雨桐


本文首先介绍了Spark和Flink的发展背景、基本架构及其设计特点,然后从数据模型、状态处理和编程模型3个角度进行比较优势和限制,最后介绍Spark和Flink的最新发展。

image.png

本篇文章属于阿里巴巴Flink系列文章之一。

当提及大数据时,我们无法忽视流式计算的重要性,它能够完成强大的实时分析。而说起流式计算,我们也无法忽视最强大的数据处理引擎:Spark和Flink。

Apache Spark自2014年以来迅速普及。它提供了一个适用常见数据处理场景的统一引擎,如批处理、流处理、交互式查询和机器学习。在某些情况下,它的性能是前一代Hadoop MapReduce的数百倍。凭借其高性能的处理和广泛的场景支持,它在大数据开发方面受到早期用户的长期青睐。

在Spark出现后不久

登录 后评论
下一篇
云攻略小攻
2372人浏览
2019-10-11
相关推荐
Flink在饿了么的应用与实践
545人浏览
2019-04-25 11:25:08
Yahoo的流计算引擎基准测试
1362人浏览
2016-03-31 16:59:44
1
0
0
421