Kafka VS RocketMQ VS RabbitMQ

简介: - - kafka RocketMQ RabbitMQ 数据来源 相关文章 定位 设计定位 系统间的数据流管道,实时数据处理。 例如:常规的消息系统、网站活性跟踪,监控数据,日志收集、处理等 非日志的可靠消息传输。


- - kafka RocketMQ RabbitMQ 数据来源 相关文章
定位 设计定位 系统间的数据流管道,实时数据处理。
例如:常规的消息系统、网站活性跟踪,监控数据,日志收集、处理等
非日志的可靠消息传输。
例如:订单,交易,充值,流计算,消息推送,日志流式处理,binglog分发等
可靠消息传输。和RocketMQ类似。
基础对比 成熟度 日志领域成熟  成熟  成熟 
所属社区/公司 Apache  Alibaba开发,已加入到Apache下 Mozilla Public License 
社区活跃度 来源于网络
API完备性
文档完备性 来源于网络
开发语言 Scala Java Erlang 
支持协议 一套自行设计的基于TCP的二进制协议 自己定义的一套
(社区提供JMS--不成熟) 
AMQP 
客户端语言 C/C++、Python、Go、Erlang、.NET、Ruby、Node.js、PHP等 Java Java、C、 C++、 Python、 PHP、Perl 等 
持久化方式 磁盘文件  磁盘文件  内存、文件 
可用性、可靠性比较 部署方式 单机/集群 单机/集群 单机/集群
集群管理 zookeeper name server
选主方式 从ISR中自动选举一个leader 不支持自动选主。通过设定brokername、brokerId实现,brokername相同,brokerid=0时为maser,其他为slave 最早加入集群的broker
可用性 非常高
分布式、主从
非常高
分布式、主从

主从,采用镜像模式实现,数据量大时可能产生性能瓶颈
rabbitMQ集群部署
http://www.cnblogs.com/knowledgesea/p/6535766.html
RabbitMQ可用性、可靠性分析
http://blog.csdn.net/cadem/article/details/53422912?utm_source=itdadao&utm_medium=referral
主从切换 自动切换
N个副本,允许N-1个失效;master失效以后自动从isr中选择一个主;
不支持自动切换
master失效以后不能向master发送信息,consumer大概30s(默认)可以感知此事件,此后从slave消费;如果master无法恢复,异步复制时可能出现部分信息丢失
自动切换
最早加入集群的slave会成为master;因为新加入的slave不同步master之前的数据,所以可能会出现部分数据丢失
数据可靠性 很好
支持producer单条发送、同步刷盘、同步复制、异步。
很好
producer单条发送,broker端支持同步刷盘、异步刷盘,同步双写,异步复制。

producer支持同步/异步ack。支持队列数据持久化,镜像模式中支持主从同步
kafka也同步刷盘,但是效率较低
http://jm.taobao.org/2016/04/28/kafka-vs-rocktemq-4/
消息写入性能 非常好
每条10个字节测试:百万条/s
很好
每条10个字节测试:单机单broker约7w/s,单机3个broker约12w/s
RAM约为RocketMQ的1/2,
Disk的性能约为RAM性能的1/3
数据来源于网络
单条消息的数据量越小,性能对比时kafka表现越好
kafka vs RocktMQ: https://engineering.linkedin.com/kafka/benchmarking-apache-kafka-2-million-writes-second-three-cheap-machines
kafka vs RocktMQ VS RabbitMQ
http://www.cnblogs.com/felixzh/p/6198070.html
http://ju.outofmemory.cn/entry/177937
性能的稳定性 队列/分区多时性能不稳定,明显下降。
消息堆积时性能稳定
队列较多、消息堆积时性能稳定 消息堆积时,性能不稳定、明显下降
单机支持的队列数 单机超过64个队列/分区,Load会发生明显的飙高现象,队列越多,load越高,发送消息响应时间变长 单机支持最高5万个队列,Load不会发生明显变化 依赖于内存 数据来源于网络测评
kafka新能降低是因为topic增多时,顺序写变成了随机写
Kafka vs RocketMQ: Topic数量对单机性能的影响
http://jm.taobao.org/2016/04/07/kafka-vs-rocketmq-topic-amout/?utm_source=tuicool&utm_medium=referral
堆积能力 非常好
消息存储在log中,每个分区由一个或多个segment  log文件
非常好
所有消息存储在同一个commit log中
一般
生产者、消费者正常时,性能表现稳定;消费者不消费时,性能不稳定
http://www.cnblogs.com/purpleraintear/p/6033136.html
复制备份 消息先写入leader的log,followers从leader中pull数据,pull到数据以后先ack leader,然后写入log中。
ISR中维护与leader同步的列表,落后太多的follwer会被删除掉
同步双写
异步复制:slave启动线程从master中拉数据
普通模式下不复制;
镜像模式下:消息先到mster,然后写到slave上。加入集群之前的消息不会被复制到新的slave上。
消息投递实时性 毫秒级
具体由consumer轮询间隔时间决定
毫秒级
支持pull、push两种模式,延时通常在毫秒级
毫秒级
功能对比 顺序消费 支持顺序消费
但是一台Broker宕机后,就会产生消息乱序(来自网上,尚未找到原因)
支持顺序消费
在顺序消息场景下,消费失败时消费队列将会暂停
支持顺序消费
定时消息 不支持 开源版本仅支持定时Level 不支持
事务消息 不支持 支持 不支持
Broker端消息过滤 不支持 支持
通过tag过滤,类似于子topic
不支持
消息查询 不支持 支持
根据MessageId查询
支持根据MessageKey查询消息
不支持
消费失败重试 不支持失败重试
offset存储在consumer中,无法保证。
0.8.2版本后支持将offset存储在zk中
支持失败重试
offset存储在broker中
支持失败重试
消息重新消费 支持通过修改offset来重新消费 支持按照时间来重新消息
发送端负载均衡 可自由指定 可自由指定 需要单独loadbalancer支持
 消费并行度 消费并行度和分区数一致 顺序消费:消费并行度和分区数一致
乱序消费:消费服务器的消费线程数之和
可一次抓取多条一起消费。
镜像模式下其实也是从master消费
消费方式 consumer pull consumer pull /broker push broker push
批量发送 支持
默认producer缓存、压缩,然后批量发送
不支持 不支持
消息清理 指定文件保存时间,过期删除 指定文件保存时间,过期删除 Consumer ack以后,消息将被标记为删除
可用内存少于40%(默认),触发gc,gc时找到相邻的两个文件,合并right文件到left。
运维 系统维护 Scala语言开发,维护成本高 java语言开发,维护成本低 Erlang语言开发,维护成本高
部署依赖 zookeeper nameserver Erlang环境
管理后台 官网不提供,第三方开源管理工具可供使用;不用重新开发 官方提供,rocketmq-console 官方提供rabbitmqadmin kafka管理后台比较;http://top.jobbole.com/31084/
管理后台功能 Kafka Web Conslole
Brokers列表;Kafka 集群中 Topic列表,及对应的Partition、LogSize等信息;Topic对应的Consumer Groups、Offset、Lag等信息;
生产和消费流量图、消息预览
KafkaOffsetMonitor:
Kafka集群状态;Topic、Consumer Group列表;图形化展示topic和consumer之间的关系;图形化展示consumer的Offset、Lag等信息
Kafka Manager
管理几个不同的集群;监控集群的状态(topics, brokers, 副本分布, 分区分布);产生分区分配(Generate partition assignments)基于集群的当前状态;重新分配分区
Cluster、Topic、Connection、NameServ、Message、Broker、Offset、Consumer overview、connections、channels、exchanges、queues、admin
总结 优点 1、在高吞吐、低延迟、高可用、集群热扩展、集群容错上有非常好的表现;
2、producer端提供缓存、压缩功能,可节省性能,提高效率。
3、提供顺序消费能力
4、提供多种客户端语言
5、生态完善,在大数据处理方面有大量配套的设施。
1、在高吞吐、低延迟、高可用上有非常好的表现;消息堆积时,性能也很好。
2、api、系统设计都更加适在业务处理的场景。
3、支持多种消费方式。
4、支持broker消息过滤。
5、支持事务。
6、提供消息顺序消费能力;consumer可以水平扩展,消费能力很强。
7、集群规模在50台左右,单日处理消息上百亿;经历过大数据量的考验,比较稳定可靠。
1、在高吞吐量、高可用上较前两者有所不如。
2、支持多种客户端语言;支持amqp协议。
3、由于erlang语言的特性,性能也比较好; 使用RAM模式时,性能很好。
4、管理界面较丰富,在互联网公司也有较大规模的应用;
数据来自网络
缺点 1、消费集群数目受到分区数目的限制。
2、单机topic多时,性能会明显降低。
3、不支持事务
1、相比于kafka,使用者较少,生态不够完善。消息堆积、吞吐率上也有所不如。
2、不支持主从自动切换,master失效后,消费者需要一定的时间才能感知。
3、客户端只支持Java
1、erlang 语言难度较大。集群不支持动态扩展。
2、不支持事务、消息吞吐能力有限
3、消息堆积时,性能会明显降低






相关文章
|
1月前
|
消息中间件 存储 Kafka
RabbitMQ、RocketMQ和Kafka全面对决,谁是最佳选择?
1、应用场景 1.RabbitMQ: 适用于易用性和灵活性要求较高的场景 异步任务处理:RabbitMQ提供可靠的消息传递机制,适用于处理异步任务,例如将耗时的任务放入消息队列中,然后由消费者异步处理,提高系统的响应速度和可伸缩性。 解耦系统组件:通过使用RabbitMQ作为消息中间件,不同的系统组件可以通过消息进行解耦,实现松耦合的架构,提高系统的可维护性和灵活性。 事件驱动架构:RabbitMQ的发布-订阅模式可以用于构建事件驱动架构,将系统中的事件作为消息发布到相应的主题,不同的消费者可以订阅感兴趣的主题进行相应的处理。
153 2
|
3月前
|
消息中间件 前端开发 网络性能优化
基于RabbitMQ的MQTT实现
基于RabbitMQ的MQTT实现
56 0
|
3月前
|
消息中间件 存储 数据库
RabbitMQ之MQ的可靠性
RabbitMQ之MQ的可靠性
|
2月前
|
消息中间件 监控 物联网
MQTT的奇妙之旅:探索RabbitMQ Web MQTT插件的威力【RabbitMQ 十一】
MQTT的奇妙之旅:探索RabbitMQ Web MQTT插件的威力【RabbitMQ 十一】
68 0
|
3天前
|
消息中间件 存储 Java
RabbitMQ入门指南(八):MQ可靠性
RabbitMQ是一个高效、可靠的开源消息队列系统,广泛用于软件开发、数据传输、微服务等领域。本文主要介绍了MQ数据持久化、LazyQueue模式、管理控制台配置Lazy模式、代码配置Lazy模式、更新已有队列为lazy模式等内容。
|
20天前
|
消息中间件 存储 Kafka
【深入浅出 RocketMQ原理及实战】「底层源码挖掘系列」透彻剖析贯穿一下RocketMQ和Kafka索引设计原理和方案
【深入浅出 RocketMQ原理及实战】「底层源码挖掘系列」透彻剖析贯穿一下RocketMQ和Kafka索引设计原理和方案
42 1
|
6月前
|
消息中间件 NoSQL 关系型数据库
【Kubernetes部署Shardingsphere、Mycat、Mysql、Redis、中间件Rocketmq、Rabbitmq、Nacos】
【Kubernetes部署Shardingsphere、Mycat、Mysql、Redis、中间件Rocketmq、Rabbitmq、Nacos】
127 0
|
3月前
|
消息中间件 存储 网络协议
MQ - 09 RabbitMQ的架构设计与实现
MQ - 09 RabbitMQ的架构设计与实现
60 0
|
4月前
|
消息中间件 运维 负载均衡
负载均衡中后端连了三个rabbitmq,如果挂了一个,客户端连接mq会变慢吗
在负载均衡中使用三个 RabbitMQ 实例,如果其中一个实例发生故障,可能会影响客户端连接到 RabbitMQ 的性能。具体影响取决于负载均衡的配置和客户端的实现方式。 如果负载均衡器能够及时检测到故障的 RabbitMQ 实例并将流量路由到正常的实例,那么客户端连接的性能影响可能较小。但如果负载均衡器不能迅速切换流量或者客户端实现不支持及时的连接故障转移,那么可能会导致客户端连接的延迟或失败。 在设计这样的架构时,有一些考虑因素: 1. **健康检查和故障切换:** 确保负载均衡器能够定期检查 RabbitMQ 实例的健康状态,并在出现故障时快速将流量切换到其他正常的实例。 2.
|
5月前
|
消息中间件 存储 架构师
RabbitMQ vs Kafka:正面交锋(2)
RabbitMQ 是一个消息代理中间件,而 Apache Kafka 是一个分布式流处理平台。这种差异可能看起来只是语义上的,但它会带来严重的影响,影响我们方便地实现各种系统功能。 例如 Kafka 最适合处理流数据,在同一主题同一分区内保证消息顺序,而 RabbitMQ 对流中消息的顺序只提供基本的保证。
63 1