zab协议

简介: paxos的缺点 基于以下这些原因,zookeeper并没有用paxos作为自己实现的协议,取而代之采用了一种称为zab的协议,全称是zookeeper atomic broadcast。 活锁问题 在base-paxos算法中,不存在leader这样的角色,于是存在这样一种情况,即P1提交了...

paxos的缺点

基于以下这些原因,zookeeper并没有用paxos作为自己实现的协议,取而代之采用了一种称为zab的协议,全称是zookeeper atomic broadcast。

活锁问题

在base-paxos算法中,不存在leader这样的角色,于是存在这样一种情况,即P1提交了一个proposal n1并且通过了prepare阶段;此时P2提交了一个proposal n2(n2>n1)并且也通过了prepare阶段;P1在commit时因为已经通过了n2而被拒绝;于是P1继续提交一个proposal n3并且通过prepare阶段;巧的是此时P2开始commit了,由于n2<n3再次被拒绝……如此循环往复。这种情况被称为活锁。即整个系统都没死,但由于互相请求资源而被互相锁死。为了不发生活锁的情况,最简单的方式当然是缩减proposer到一个,这样就不会发生互相请求锁死的情况,也即退化。事实上很多后来的工业级协议,都是paxos协议的退化或者变种。

复杂度问题

为了解决活锁问题,出现了multi-paxos;

为了解决通信次数较多的问题,出现了fast-paxos;

为了尽量减少冲突,出现了epaxos。

可以看到,工业级实现需要考虑更多的方面,诸如性能,异常等等。这也是许多分布式的一致性框架并非真正基于paxos来实现的原因。

全序问题

对于paxos算法来说,不能保证两次提交最终的顺序,而zookeeper需要做到这点。

zab协议

paxos存在活锁问题,为了解决活锁问题,zab引入了leader,但是单leader就有单点问题,zab采用的方法是leader选举(没有采用主备,因为主备过于固定,不够分布式)。

leader选举就必然出现状态不一致的情况,于是就有需要有同步的过程。

zab协议分为4个阶段,即阶段0为leader选举,(阶段1为发现,阶段2为同步)恢复阶段,阶段3为广播,而实际实现时将发现及同步阶段合并为一个恢复阶段。

leader选举阶段

当集群中没有leader或者其他人感受不到leader时会进入这一阶段,这一阶段的主要目的是选出zxid最大的节点作为准leader。

recovery阶段

主要目的是根据准leader的情况将数据同步到其他节点。同步完成后准leader变为leader。详见奔溃恢复案例。

broadcast阶段

主要目的是leader收到请求,并将请求转为proposal,其他节点根据协议进行批准或通过。

broadcast阶段事实上就是一个两阶段提交的简化版。其所有过程都跟两阶段提交一致,唯一不一致的是不能做事务的回滚。

广播的过程类似于二阶段提交,但是如果实现完整的两阶段提交,那就解决了一致性问题(paxos),没必要发明新协议了,所以zab实际上抛弃了两阶段提交的事务回滚。

一台follower只能回复ACK或者干脆就不回复了,leader只要收到过半的机器回复即通过proposal

但是这样的设计就存在很多问题:

比如如果一个follower因为网络问题从头到尾一直没收到过leader的proposal,后续的询问刚好落到这台follower上该如何处理?

比如leader第一阶段收到了所有follower的ACK后提交,然后通知其他follower提交,这时自己挂了该如何处理?于是诞生了崩溃恢复阶段,旨在对各种不一致情况做出恢复和处理。

崩溃恢复案例

对于选举和恢复阶段。zab算法需要确保两件事。

已经处理过的proposal不能被丢弃

场景:leader发送了proposal,follower1和follower2回复了ACK给leader,leader向所有follower发送commit请求并commit自身,此时leader挂了。leader已经提交,但是follower尚未提交,这会存在不一致的情况。

确保方式:

  1. 重新选举leader时只挑选zxid最大的follower。因为至少半数的follower回复ACK,意味着重新选举时zxid最大的follower应该是当初回复ACK但尚未提交的其中一台。
  2. 该follower即准leader,将自身收到prepare但尚未提交的proposal提交
  3. 在选举阶段准leader已经能拿到其余follower的所有事务集合,于是准leader根据各个follower的事务执行情况,分别建立队列,先发送prepare请求,再发送commit请求,让所有follower都同步到与leader一样的状态。

通过以上方式,能够确保提交过的proposal不会出现丢弃的情况。

已经丢弃的proposal不能被重复处理

场景:leader收到请求,包装为proposal,此时网络挂了或者leader挂了导致其他follower没收到请求,此时进入崩溃恢复阶段,此时其他follower选主并成功之后这个挂了 的leader以follower的身份加入,此时它有一个多余的proposal,与其他节点不一致。

确保方式:

通过zxid的大小直接确定。zxid的编码方式为高32位为epoch(即纪元,可以理解为代),低32位为每个proposal顺序递增的数字。每次变换一个leader,则epoch加一,可以理解为改朝换代了,新朝代的zxid必然比旧朝代的zxid大,新代的leader可以要求将旧朝代的proposal清除。

 

相关实践学习
容器服务Serverless版ACK Serverless 快速入门:在线魔方应用部署和监控
通过本实验,您将了解到容器服务Serverless版ACK Serverless 的基本产品能力,即可以实现快速部署一个在线魔方应用,并借助阿里云容器服务成熟的产品生态,实现在线应用的企业级监控,提升应用稳定性。
云原生实践公开课
课程大纲 开篇:如何学习并实践云原生技术 基础篇: 5 步上手 Kubernetes 进阶篇:生产环境下的 K8s 实践 相关的阿里云产品:容器服务&nbsp;ACK 容器服务&nbsp;Kubernetes&nbsp;版(简称&nbsp;ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情:&nbsp;https://www.aliyun.com/product/kubernetes
目录
相关文章
|
存储 算法 架构师
【架构师指南】带你彻底认识 Paxos 算法、Zab 协议和 Raft 协议的原理和本质
【架构师指南】带你彻底认识 Paxos 算法、Zab 协议和 Raft 协议的原理和本质
603 0
【架构师指南】带你彻底认识 Paxos 算法、Zab 协议和 Raft 协议的原理和本质
|
算法
分布式学习十:ZAB协议
分布式学习十:ZAB协议
73 0
分布式学习十:ZAB协议
|
算法
深入浅出Zookeepr的ZAB协议
深入浅出Zookeepr的ZAB协议
156 0
深入浅出Zookeepr的ZAB协议
|
算法 Java 开发者
Zab 协议如何保持数据的一致性 | 学习笔记
快速学习 Zab 协议如何保持数据的一致性
167 0
Zab 协议如何保持数据的一致性 | 学习笔记
|
算法 Java 开发者
简单回顾 Zab 协议集群模式原理|学习笔记
快速学习简单回顾 Zab 协议集群模式原理
115 0
简单回顾 Zab 协议集群模式原理|学习笔记
|
存储 算法 开发者
浅谈一致性协议
浅谈一致性协议
193 0
浅谈一致性协议
|
存储 消息中间件 算法
zookeeper知识结构2-zab协议
通过《zookeeper知识结构1》了解了zookeeper是什么?为什么使用zookeeper? 以及zookeeper内部数据结构,选举机制
89 0
zookeeper知识结构2-zab协议
|
算法 安全 调度
Raft 协议( 一)
Raft 协议( 一)
215 0
Raft 协议( 一)
|
算法 安全 索引
Raft 协议原理详解,10 分钟带你掌握!
Raft 是一种更为简单方便易于理解的分布式算法,主要解决了分布式中的一致性问题。相比传统的 Paxos 算法,Raft 将大量的计算问题分解成为了一些简单的相对独立的子问题,并有着和 Multi-Paxos 同样的性能,下面我们通过动图,以后还原 Raft 内部原理。
1648 0
Raft 协议原理详解,10 分钟带你掌握!
|
网络协议 数据库
面试官上来就问 ZAB 协议,瑟瑟发抖…
面试官上来就问 ZAB 协议,瑟瑟发抖…