谈谈分布式事务之一:SOA需要怎样的事务控制方式

本文涉及的产品
云数据库 RDS SQL Server,独享型 2核4GB
简介:

在一个基于SOA架构的分布式系统体系中,服务(Service)成为了基本的功能提供单元,无论与业务流程无关的基础功能,还是具体的业务逻辑,均实现在相应的服务之中。服务对外提供统一的接口,服务之间采用标准的通信方式进行交互,各个单一的服务精又有效的组合、编排成为一个有机的整体。在这样一个分布式系统中某个活动(Activity)的实现往往需要跨越单个服务的边界,如何协调多个服务之间的关系使之为活动功能的实现服务,涉及到SOA一个重要的课题:服务协作(Service Coordination)。而具体来讲,一个分布式的活动可能会执行几秒钟,比如银行转帐;也可能执行几分钟、几个小时、几天甚至更长,比如移民局处理移民的申请。事务,无疑是属于短暂运行服务协作(Short-Running Service Coordination)的范畴。

一、 什么是事务(Transaction)

事务提供一种机制将一个活动涉及的所有操作纳入到一个不可分割的执行单元,组成事务的所有操作只有在所有操作均能正常执行的情况下方能提交,只要其中任一操作执行失败,都将导致整个事务的回滚。简单地说,事务提供一种“要么什么都不做,要么做全套(All or Nothing)”机制。事务具有如下四个属性,根据其首字母,我们一般将其称为事务的ACID四大属性:

  • 原子性(Atomicity):“原子”这个词的本义就是不可分割的意思,事务的原子性的含义是:一个事务的所有操作被捆绑成一个整体,所有的操作要么全部执行,要么都不执行;
  • 一致性(Consistence):事务的原子性确保一个事务不会破环数据的一致性,如果事务成功提交,数据的状态是组成事务的所有操作按照事先编排的方式执行的结果,数据状态具有一致性;如果事务任何一个中间步骤出错,整个事务回滚并将数据回复到原来的状态,数据状态仍然具有一致性。所以,事务只会将数据状态从一个一致性状态转换到另一个一致性状态;
  • 隔离性(Isolation):从事务的外部来看,事务的一致性实现了数据在两个一致性状态之间的转换,但是从事务内部来看,组成事务的各个操作是按照一定的逻辑顺序执行的,所以数据具有位于两个一致性状态的“中间状态”。但是,这种中间状态被隔离于事务内部,对于事务外部是不可见的;
  • 持久性(Durability):持久性的意思是一旦成功提交,基于持久化资源(比如数据库)的数据将会被持久化,对数据的改变是永久性的。

事务最初来源于数据库管理系统(DBMS),反映的是对存储于数据库中的数据操作。除了主流的关系型数据库管理系统,比如SQL Server,Oracle和DB2等提供对事务的支持,基于事务的数据操作方式也可以应用到其他一些数据存储资源,比如MSMQ。自Windows Vista开始将文件系统(NTFS)以至于注册表纳入了事务型资源(Transactional Resource)的范畴。

二、 事务的显式控制

虽然事务型资源家族成员越来越多,但是不可否认的是,数据库还是我们使用频率最高的事务型资源。对于稍微有一定经验的开发人员,应该都在存储过程(Stored Procedure)中编写过基于事务的SQL,或者编写过基于ADO.NET事务的代码,对事务的进一步介绍就从这里说起。

1、SQL中的事务处理

无论是基于SQL Server的T-SQL,抑或是基于Oracle的PL-SQL都对事务提供了原生的支持,有意思的是T-SQL中的T本身指的就是事务(Transaction)。以T-SQL为例,我们可以通过如下三个SQL语句实现事务的启动、提交与回滚:

  • BEGIN TRANSACTION: 开始一个事务;
  • COMMIT TRANSACTION提交所有位于BEGIN TRANSACTION和COMMIT TRANSACTION之间的操作;
  • ROLLBACK TRANSACTION回滚所有位于BEGIN TRANSACTION和COMMIT TRANSACTION之间的操作。

我们举一个很典型的基于事务型操作的例子:银行转帐,而且这个例子将会贯穿于本章的始终。为此,我们先创建一个最为简单的用于存储帐户的数据表:T_ACCOUNT,整个表近仅仅包括三个字段(ID、NAME和BALANCE),它们分别代表银行帐号的ID、名称和余额。创建该表的T-SQL如下:

   1: CREATE TABLE [dbo].[T_ACCOUNT](
   2:     [ID]        VARCHAR(50)     PRIMARY KEY,
   3:     [NAME]      NVARCHAR(50)    NOT NULL,
   4:     [BALANCE]   FLOAT           NOT NULL)
   5: GO

银行转帐是一个简单的复合型操作,由两个基本的操作构成:存储和提取,即从一个帐户中提取相应金额出入另一个帐户。对数据完整性的要求是我们必须将这两个单一的操作纳入同一个事务。如果我们通过一个存储过程来完成整个转帐的流程,具体的SQL应该采用下面的写法:

   1: CREATE Procedure P_TRANSFER
   2:     (
   3:         @fromAccount    VARCHAR(50),
   4:         @toAccount      VARCHAR(50),
   5:         @amount         FLOAT
   6:     )
   7: AS
   8:  
   9: --确保帐户存在性
  10: IF NOT EXISTS(SELECT * FROM [dbo].[T_ACCOUNT] WHERE ID = @fromAccount)
  11:     BEGIN
  12:         RAISERROR ('AccountNotExists',16,1) 
  13:         RETURN
  14:     END    
  15: IF NOT EXISTS(SELECT * FROM [dbo].[T_ACCOUNT] WHERE ID = @toAccount)
  16:     BEGIN
  17:         RAISERROR ('AccountNotExists',16,1) 
  18:         RETURN
  19:     END
  20: --确保余额充足性
  21: IF NOT EXISTS(SELECT * FROM [dbo].[T_ACCOUNT] WHERE ID = @fromAccount AND BALANCE >= @amount)
  22:     BEGIN
  23:         RAISERROR ('LackofBalance',16,1)
  24:         RETURN
  25:     END
  26: --转帐
  27: BEGIN TRANSACTION
  28:     UPDATE     [dbo].[T_ACCOUNT] SET BALANCE = BALANCE - @amount WHERE ID = @fromAccount
  29:     IF @@ERROR <> 0 
  30:         BEGIN
  31:             ROLLBACK TRANSACTION
  32:         END
  33:     UPDATE     [dbo].[T_ACCOUNT] SET BALANCE = BALANCE + @amount WHERE ID = @toAccount
  34:     IF @@ERROR <> 0 
  35:         BEGIN
  36:             ROLLBACK TRANSACTION
  37:         END
  38: COMMIT TRANSACTION
  39: GO

2、 ADO.NET事务控制

无论是T-SQL,还是PL-SQL,抑或是其他数据库管理系统对标准SQL的扩展,不仅仅是提供基于标准SQL的DDL(Data Definition Language)和DML(Data Manipulation Language),还提供了对函数、存储过程和流程控制的支持。SQL Server至2005起,甚至实现了与CLR(Common Language Runtime)的集成,使开发人员可以使用任何一种.NET语言编写编写函数或者存储过程。毫无夸张地说,你可以通过SQL实现任何业务逻辑。

但是,在大多数情况我们并不这么做,我们更多地还是将SQL作为最基本的数据操作语言在使用。对于.NET开发者来说,我们还是习惯将复杂的逻辑和流程控制实现在通过C#或者VB.NET这样的面相对象编程语言编写的程序中。究其原因,我觉得主要有两点:

  • 面相对象的语言更能容易地实现复杂的逻辑:较之SQL这种基于集合记录的语言,面相对象的语言更加接近于我们真实的世界,通过面相对象的方式模拟具体的逻辑更加贴近于人类的思维方式。此外,通过面相对语言本身的一些特性,我们可以更加容易地应用各种设计模式和思想;
  • 将太多逻辑运算的执行放在数据库中不利于应用的扩展:从部属的角度来讲,数据操作运算负载到具体的服务器中,以一个典型的分布式Web应用为例,Web服务器(承载Web应用)、应用服务器(承载各种服务)和数据库服务器均可以承载最终对逻辑的运算。但是,从可扩展性(或者可伸缩性)上考虑,将主要的计算放在前两者比放在数据库更具优势。如果我们将密集的运算(这种运算需要占用更多的CPU时间和内存)迁移到Web服务器或者应用服务器,我们可以通过负载均衡(Load Balance)将其分流到多台服务器上面,这个服务器机群可以根据负载情况进行动态地配置。但是,数据库服务器对负载均衡的支持就不那么容易。

正因为如此,对于事务的控制,较之采用SQL的实现方式,我们使用得最多的还是采用基于面相对象语言编程的方式。对于.NET开发人员,我们可以直接利用ADO.NET将基于单个数据库连接的多个操作纳入同一个事务之中。同样以上面的银行转帐事务为例,这次我们将整个转帐作为一个服务(BankingService)的一个操作(Transfer)。下面的代码通过一种与具体数据库类型无关的ADO.NET编程模式实现了整个银行转帐操作,最终的转帐通过调用一个存储过程实现:

   1: public class BankingService : IBankingService
   2: {
   3:     //其他操作
   4:     public void Transfer(string fromAccountId, string toAccountId, double amount)
   5:     {
   6:         string connectionStringName = "BankingDb";
   7:         string connectionString = ConfigurationManager.ConnectionStrings[connectionStringName].ConnectionString;
   8:         string providerName = ConfigurationManager.ConnectionStrings[connectionStringName].ProviderName;
   9:         DbProviderFactory dbProviderFactory = DbProviderFactories.GetFactory(providerName);
  10:         using (DbConnection connection = dbProviderFactory.CreateConnection())
  11:         {
  12:             connection.ConnectionString = connectionString;
  13:             DbCommand command = connection.CreateCommand();
  14:             command.CommandText = "P_TRANSFER";
  15:             command.CommandType = CommandType.StoredProcedure;
  16:  
  17:             DbParameter parameter = dbProviderFactory.CreateParameter();
  18:             parameter.ParameterName = BuildParameterName("fromAccount");
  19:             parameter.Value = fromAccountId;
  20:             command.Parameters.Add(parameter);
  21:  
  22:             parameter = dbProviderFactory.CreateParameter();
  23:             parameter.ParameterName = BuildParameterName("toAccount");
  24:             parameter.Value = toAccountId;
  25:             command.Parameters.Add(parameter);
  26:  
  27:             parameter = dbProviderFactory.CreateParameter();
  28:             parameter.ParameterName = BuildParameterName("amount");
  29:             parameter.Value = amount;
  30:             command.Parameters.Add(parameter);
  31:  
  32:             connection.Open();
  33:             using (DbTransaction transaction = connection.BeginTransaction())
  34:             {
  35:                 command.Transaction = transaction;
  36:                 try
  37:                 {
  38:                     command.ExecuteNonQuery();
  39:                     transaction.Commit();
  40:                 }
  41:                 catch
  42:                 {
  43:                     transaction.Rollback();
  44:                     throw;
  45:                 }
  46:             }
  47:         }
  48:     }
  49: }

注:为了使上面一段代码能够同时用于不同的数据库类型,比如SQL Server和Oracle,我通过提取连接字符串配置中的数据库提供者(DbProvider)名称,借此创建相应的DbProviderFactory对象。所有ADO.NET对象,包括DbConnection、DbCommand、DbParameter以及DbTransaction均通过DbProviderFactory创建,所以并不和具体的数据库类型绑定在一起。此外,基于不同数据库类型的存储过程的参数命名各不相同,比如 SQL Server的参数会添加”@”前缀,为此我将对参数名称的解析实现在一个单独的方法(BuildParameterName)之中。

3、事务的显式控制限定于对单一资源的访问

通过在SQL中进行事务的控制,只能将基于某一段SQL语句的操作纳入到一个单一的事务中;如果采用基于ADO.NET的数据控制,被纳入到同一个事务的操作仅仅限于某个数据库连接。换句话说,上面介绍的这两种对事务的显式控制仅仅限于对单一的本地资源的控制。

我们将事务的概念引入服务,倘若我们将一个单一的服务操作作为一个事务,如果采用上述的显式事务控制的方式,那么整个服务操作只能涉及一个单一的事务资源。服务于存取的资源关系如图1所以。

image

图1 本地事务对单一资源的控制

上述的这种基于某个服务单一本地资源的访问的事务,被称为本地事务(Local Transaction),在一个基于SOA分布式应用环境下,我们需要的同时能将多个资源、多个服务进行统一协作的分布式事务(Distributed Transaction)。接下来,我们来介绍几种典型的分布式事务应用的场景。

三、分布式事务(Distributed Transaction)应用场景

对于一个分布式事务(Distributed Transaction)来讲,事务的参与者分布于网络环境中的不同的节点。也就是说,我们可以将多个事务资源纳入到一个单一的事务之中,并且这些事务资源可以分布到不同的机器上。这些承载分布式资源的机器可能是出于同一个网络中,也可能处于不同的网络中。甚至说,某个事务资源本质上就是一个通过HTTP访问的单纯的Internet资源。

站在SOA的角度来看分布式事务,意味着将服务的某个服务操作视为一个单一的事务。该服务操作可能会访问不止一个事务资源(比如访问两个不同的数据库服务器),也可能调用另一个服务。下面介绍了三个典型的分布式事务应用场景,先从最简单的说起。

1、将对多个资源的访问纳入同一事务

第一个分布式事务应用场景最简单,即一个服务操作并不会调用另一个服务,但是服务操作涉及到对多个事务资源的访问。当一个服务操作访问不同的数据库服务器,比如两台SQL Server,或者一台SQL Server和一台Oracle Server;当一个服务操作访问的是相同数据库,但是相应的数据库访问时基于不同的数据连接;当一个服务操作处理访问数据库资源,还需要访问其他份数据库的事务资源,就需要采用分布式事务来对所有的事务参与者进行协作了。图2反映了这样的分布式应用场景。

image

图2 单一服务对多个事务资源的访问

2、将对各个服务的调用纳入同一事务

对于上面介绍的分布式应用场景,尽管一个服务操作会访问多个事务资源,但是毕竟整个事务还是控制在单一的服务内部。如果一个服务操作需要调用另外一个服务,这是的事务就需要跨越多个服务了。在这种情况下,起始于某个服务的事务在调用另外一个服务的时候,需要以某种机制流转到另外一个服务,以使被调用的服务访问的资源自动加入进来。图3反映了这样一个跨越多个服务的分布式事务。

image 图3 跨越多个服务的事务

3、 将对多个资源和服务的访问纳入同一个事务

如果将上面这两种场景(一个服务可以调用多个事务资源,也可以调用其他服务)结合在一起,对此进行延伸,整个事务的参与者将会组成如图4所示的树形拓扑结构。在一个基于分布式事务的服务调用中,事务的发起者和提交均系同一个,它可以是整个调用的客户端,也可以是客户端最先调用的那个服务。

image 图4 基于SOA分布式事务拓扑结构

较之基于单一资源访问的本地事务,分布式事务的实现机制要复杂得多。Windows平台提供了基于DTC分布式事务基础架构,下一篇文章中我将对针对该架构模型详细介绍分布式事务时如何工作的。

 

分布式事务系列:
谈谈分布式事务之一:SOA需要怎样的事务控制方式
谈谈分布式事务之二:基于DTC的分布式事务管理模型[上篇]
谈谈分布式事务之二:基于DTC的分布式事务管理模型[下篇]
谈谈分布式事务之三: System.Transactions事务详解[上篇]
谈谈分布式事务之三: System.Transactions事务详解[下篇]

作者:Artech出处:http://artech.cnblogs.com本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。


作者:蒋金楠
微信公众账号:大内老A
微博: www.weibo.com/artech
如果你想及时得到个人撰写文章以及著作的消息推送,或者想看看个人推荐的技术资料,可以扫描左边二维码(或者长按识别二维码)关注个人公众号(原来公众帐号 蒋金楠的自媒体将会停用)。
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS&nbsp;SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/sqlserver
相关文章
|
2月前
|
消息中间件 Dubbo 应用服务中间件
分布式事物【Hmily实现TCC分布式事务、Hmily实现TCC事务、最终一致性分布式事务解决方案】(七)-全面详解(学习总结---从入门到深化)
分布式事物【Hmily实现TCC分布式事务、Hmily实现TCC事务、最终一致性分布式事务解决方案】(七)-全面详解(学习总结---从入门到深化)
72 0
|
Dubbo 应用服务中间件 微服务
分布式事物【Hmily实现TCC分布式事务、Hmily实现TCC事务、最终一致性分布式事务解决方案】(七)-全面详解(学习总结---从入门到深化)(上)
分布式事物【Hmily实现TCC分布式事务、Hmily实现TCC事务、最终一致性分布式事务解决方案】(七)-全面详解(学习总结---从入门到深化)
40 1
|
3月前
|
消息中间件 RocketMQ 微服务
分布式事物【Hmily实现TCC分布式事务、Hmily实现TCC事务、最终一致性分布式事务解决方案】(七)-全面详解(学习总结---从入门到深化)(下)
分布式事物【Hmily实现TCC分布式事务、Hmily实现TCC事务、最终一致性分布式事务解决方案】(七)-全面详解(学习总结---从入门到深化)
44 1
|
8月前
|
消息中间件 架构师 数据库
谈谈分布式事务的3种解决方案
前几天,有一位10多年经验的架构师在面试互联网大厂时被问到这样一个问题,说请你谈谈分布式事务的解决方案。那今天,我给大家分享一下我对这个问题的理解。
80 0
|
10月前
|
关系型数据库 MySQL Java
多数据源事务处理-涉及分布式事务
多数据源事务处理-涉及分布式事务
105 0
|
Java 中间件 数据库
谈谈分布式事务TCC机制
分布式事务是几乎所有分布式微服务系统中,最棘手也是最重要的一个点了。在讲解分布式事务前,先了解下数据库事务的特性;数据库事务的几个特性:原子性(Atomicity )、一致性( Consistency )、隔离性或独立性( Isolation)和持久性(Durabilily),简称就是ACID。
162 0
谈谈分布式事务TCC机制
|
存储 消息中间件 SQL
核心特性—强一致分布式事务
ACID分布式事务 PolarDB-X原生支持分布式事务,并保证事务的ACID性质。 原子性(Atomicity) 一致性(Consistency) 隔离性(Isolation) 持久性(Durability) PolarDB-X通过引入中心授时节点(TSO),结合多版本并发控制(MVCC),确保读取到一致的快照,而不会读到事务的中间状态。如下图所示,提交事务时,计算节点(CN)执行事务时从TSO获取到时间戳,随着数据一同提交到存储节点(DN)多版本存储引擎上,CN通过读取快照时间戳去DN上读取相应版本的数据。
126 0
核心特性—强一致分布式事务
|
消息中间件 算法 前端开发
谈谈对分布式事务的一点理解和解决方案
最近,工作中要为现在的老系统做拆分和升级,刚好遇到了分布式事务、幂等控制、异步消息乱序和补偿方案等问题,刚好基于实践结合个人的看法记录一下一些方案和思路。
251 0
谈谈对分布式事务的一点理解和解决方案
|
SQL 消息中间件 中间件
分布式事务中间件Seata的设计原理
因为待过的几家公司,用的都是微服务架构,但是在解决分布式事务的问题上都不太优雅,所以我也在一直关注 Seata 的发展,今天就简要说说它的一些设计上的原理,后续我将会对它的各个模块进行深入源码分析,感兴趣的可以持续关注我的公众号或者博客,不要跟丢。
245 0
分布式事务中间件Seata的设计原理