简单的来说就是,一个大的操作由两个或者更多的小的操作共同完成。而这些小的操作又分布在不同的网络主机上。这些操作,要么全部成功执行,要么全部不执行。拿转账的例子来说下什么是分布式事务。张三和李四在不同的城市,存储他们账户信息的服务器也在不同的网络主机上。张三有30元钱,李四有30元钱。张三给李四转账5元就是一个事务。完成这个事务,需要两个操作。首先得从张三账户上扣5元,然后再给李四账户上加5元。事务执行完毕后,必须是两个操作都执行成功,要么都失败。分布式事务本身就是事务,所以也有事务的特性。事务有四个特征ACID:原子性(Atomicity):事务中的各个操作单元要么全部做,要么就全部不做。不能事务执行后,处于只做一半的状态。一致性(Consistency):事务执行后,必须由一个一致状态变为另外一个一致状态。隔离性(Isolation):事务之间不能相互干扰。持久性(Durability):一旦事务完成,对于数据的变更是的。下面我们就以上面转账的例子来说下实现分布式事务的几种方式。
在阶段,主要是事务管理者(经理)发起事务,让各个事务资源方(职员甲乙)确认资源是否满足,并做预处理(冻结)。资源方的操作有可能失败也可能成功。如,张三账户不足5元钱,没办法冻结,就是失败。资源方把操作结果反馈给事务管理者。
异常情况下的操作过程如下:
如果预提交过程中出现任何问题,导致事务不能执行。将会通知资源方进行撤销预提交操作。
第二阶段:如果是职员甲和职员乙都告诉经理,操作成功了。
这个时候,张三账户上的金额是25元。李四账户上的金额是35元。
这个时候,张三账户上的金额是30元。李四账户上的金额也是30元。
总而言之,事务的执行会分为预提交和提交两步进行。任何一个小操作出问题,导致事务不能完成,将会进行回滚操作。1:两阶段提交,要有一个事务管理者协调各方的操作。各方对资源的占用要到整个事务结束后才能释放。这样会影响事务的效率。当并发量大的时候,系统的性能会严重下滑。2:事务管理者和资源方存在通信。有可能存在通信不通畅。如,职员甲接受到扣钱的命令后,职员甲扣完了钱。由于电话故障等原因,导致没办法通知经理已经操作成功。因此,各方还要处理通信超时问题。3:整个流程需要事务管理者协调各个资源方进行操作。但是,事务管理者可能出现问题。导致没办法进行协调。如,经理生病了。4:注意幂等性问题。可能存在对资源方重复调用的情况。这种情况下,资源方被调用多次和调用一次的效果要一样。如上例中,经理第二次通知职员甲扣5元的时候,职员甲要像上次一样,告诉经理扣款已经完成。但是,职员甲不能再进行扣款的动作。基于消息的分布式事务实现中,引入了消息中间件(助理),负责消息的传递和事务执行状态的询问。这样就降低了系统间的耦合度。
主要是怕自己扣款成功了,又忘记告诉助理。这个时候,助理也就没办法通知职员乙操作了。告诉助理后,如果职员甲忘记了,助理可以询问职员甲,是否执行成功。进而决定是否该通知职员乙进行加钱操作。如果职员甲扣款失败,则应该通知助理。助理在这种情况下,就不应再通知职员乙加钱。基于消息实现的问题:基于消息的分布式事务实现,讲究的是终一致性。也即所有的本地事务执行完毕后,整个状态的一致。整个事务一般不会有回滚操作。如,当职员乙操作失败的时候,职员应该是再次通知职员乙重试。<END>
推荐阅读:
谁说用 Git 一定要用命令行?试试 SourceTree 吧
中国麻将:世界上早的区块链项目
微信扫描二维码,关注我的公众号
朕已阅