5.3 分布式数据库中的死锁处理

5.3分布式数据库中的死锁处理

５.３.１全局死锁与等待图 • １．活锁，死锁和全局死锁 • 活锁：某个事务处于永远等待状态，得不到执行的机会． • 解决方法：“先来者先执行”就是简单的排队方式．

死锁：该集合中的每个事务都在等待该集合中另外一个事务释放它所需要的数据项上持有的锁，它才能继续执行下去，结果任何一个事务都无法继续执行死锁：该集合中的每个事务都在等待该集合中另外一个事务释放它所需要的数据项上持有的锁，它才能继续执行下去，结果任何一个事务都无法继续执行 • 在分布式数据库中，采用封锁机制，系统有可能发生全局死锁．全局死锁涉及两个或多个站点的死锁．

图５.１４

分布式数据库中的数据冗余也会增加更新数据时引起死锁的机会．因为更新时需要对全部副本加拒绝锁，有副本的每个站点上都有可能等待另一个事务释放锁，但每个事务只有它全部完成后才能释放拒绝锁，因此造成全局死锁．分布式数据库中的数据冗余也会增加更新数据时引起死锁的机会．因为更新时需要对全部副本加拒绝锁，有副本的每个站点上都有可能等待另一个事务释放锁，但每个事务只有它全部完成后才能释放拒绝锁，因此造成全局死锁．

图５.１５

２　等待图（WFC） • 等待图是一种用来表示事务之间相互等待关系的有向图，其中指出哪一个事务在等待其他哪个或哪些事务释放锁． • 图中节点表示事务，边表示等待关系，箭头方向就是等待方向． • 如下图是５.１５的等待图

图５.１６

全局等待图（GWFC）： • 图５.１７

５.３.２死锁的预防方法 • 思想：当有发生死锁危险时，就终止并重新启动其中一个事务或让该事务等待，但如果允许有等待的话，则决不可能发生死锁． • 因为这种方法不会发生死锁，所以不需要进行死锁的检测和恢复．

死锁预防是这样进行的：形成死锁的原因是多个事务并发执行，互相等待另一事务所持有的锁，且形成等待回路引起的．如果事务T1请求一资源，而该资源被另一事务T2所持有时，则进行一次预防性测试．若测试结果有死锁的危险时，或不让T1进入等待状态，并重新启动T1或终止并重新启动T2．死锁预防是这样进行的：形成死锁的原因是多个事务并发执行，互相等待另一事务所持有的锁，且形成等待回路引起的．如果事务T1请求一资源，而该资源被另一事务T2所持有时，则进行一次预防性测试．若测试结果有死锁的危险时，或不让T1进入等待状态，并重新启动T1或终止并重新启动T2．

预防性测试的一般方法是把事务排序． • 如按它们标识符的词典顺序排序，或按它们的开始时间排序等． • 预防死锁的方法有两种（按事务开始时间） • １非占先权（排队在先者可能失去优先）方法，也叫等待－死亡模式． • 非占先权的理论基础是：最好总是重新启动较年轻的事务．允许年老的事务等待已持有资源的年轻事务，但不允许年轻的事务去等待年老的事务．

２占先权（排队在先者绝对优先）方法，也叫伤害－等待模式．２占先权（排队在先者绝对优先）方法，也叫伤害－等待模式． • 占先权的理论基础是：因为仍要求终止较年轻的事务，但不允许年老的事务绝对优于年轻的事务，因而只有年轻的等待年老的． • 这两种方法都不会发生死锁．

５.３.３死锁的检测和解决方法 • １.死锁的检测和解决的一般方法 • 检测是通过对全局等待图中的回路的形成进行研究来实现的． • 如果系统处于死锁状态，就必须撤消一些引起死锁的事务．选择撤消哪个事务称为受害者选择．通过选择一个或多个受害者事务，这些事务或者被优先执行或被撤消，以打破GWFG中的回路．

选择最小总开销来打破死锁很困难，以下是可以影响这一选择的因素：选择最小总开销来打破死锁很困难，以下是可以影响这一选择的因素： • １:对事务已经投入了大量努力． • ２:撤消事务的开销． • ３:调度器力图避免撤消那些几乎要完成的事务． • ４:包含该事务的回路数目．

２.分布式死锁检测和解决办法 • 检测有三种基本方法：集中式，层次式及分布式死锁检测法． • （１）集中式死锁检测法：某个站点上的锁管理器被指定为整个系统的死锁检测器，其他每个站点上的锁管理器周期性的将它的LWFG传给系统的死锁检测器，然后由系统的死锁检测器形成GWFG并在其中查找回路．或者，每个站点上的锁管理器周期性把一张记录本站点上事务开始时间，对锁的持有，请求情况变化的动态表，发给负责处理封锁的站点．由它维护一张全局封锁动态表，形成GWFG并在其中查找回路．如果GWFG中至少有一个回路，它将选择一个或多个事务，把它们撤消并恢复，释放被占资源，使其他事务继续进行． • 这种方法很简单，但是传输开销较高．

（２）层次式死锁检测法：以层次方式组织成员数据库管理系统中的死锁检测器．按下述步骤进行死锁检测：（２）层次式死锁检测法：以层次方式组织成员数据库管理系统中的死锁检测器．按下述步骤进行死锁检测： • １:树叶是各站点的死锁局部检测器，它们在本站点建立局部等待图． • ２:本站点的死锁检测器找出本站点的LWFG中的任何回路，并把有关潜在全局回路的信息发送给层次结构中的紧挨的上一层死锁检测器 • ３:每个非本地死锁检测器只对它所涉及的下层进行死锁检测器，合并这些接收到的有关潜在全局回路信息，并找出任何回路． • ４:如果还有上层死锁检测器，将经过简化的有关潜在全局回路信息发给它的上一层死锁检测器，由上一层死锁检测器再进行合并，找出任何全局回路．这样逐层进行检查，直到最高层．

图５.１８

（３）及分布式死锁检测法：赋予每个站点相同的检测死锁职责．简单介绍一下System R系统中使用的方法，它对每一站点的LWFG的形成更新如下： • １:由于每一站点接收从其他站点传来的可能的死锁回路，因此向自己的局部WFG增加一些边． • ２:在站点的LWFG中，被增加的用于表示本地事务正在等待其他站点事务的边，同用于表示远程事务正在等待本站点事务的边相连接，该节点称为外部节点（EX）. • 向谁传送信息：不知道被涉及的哪些站点时，可以向系统中所有站点传输．如果知道死锁回路的头还是尾就可以沿着回路中的站点向前或后传送．接收到信息的站点随即根据前面讨论的方法更新其LWFG，并检查死锁．

５.４时标技术 • ５.４.１基于时标的并发控制方法 • １基本概念 • 基于时标的并发控制方法选择一个事先的串行次序依次执行事务．为建立次序，在每个事务初始化时，事务管理器将给每个事务分配一个在整个系统中唯一的时标． • 时标：是用来唯一识别每个事务并允许排序的标识符．特性：唯一性和单调性 • 时标由两部分组成： • 　　　＜本地计数器值，站点标识符＞

采用时标方法的思想是：给每个事务赋一个唯一的时标，事务的执行等效于按时标次序串行执行．如果发生冲突，是通过撤消并重新启动一个事务来解决的．事务重新启动时，则赋予新的时标．这个方法的优点是无死锁，不必设置锁．封锁和死锁检测所引起的通信开锁也避免了．但这个方法要求时标在全系统中是唯一的．采用时标方法的思想是：给每个事务赋一个唯一的时标，事务的执行等效于按时标次序串行执行．如果发生冲突，是通过撤消并重新启动一个事务来解决的．事务重新启动时，则赋予新的时标．这个方法的优点是无死锁，不必设置锁．封锁和死锁检测所引起的通信开锁也避免了．但这个方法要求时标在全系统中是唯一的．

２全局唯一时标的形成和调整 • 图５.２０

５.４.２基本时标法 • 基本时标法使用下述规则： • １）每个事务在本站点开始赋予一个全局唯一时标． • ２）在事务结束之前，不对数据库进行物理更新． • ３）事务的每个读操作或写操作都具有该事务的时标 • ４）对于数据库中的每个数据X，记录对其进行读操作和写操作的最大时标，分配记为RTM(X)和WTM(X)． • ５）如果事务被重新启动，则被赋予新的时标．

基本时标法的执行过程 • １）设read_TS是对数据X进行读操作的时标，如果read_TS<WTM(X),则拒绝该操作，并使发出该操作的事务用新时标重新启动；否则执行该操作，并把RTM(X)置为max(RTM(x),read_TS) • 2)设write_TS是对数据X进行写操作的时标，如果write_TS <RTM(X)或TS<WTM(X),则拒绝这个写操作，并使发出该操作的事务用新时标重新启动；否则执行这个写操作，并把WTM(X)置为max(WTM(x),write_TS) • 基本时标法的特点是不会发生死锁，任何一个事务都不会阻塞，如果某一操作不能执行就重新启动，而不是等待．高的重启动次数是这个方法的缺点．

５.４.３保守时标法 • 保守时标法是一种消除重启动的方法，通过缓冲年轻的操作，直至年长的操作执行完成，因此操作不会被拒绝，事务也绝对不被重启动 • １保守时标法的规则 • １）每个事务只在一个站点执行，它不激活远程的程序，仅仅能向远程站点发出读或写请求 • ２）每个站点必须按时标时间的顺序发送读／写数据的请求，在传输中也不会改变这个顺序，以保证各站点能够按时标顺序接收来自不同站点的全部读／写请求 • ３）每个站点都为其他各个站点发来的读／写操作开辟一个缓冲区，把接收到的读／写操作分别保存在相应的缓冲区中．

２保守时标法的执行步骤 • 站点１　站点２　站点３……　站点n • R11 R21 R31 ……. Rn1 • R12 R22 R32 • R13 R23 • R24 • W11 W21 W31 …….. Wn1 • W22 W32 ….… Wn2 • W23

此时按如下步骤执行： • １）设RT=min(Rij),WT=min(Wij) • ２）按下法处理在缓冲区队列里的Rij和Wij • １:扫描R队列，若各队列中存在(Rij)<WT的Rij • 按顺序执行它们，执行完成从队列中把它们去掉． • ２:扫描W队列，若各队列中存在(Wij)<RT的Wij • 按顺序执行它们，执行完成从队列中把它们去掉. • ３:更新：RT=min(Rij),WT=min(Wij).此时的Rij和Wij已是剩余 • 的 Rij和Wij了 • ４:重复上述２．３步，直到没有满足条件的操作，或者： • １若某个或某些R队列为空时，RT=0; • ２若某个或某些W队列为空时，WT=0; • 继续接收各站点发送来的读／写操作．回到上述情形，若其各 • 个缓冲区队列有都不空，仍按上面步骤继续．

３存在问题和解决办法 • １）如果一个站点从不向某个别的站点发送操作的话，那么执行中假定就不符合，操作就无法执行． • 这个问题的解决办法是要求对无实际读／写请求的每个站点，要周期性的发送带有时标的“空”操作，或由被阻断的站点请求无实际读／写请求的每个站点向它发送带时标的“空”操作．空操作是指只传送时标信息而不是真正的操作． • ２）该方法要求网络上所有站点都连通，这在大型系统中难以做到．为避免不必要的通信，可对无实际读／写请求的每个站点，发送一个时标为很大的空操作． • ３）该方法过分保守，一律按时标顺序执行R和W，其中包括了不会冲突的操作，也被缓冲起来等同处理．

５.５并发控制的多版本技术 • 并发控制的多版本技术：保存了已更新数据项的旧值，维护一个数据项的多个版本值． • 它的思想：通过读一个数据项的一个较老的版本来维护可串行性，使得系统可以接受在其他技术中被拒绝的一些读操作．当某事务写一个数据项时，它写入了一个新版本，但是该数据项的老版本仍然被保存． • 我们讨论其中的两种模式：一种是基于时间戳排序，另一种则是基于两阶段封锁．

５.５.１基于时间戳排序的多版本技术 • 在这种方法中，每个数据项X都保留了多个版本x1,x2……Xk.对于每个版本系统保存版本Xi的值和以下两种时间戳： • １）read_TS(Xi):Xi的读时间戳，所有读取版本Xi的事务的时间戳中最大的一个． • ２）write_TS(Xi):Xi的写时间戳，它是写入版本Xi值的事务的时间戳．

两条规则： • １）如果事务T发布一个write_item(X)操作，并且X的版本i具有X所有版本中最高的write_TS(Xi)，同时write_TS(Xi)＜＝TS(T) 且read_TS(Xi)>TS(T)，那么撤消并回滚T；否则创建X的一个新版本Xj，并且令read_TS(Xj)=write_TS(Xj)=TS(T). • ２）如果事务T发布一个read_item(X)操作，并且X的版本i具有X所有版本中最高的write_TS(Xi)，同时write_TS(Xi)＜＝TS(T) 那么,把Xi的值返回给事务T，并且将read_TS(Xi)的值置为TS(T) 和当前read_TS(Xi)中较大的一个．

５.５.２采用验证锁的多版本两阶段封锁 • 在这种封锁模式中，每个数据项有三种锁：读，写和验证．因此对于一个数据项X，LOCK(X)的状态可以是以下四种：读封锁，写封锁，验证封锁，未封锁 • 在只有读和写的封锁模式图５.２１（a）所示锁的相容性. • 采用验证锁的多版本两阶段封锁模式图５.２１（b）所示锁的相容性.

读写读写验证 读是否读是是否写否否写是否否验证否否否

5.6并发控制的乐观方法 • 基本思想：对于冲突操作不像悲观方法那样采取挂起或拒绝的方法，而是让一个事务执行直到完成． • 乐观方法基于如下假设：冲突的事务是少数（５％），大多数事务是可以不受干扰的执行完毕．因此在事务执行过程中，事务都是先对欲操作的数据项的本地局部副本进行操作，执行完毕后再进行检验．当不曾发生过冲突时，就把该本地局部副本全局化；若发生过冲突，则回退该事务并作为新事务重新启动．

１）读／计算阶段：事务从数据库中读数据，进行计算，并为写集合中的数据项确定新值，但这些值暂不写入数据库．１）读／计算阶段：事务从数据库中读数据，进行计算，并为写集合中的数据项确定新值，但这些值暂不写入数据库． • 读阶段末产生一个更新表包括１读集的数据项，带有自身时标；２写集数据项的新值３该事务自身的时标 • ２）验证阶段：检测事务对数据库的更新是否失去相容性，确定如果将事务的更新应用于数据库，不会违反可串行性． • 表决规则：更新表读集中的每个数据项的时标和它的本地数据库中存在的对应数据项的时标进行比较，如果它们全部相等，则该站点投肯定票，否则投否定票．

这里没有考虑更新表挂起的情况．即一个更新表从已经表决的时刻算起，到它收到来自源站点的最后决定为止，这段时间称为该更新表在这个站点上未表决（挂起）。如果同一站点上的两个更新表U和U’，且两个更新表都更新同一数据项。当U表到达时，U’表还未处理或仍处于未表决在状态，而且U和U’有冲突，即U’的执行结果会引起与U表读集相对应的数据项时标的改变。这时就需要对上述表决规则进行扩充。这里没有考虑更新表挂起的情况．即一个更新表从已经表决的时刻算起，到它收到来自源站点的最后决定为止，这段时间称为该更新表在这个站点上未表决（挂起）。如果同一站点上的两个更新表U和U’，且两个更新表都更新同一数据项。当U表到达时，U’表还未处理或仍处于未表决在状态，而且U和U’有冲突，即U’的执行结果会引起与U表读集相对应的数据项时标的改变。这时就需要对上述表决规则进行扩充。

扩充后的表决规则如下： • １:比较U表的读集中的数据项的时标与数据库中对应数据 • 项的时标； • ２:如果不等投否定票 • ３:如果相等，若存在一个与U表有冲突操作的未决更新表 • U‘，且U’的时标大于U的时标，则投否定票 • ４:如果相等，若存在一个与U表有冲突操作的未决更新表 • U‘，且U’的时标小于U的时标，则推迟表决 • ５:如果相等，但不存在未决的更新表，则投肯定票

３）写阶段如验证阶段获得肯定结果，则把数据更新应用于数据库，对数据库进行更新，否则，忽略所有更新，并重新开始该事务３）写阶段如验证阶段获得肯定结果，则把数据更新应用于数据库，对数据库进行更新，否则，忽略所有更新，并重新开始该事务

谢谢！

5.3 分布式数据库中的死锁处理

5.3 分布式数据库中的死锁处理

Presentation Transcript