【技术实现步骤摘要】
本专利技术涉及一种冗余容错系统及其切换方法,具体地说,是涉及一种双机 冗余容错系统以及对该双机冗余容错系统中的双机进行冗余切换的方法。技术背景对于以计算机作为核心的系统而言,很重要的一点是该系统的某个计算机 出现故障后,系统仍能继续工作。为了解决这个问题,目前普遍采取的措施是 为该系统设计冗余系统,以支持容错操作。考虑到成本和使用面积等因素,一 般情况下,对该系统进行动态双模冗余设计。动态双模冗余系统包括一个工作 机和一个备份机,它们的职能可以互换。在这种双机冗余设计中,需要确定一 种机制,以使在各阶段内具有作为主控制器的控制器和作为备份而处于空闲状 态的控制器,同时,还需要确定当单个控制器产生故障时,正常的控制器应作 出怎样的反应,以保证系统的正常运行。这种机制需要在工作机与备份机之间 有大量的电路连接,以进行信号交互,是一套复杂的机制。传统的动态双模冗余系统的设计较为单一, 一般只考虑双机同时工作状 态,以及单机发生不可恢复故障时的状态,而没有考虑到控制器工作的复杂环 境和对功耗的特殊要求。同时,为了降低设计的复杂度,传统动态双模冗余系 统的故障检测切换方法比较单一, 一般为 一套监视电路观察工作机的状态, 在工作机故障时进行切换。这种故障检测切换方法一方面忽视了备份机的工作 状态,当工作机故障时,可能备份机处于更糟的故障状态,另一方面,该方法 不能防止单一的监视电路出错,会造成切换逻辑的误操作。在这种传统的切换 方法设计中,冗余设备间加入了专门的切换部件,由这个切换部件接收并监视 双机的状态信号,根据接收状态信号来决定主从机的选择,同时,给出互 ...
【技术保护点】
一种双机冗余容错系统,其特征在于:它包括A机、B机、冗余切换选择单元和被控单元,A机和B机内均设有一冗余切换控制单元,A机和B机内的冗余切换控制单元分别将各自产生的切换信号传输至冗余切换选择单元,冗余切换选择单元通过两冗余切换控制单元传输的切换信号对A机和B机分别输出的控制信号进行选择后产生一最终控制信号,并将该最终控制信号传输至被控单元,其中:该冗余切换控制单元包括仲裁切换单元、心跳收发单元、加断电单元和监视器单元,A机的仲裁切换单元分别与A机的心跳收发单元、加断电 单元和监视器单元相连,该A机的心跳收发单元与B机的心跳收发单元相连,该A机的加断电单元与B机的电源单元相连,该A机的监视器单元与A机的CPU相连,该A机的CPU与A机的仲裁切换单元相连,该A机的仲裁切换单元与B机的仲裁切换单元相连,该A机的仲裁切换单元输出一切换信号;B机的仲裁切换单元分别与B机的心跳收发单元、加断电单元和监视器单元相连,该B机的加断电单元与A机的电源单元相连,该B机的监视器单元与B机的CPU相连,该B机的CPU与B机的仲裁切换单元相连,该B机的仲裁切换单元输出一切换信号。
【技术特征摘要】
1. 一种双机冗余容错系统,其特征在于它包括A机、B机、冗余切换选择单元和被控单元,A机和B机内均设有一冗余切换控制单元,A机和B机内的冗余切换控制单元分别将各自产生的切换信号传输至冗余切换选择单元,冗余切换选择单元通过两冗余切换控制单元传输的切换信号对A机和B机分别输出的控制信号进行选择后产生一最终控制信号,并将该最终控制信号传输至被控单元,其中该冗余切换控制单元包括仲裁切换单元、心跳收发单元、加断电单元和监视器单元,A机的仲裁切换单元分别与A机的心跳收发单元、加断电单元和监视器单元相连,该A机的心跳收发单元与B机的心跳收发单元相连,该A机的加断电单元与B机的电源单元相连,该A机的监视器单元与A机的CPU相连,该A机的CPU与A机的仲裁切换单元相连,该A机的仲裁切换单元与B机的仲裁切换单元相连,该A机的仲裁切换单元输出一切换信号;B机的仲裁切换单元分别与B机的心跳收发单元、加断电单元和监视器单元相连,该B机的加断电单元与A机的电源单元相连,该B机的监视器单元与B机的CPU相连,该B机的CPU与B机的仲裁切换单元相连,该B机的仲裁切换单元输出一切换信号。2、 根据权利要求1所述的双机冗余容错系统,其特征在于所述冗余切 换控制单元还包括优先级单元,该优先级单元接收本机的心跳收发单元输出的 信号和对机的仲裁切换单元输出的信号,该优先级单元将处理后产生的信号输 出至本机的仲裁切换单元。3、 一种双机冗余容错系统的冗余切换方法,其特征在于它包括步骤步骤A:双机同时上电,通过上电策略确定工作机、备份机;步骤B:判断双机状态若双机无故障,则跳至步骤C;若工作机或备份 机故障,则跳至步骤D;步骤C:判断系统所处任务段若系统工作在一般任务段,则工作机通过 自身的加断电单元对备份机断电,系统实行冷备策略,并返回步骤B;若系统 工作在关键任务段,则工作机通过自身的加断电单元对备份机上电,系统实行 热备策略,并返回步骤B;步骤D:判断故障是否可恢复若故障可恢复,则进行故障恢复,并返回 步骤B;若故障不可恢复,则系统进入单机状态。4、 根据权利要求3所述的冗余切换方法,实特征在于所述上龟策略进 一步包括步骤步骤1-1:双机上电后,各单机均默认系统指定的一单机为工作机,继续 步骤1-2;步骤1-2:各单机开始初始化并自检测若其中一单机自检测失败,则该 自检测失败的单机进入死循环,等待对机处理;若双机均自检测成功,则继续 步骤1-3;步骤l-3:双机各自设置将要交互的状态信号,继续步骤l-4;步骤1-4:经随机时间的延迟后,各单机读取对机的状态信号,先读取到 对机状态信号的单机被确定为工作机,被确定为工作机的单机设置当班标志信 号,并将该当班标志信号传输至自身的仲裁切换单元,以进行自身为工作机的 控制权确认;后读取到对机状态信号的单机通过对机仲裁切换单元传输的当班 标志信号判断出对机己经成为工作机后放弃抢权,且向被确定为工作机的仲裁 切换单元返回确认备份机信号而成为备份机,继续步骤1-5;步骤1-5:双机稳定工作一段时间后,工作机通过自身的加断电单元对备 份机断电,系统实行冷备策略。5、 根据权利要求4所述的冗余切换方法,其特征在于所述步骤l-2中, 若其中一单机自检测失败,则自检测成功的单机通过自身的加断电单元对该自 检测失败的单机进行断电和上电操作,如果该自检测失败的单机连续三次上电 自检测都不正确,则该自检测失败的单机被认为是失效,系统进入单机状态。6、 根据权利要求3至5中任一项所述的冗余切换方法,其特征在于所述冷备策略进一步包括步骤步骤2-1:判断工作机的工作状态若工作机发生影响系统任务完成的错 误,则进...
【专利技术属性】
技术研发人员:孙汉旭,贾庆轩,党崇伦,叶平,曹红玉,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。