基于总线控制器的双机故障检测及恢复方法技术

技术编号:19515081 阅读:28 留言:0更新日期:2018-11-21 10:07
本发明专利技术公开了一种基于总线控制器的双机故障检测及恢复方法,包括如下步骤:S1、总线上各远置单元周期性地向总线控制器发送数据备份请求;S2、总线控制器获取远置单元的备份数据并存储在本地;S3、总线控制器周期性地发送测试命令到各远置单元,测试其是否处于正常工作状态;S4、各远置单元接收到测试命令后按照相应要求进行处理,并将测试结果存放在总线缓存区中等步骤。本发明专利技术能够自动检测出总线远置单元故障,并在故障情况下与其备份单机建立通信连接,后者通过备份/恢复机制恢复故障前最新的任务状态和数据,尽可能减小故障损失,提高了整星的可靠性与安全性。

【技术实现步骤摘要】
基于总线控制器的双机故障检测及恢复方法
本专利技术涉及一种故障检测及恢复方法,特别是涉及一种基于总线控制器的双机故障检测及恢复方法。
技术介绍
星载数据管理系统通过串行数据总线与星上其它分系统连接,完成遥测的采集、遥控的分发、时间基准的维护及发布、并协调各分系统完成各类程控作业(比如完成载荷成像并将图像数据传输到地面)或应急处理等。星载数据管理系统作为总线控制器组织总线通信,完成数据的传输和调度。各远置单元,即连接在总线上的各分系统单机,在接收到总线控制器发出的命令后进行响应,完成数据的接收或发送。卫星上各分系统单机通常采用冷备或热备等方式来实现硬件的冗余备份以提高系统的可靠性,并在互为备份的单机之间建立硬件链路来进行故障的检测,典型的做法是周期性监听对方单机的心跳信号。在检测出故障的情况下,通过切机来实现故障的恢复,即将权控制状态由主机转移到备机,由备机来接替主机继续工作。这种基于心跳链路的双机故障检测及恢复方法在实际应用中,存在以下明显不足:故障的恢复通过切换控制权来实现,切机后备机会忽略主机故障前的运行状态数据,因而会导致任务运行状态的不连续,甚至在某些工况下带来安全隐患,需要地面注数干预。针对基于心跳链路的双机故障检测及恢复方法所存在的不足,本专利技术提出了一种基于总线控制器的双机故障检测及恢复方法,该方法与现有可靠性设计方法并不冲突,而是提高系统可靠性及可用性的另一举措。目前没有发现同本专利技术类似技术的说明或报道,也尚未收集到国内外类似的资料。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于总线控制器的双机故障检测及恢复方法,该方法通过总线控制器对总线上各远置单元的运行状态进行周期性地检测,在远置单元故障的情况下自动建立与其备份单机的通信连接,并且该备份单机可以通过备份/恢复机制获取故障前的运行状态数据完成任务现场及数据的恢复。该方法简单实用,显著提高了卫星上各远置单元的可靠性和可用性,对延长整星的使用寿命也具有积极的作用。本专利技术是通过下述技术方案来解决上述技术问题的:一种基于总线控制器的双机故障检测及恢复方法,包括如下步骤:S1、总线上各远置单元周期性地向总线控制器发送数据备份请求;S2、总线控制器获取远置单元的备份数据并存储在本地;S3、总线控制器周期性地发送测试命令到各远置单元,测试其是否处于正常工作状态;S4、各远置单元接收到测试命令后按照相应要求进行处理,并将测试结果存放在总线缓存区中;S5、总线控制器获取测试结果;S6、总线控制器判断各远置单元测试结果的正确性;如果不正确,则相应远置单元的通信错误计数器加1;否则将计数器清零;S7、总线控制器判断各远置单元的通信错误计数器是否大于阈值N;如果大于N,则进入步骤S8;否则进入步骤S3;S8、总线控制器自动建立与该远置单元备机间的通信连接,并将对应该远置单元的通信错误计数器清零;S9、步骤S8中的备机向总线控制器发送数据恢复请求;S10、总线控制器将步骤S2中存储的备份数据返回给请求方以恢复后者的任务现场及数据。进一步地,所述总线采用集中式的时分串行总线,典型的是1553B总线,其主要特点是分布处理、集中控制和实时响应;总线控制器是总线上唯一可执行建立和启动数据传输任务的终端;远置单元在总线控制器的控制下获取数据或者发送数据。进一步地,远置单元为连接在总线上的各系统单机,含主机和备机;对于采用冷备的单机,主备机可以采用同一个远置单元地址;对于采用热备的单机,主备机需要采用不同的远置单元地址。进一步地,远置单元地址为各远置单元在总线上的标识,用于总线控制器识别不同的对象。进一步地,远置单元的数据备份周期根据备份数据的更新频率、重要程度而定,不同的远置单元可采用不同的备份周期。进一步地,备份数据为远置单元的重要运行状态数据,丢失会造成较大危害甚至导致任务的失败。进一步地,总线控制器可为不同的远置单元分别开辟缓存空间来存储后者的备份数据,并周期性地更新备份数据。进一步地,总线控制器的测试命令及处理要求由通信双方按照协议事先约定,出于通信开销或者可靠性的考虑,可根据实际情况进行简化或者附加处理。其中,总线控制器进行测试的周期可以根据实际应用环境来确定。一般的原则是总线通信规模较大并且交互复杂,选择较短的测试周期。如果总线上通信规模较小并且交互简单,则选择较长的测试周期本专利技术的一种基于总线控制器的双机故障检测及恢复方法能够自动检测出总线远置单元故障,并在故障情况下与其备份单机建立通信连接,后者通过备份/恢复机制恢复故障前最新的任务状态和数据,尽可能减小故障损失,提高了整星的可靠性与安全性。附图说明图1为本专利技术实施例的中总控制器、远置单元的布置示意图。图2为本专利技术实施例的工作流程图。具体实施方式下面结合附图给出本专利技术较佳实施例,以详细说明本专利技术的技术方案。如图1至图2所示,本专利技术的基于总线控制器的双机故障检测及恢复方法包括下列步骤:S1、总线上各远置单元周期性地向总线控制器发送数据备份请求;S2、总线控制器获取远置单元的备份数据并存储在本地;S3、总线控制器周期性地发送测试命令到各远置单元,测试其是否处于正常工作状态;S4、各远置单元接收到测试命令后按照相应要求进行处理,并将测试结果存放在总线缓存区中;S5、总线控制器获取测试结果;S6、总线控制器判断各远置单元测试结果的正确性;如果不正确,则相应远置单元的通信错误计数器加1;否则将计数器清零;S7、总线控制器判断各远置单元的通信错误计数器是否大于阈值N;如果大于N,则进入步骤S8;否则进入步骤S3;S8、总线控制器自动建立与该远置单元备机间的通信连接,并将对应该远置单元的通信错误计数器清零;S9、步骤S8中的备机向总线控制器发送数据恢复请求;S10、总线控制器将步骤S2中存储的备份数据返回给请求方以恢复后者的任务现场及数据。所述总线一种集中式的时分串行总线,典型的是1553B总线,其主要特点是分布处理、集中控制和实时响应。总线控制器是总线上唯一可执行建立和启动数据传输任务的终端。远置单元是在总线控制器的控制下获取数据或者发送数据。远置单元为连接在总线上的各系统单机(含主机和备机)。对于采用冷备的单机,主备机可以采用同一个远置单元地址;对于采用热备的单机,主备机需要采用不同的远置单元地址。远置单元地址为各远置单元在总线上的标识,用于总线控制器识别不同的对象。远置单元的数据备份周期根据备份数据的更新频率、重要程度而定,不同的远置单元可采用不同的备份周期。备份数据为远置单元的重要运行状态数据,丢失会造成较大危害甚至导致任务的失败。总线控制器可为不同的远置单元分别开辟缓存空间来存储后者的备份数据,并周期性地更新备份数据。总线控制器进行测试的周期可以根据实际应用环境来确定。一般的原则是总线通信规模较大并且交互复杂,选择较短的测试周期。如果总线上通信规模较小并且交互简单,则选择较长的测试周期。总线控制器的测试命令及处理要求由通信双方按照协议事先约定,出于通信开销或者可靠性的考虑,可根据实际情况进行简化或者附加处理。在具体实施例中,本实施例中星载数据管理系统作为总线控制器,通过1553B总线与卫星上各分系统单机连接。实施例中星载数据管理系统虽然采用双机热备,但由于总线控制器的处理机制较为特殊,本专利技术不详本文档来自技高网...

【技术保护点】
1.一种基于总线控制器的双机故障检测及恢复方法,其特征在于,包括如下步骤:S1、总线上各远置单元周期性地向总线控制器发送数据备份请求;S2、总线控制器获取远置单元的备份数据并存储在本地;S3、总线控制器周期性地发送测试命令到各远置单元,测试其是否处于正常工作状态;S4、各远置单元接收到测试命令后按照相应要求进行处理,并将测试结果存放在总线缓存区中;S5、总线控制器获取测试结果;S6、总线控制器判断各远置单元测试结果的正确性;如果不正确,则相应远置单元的通信错误计数器加1;否则将计数器清零;S7、总线控制器判断各远置单元的通信错误计数器是否大于阈值N;如果大于N,则进入步骤S8;否则进入步骤S3;S8、总线控制器自动建立与该远置单元备机间的通信连接,并将对应该远置单元的通信错误计数器清零;S9、步骤S8中的备机向总线控制器发送数据恢复请求;S10、总线控制器将步骤S2中存储的备份数据返回给请求方以恢复后者的任务现场及数据。

【技术特征摘要】
1.一种基于总线控制器的双机故障检测及恢复方法,其特征在于,包括如下步骤:S1、总线上各远置单元周期性地向总线控制器发送数据备份请求;S2、总线控制器获取远置单元的备份数据并存储在本地;S3、总线控制器周期性地发送测试命令到各远置单元,测试其是否处于正常工作状态;S4、各远置单元接收到测试命令后按照相应要求进行处理,并将测试结果存放在总线缓存区中;S5、总线控制器获取测试结果;S6、总线控制器判断各远置单元测试结果的正确性;如果不正确,则相应远置单元的通信错误计数器加1;否则将计数器清零;S7、总线控制器判断各远置单元的通信错误计数器是否大于阈值N;如果大于N,则进入步骤S8;否则进入步骤S3;S8、总线控制器自动建立与该远置单元备机间的通信连接,并将对应该远置单元的通信错误计数器清零;S9、步骤S8中的备机向总线控制器发送数据恢复请求;S10、总线控制器将步骤S2中存储的备份数据返回给请求方以恢复后者的任务现场及数据。2.如权利要求1所述的一种基于总线控制器的双机故障检测及恢复方法,其特征在于,所述总线采用集中式的时分串行总线;总线控制器是总线上唯一可执行建立和启动数据传输任务的终端;远置单元在总线控制器的控制下获取数据或者发送数据。3.如权利要求1...

【专利技术属性】
技术研发人员:郭艳丽张大伟陈骏林
申请(专利权)人:上海卫星工程研究所
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1