基于事件控制符的网络系统多机热备份方法及系统技术方案

技术编号:37792800 阅读:14 留言:0更新日期:2023-06-09 09:22
本发明专利技术属于网络数据处理及数字信息的传输技术领域,尤其涉及基于事件控制符的网络系统多机热备份方法及系统,其包括正常工作模式、异常工作模式,本发明专利技术解决现有技术存在缺少低成本且可靠的多备机的热备份机制,从而导致网络系统的容错能力差且复杂度高,进而影响数据业务交互的问题,具有用较低成本实现可靠的多备机的热备份机制,大幅提高RapidIO网络系统的容错能力,并且不会增加系统复杂度和影响数据业务交互的技术效果。响数据业务交互的技术效果。响数据业务交互的技术效果。

【技术实现步骤摘要】
基于事件控制符的网络系统多机热备份方法及系统


[0001]本专利技术属于网络数据处理,以及数字信息的传输
,尤其涉及基于事件控制符的网络系统多机热备份方法及系统。

技术介绍

[0002]RapidIO是一种高性能、低引脚数、基于数据包交换的互连体系结构;对于高性能嵌入式通信系统来说,RapidIO协议具有高带宽、低时延、灵活性高、可靠性强等特点,是嵌入式互联技术中的最优选。通常情况下,RapidIO网络中包含端点器件(PE,Processing Element)和交换器件(SWITCH),前者负责生成、发出和处理数据包,而后者负责接收和转发。在端点器件中一般会有一个器件作为主机节点,其作用是完成RapidIO网络进行初始枚举、路由部署和故障管理等网络维护工作;从可靠性角度出发,当主机本身或者其本身与RapidIO网络的连接出现故障时,需要有热备份机制保障RapidIO网络能够保持正常运行。当前主流的热备份系统是双机热备份系统,其中包含一个主机和一个备机,当主机出现以上故障时,备机能够及时的接替主机的位置,保障RapidIO网络的业务和管理不会失控。常见的热备份系统实现方式有很多,包括依靠第三方仲裁机构、通过外接硬件或RapidIO报文实现主备机之间的心跳通信,这些方法都有比较明显的缺陷:比如,借助第三方仲裁机构的方案是完全建立在第三方仲裁机构可靠的基础上,没有进一步提高系统的健壮性;通过外接硬件实现主备机之间的心跳通信机制,除了硬件成本增加之外,主备机之间必须要有硬件通路,极大的限制了整个网络拓扑的形态;通过RapidIO报文的方式势必会挤占网络中的通道资源,路由配置容易产生冲突,数据包的转发优先级也难以保证;考虑到RapidIO网络特点和实际应用场景,双机热备系统在RapidIO网络中仍无法提供足够可靠的保障,尤其是主机参与业务交互、频繁动态入网退网或某些极端情况下主备机接连故障等情况。此时,可以通过增加备机数量来解决,即采用一个主机搭配多个备机。不难发现若采用上述技术方案来实现,势必会带来更高的成本开销和系统复杂度,包括需要大量的外接硬件,导致RapidIO网络拓扑的形态更加僵化;或者会占用更多的通道资源,路由配置变得更加复杂。
[0003]现有技术存在缺少低成本且可靠的多备机的热备份机制,从而导致网络系统的容错能力差且复杂度高,进而影响数据业务交互的问题。

技术实现思路

[0004]本专利技术提供基于事件控制符的网络系统多机热备份方法及系统,以解决上述
技术介绍
中存在的现有技术存在缺少低成本且可靠的多备机的热备份机制,从而导致网络系统的容错能力差且复杂度高,进而影响数据业务交互的问题。
[0005]本专利技术所解决的技术问题采用以下技术方案来实现:基于事件控制符的网络系统多机热备份方法,包括:
基于RapidIO网络数据包交换的互连体系结构的一主机多备机的多机网络:正常工作模式:若网络枚举结束,则当前主机选择并唤醒一备机形成第一工作备机,并通过多播事件控制符建立心跳通信;异常工作模式:若通信中的主机故障,则第一工作备机接管当前主机形成工作主机,所述工作主机选择并唤醒的另一备机形成第二工作备机,并通过多播事件控制符重新建立心跳通信。
[0006]进一步,所述正常工作模式还包括:在系统初始阶段,当前主机通过发起网络枚举操作,探测和发现整个多机网络的所有备机,并建立当前主机与所有备机的RapidIO通路。
[0007]进一步,所述正常工作模式还包括:根据综合确定的多机网络的拓扑结构和多机网络的每一备机的设备物理性能,选取和唤醒物理性能最适用备机,同时将最适用备机确定为第一工作备机。
[0008]进一步,所述正常工作模式还包括:若备机被唤醒,则确定当前主机与第一工作备机之间的心跳通信完整路径,按照心跳通信完整路径通过维护包逐一配置交换设备和第一工作备机,并开启第一工作备机的端口多播事件控制符发送使能,并建立当前主机与第一工作备机之间的多播事件控制符传输通路;若备机未被唤醒,则当前主机重新选择并唤醒备机。
[0009]进一步,所述正常工作模式还包括:基于控制发送周期,当前主机向第一工作备机发送多播事件控制符;若第一工作备机接收到第一个多播事件控制符,则启动第一控制发送计时,并周期性检测多播事件控制符;若第一工作备机接收到第二个多播事件控制符,则启动第二控制发送计时,并周期性检测多播事件控制符;若第一工作备机接收到第三个多播事件控制符,则启动第三控制发送计时,并周期性检测多播事件控制符;依次类推;若第一工作备机接收到第N个多播事件控制符,则启动第N控制发送计时;将第一控制发送计时、第二控制发送计时、第三控制发送计时...第N控制发送计时平均形成平均发送计时,并计为主机心跳周期,即:;所述Ta1为第一控制发送计时;所述Ta2为第二控制发送计时;所述Ta3为第一控制发送计时;所述Ta
N
为第N控制发送计时;所述N为控制发送计时次数。
[0010]进一步,所述正常工作模式还包括:
平均发送计时门限函数:;所述Tab
+
为平均发送计时门限上限;所述Tab

为平均发送计时门限下限;所述Ta为平均发送计时;所述Tg为发送计时误差,所述Tg取值根据网络传输速率确定。
[0011]进一步,所述正常工作模式还包括:心跳丢失判断函数:;进一步,所述正常工作模式还包括:基于控制发送周期,当前主机向第一工作备机发送多播事件控制符;若第一工作备机接收到第一个多播事件控制符,则启动第一故障发送时刻记录;若第一工作备机接收到第二个多播事件控制符,则启动第二控制发送时刻记录;将第一故障发送计时和第二控制发送计时形成发送间隔计时,并计为故障间隔周期。
[0012]进一步,所述正常工作模式还包括:发送间隔计时函数:QT=T2

T1;所述QT为间隔发送计时;所述T2为第二故障发送时刻记录;所述T1为第一故障发送时刻记录;主机故障门限函数:;所述TAB
+
为故障间隔周期门限上限;所述TAB

为故障间隔周期门限下限;所述TA为平均间隔计时;所述TG为故障间隔误差,所述TG取值根据网络传输速率确定;主机故障判断函数:;
同时,本专利技术提供基于事件控制符的网络系统多机热备份系统,包括实现上述多机热备份方法的多机热备份平台,所述多机热备份平台包括正常工作模块和异常工作模块;所述正常工作模块用于:若网络枚举结束,则当前主机选择并唤醒一备机形成第一工作备机,并通过多播事件控制符建立心跳通信;所述异常工作模块用于:若通信中的主机故障,则第一工作备机接管当前主机形成工作主机,所述工作主机选择并唤醒的另一备机形成第二工作备机,并通过多播事件控制符重新建立心跳通信。
[0013]有益技术效果:本方案采用基于RapidIO网络数据包交换的互连体系结构的一主机多备机的多机网络:正常工作模式:若网络枚举结束,则当前主机选择并唤醒一备机形成第一工作备机,并通过多播事件控制符建立心跳通信;异常工作模式:本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于事件控制符的网络系统多机热备份方法,其特征在于,包括:基于RapidIO网络数据包交换的互连体系结构的一主机多备机的多机网络:正常工作模式:若网络枚举结束,则当前主机选择并唤醒一备机形成第一工作备机,并通过多播事件控制符建立心跳通信;异常工作模式:若通信中的主机故障,则第一工作备机接管当前主机形成工作主机,所述工作主机选择并唤醒的另一备机形成第二工作备机,并通过多播事件控制符重新建立心跳通信。2.根据权利要求1所述多机热备份方法,其特征在于,所述正常工作模式还包括:在系统初始阶段,当前主机通过发起网络枚举操作,探测和发现整个多机网络的所有备机,并建立当前主机与所有备机的RapidIO通路。3.根据权利要求1所述多机热备份方法,其特征在于,所述正常工作模式还包括:根据综合确定的多机网络的拓扑结构和多机网络的每一备机的设备物理性能,选取和唤醒物理性能最适用备机,同时将最适用备机确定为第一工作备机。4.根据权利要求3所述多机热备份方法,其特征在于,所述正常工作模式还包括:若备机被唤醒,则确定当前主机与第一工作备机之间的心跳通信完整路径,按照心跳通信完整路径通过维护包逐一配置交换设备和第一工作备机,并开启第一工作备机的端口多播事件控制符发送使能,并建立当前主机与第一工作备机之间的多播事件控制符传输通路;若备机未被唤醒,则当前主机重新选择并唤醒备机。5.根据权利要求4所述多机热备份方法,其特征在于,所述正常工作模式还包括:基于控制发送周期,当前主机向第一工作备机发送多播事件控制符;若第一工作备机接收到第一个多播事件控制符,则启动第一控制发送计时,并周期性检测多播事件控制符;若第一工作备机接收到第二个多播事件控制符,则启动第二控制发送计时,并周期性检测多播事件控制符;若第一工作备机接收到第三个多播事件控制符,则启动第三控制发送计时,并周期性检测多播事件控制符;依次类推;若第一工作备机接收到第N个多播事件控制符,则启动第N控制发送计时;将第一控制发送计时、第二控制发送计时、第三控制发送计时...第N控制发送计时平均形成平均发送计时,并计为主机心跳周期,即:;所述Ta1为第一控制发送计时;所述Ta2为第二控制发送计时;所...

【专利技术属性】
技术研发人员:朱珂陈培岩张明伟常超张波肖峰闻亮毛英杰徐涛高庆
申请(专利权)人:井芯微电子技术天津有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1