信息处理平台冗余系统设计技术方案

技术编号:24466395 阅读:42 留言:0更新日期:2020-06-10 18:43
本发明专利技术公开了信息处理平台冗余系统设计,设计了整个系统的多级冗余方案,包括多层复位和多级冗余功能,多级冗余包括:管理冗余、SRIO交换冗余、网络冗余和bit上报冗余,涉及单模块故障监测及恢复,系统故障监测及恢复,实现全方位冗余,提高整个系统的冗余深度,实现模块级和平台级的智能管理,将系统重构从芯片级提升到系统级,降低了模块之间的耦合度,保障系统设计的独立性,极大增强了系统的可靠性,为应用系统稳健运行提供了设计保障,有效分担系统运行的风险。

Redundant system design of information processing platform

【技术实现步骤摘要】
信息处理平台冗余系统设计
本专利技术涉及冗余系统
,具体为信息处理平台冗余系统设计。
技术介绍
以华睿2号搭建信息处理平台,系统基于华睿2号多核处理器设计,工作时多片华睿2号处理器通过高速通讯链路获取信息、处理数据、计算结果,并将结果输出给后级处理。在各种应用场景下,华睿2号信息处理平台,不允许出现因某个处理器、某个芯片、某个通讯链路等状态异常或故障而导致整个系统运行死机或瘫痪。因此,在华睿2号平台系统设计中,需采用多级冗余设计技术提高系统运行的稳定性和可靠性。华睿2号平台在标准系统架构下由多个模块组成,系统冗余包括模块冗余,数据通道冗余及管理通道冗余,具体实现途径与软硬件设计紧密相关。传统多级冗余设计技术冗余深度不足,在模块级和平台级的管理上有待加强,导致模块之间的耦合度较高,影响系统设计的独立性,导致系统的可靠性下降,为了应用系统稳健运行,本方案提出了信息处理平台冗余系统设计。
技术实现思路
本专利技术的目的在于提供一种板材放置架,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:包括多层复位和多级冗余功能;其中多层复位包括:模块级复位和插箱级复位;其中多级冗余:包括管理冗余、SRIO交换冗余、网络冗余和bit上报冗余,相关软件包括4个主要功能模块。优选的,针对管理冗余进行主备管理设计:S1:主备竞争初始化,管理模块上电后通过竞争获取管理权限;S2:Bit数据冗余上报,物理上采用双通道,数据上采用IPMB协议,收集处理模块bit的上报信息,实时处理上报;S3:处理模块单板复位,管理收集华睿模块注册信息和心跳信息,同时配合机箱的配置信息,控制华睿模块单板复位;S4:交换故障切换,备管理实时监测主管理的心跳报文,判断是否控制交换的通道切换;S5:机箱复位控制,根据机箱状态信息,控制机箱复位。优选的,针对SRIO交换冗余进行SRIO双交换设计:S1:主备交换非对称枚举算法设计;S2:主备交换的冗余路由设计;S3:交换通道切换设计,监测交换内部链路状态信息,通知主管理是否进行通道切换。优选的,针对网络冗余进行网络破环设计及冗余设计。优选的,针对bit上报冗余进行华睿模块功能设计:S1:启动注册功能,华睿模块启动后,向管理模块进行注册;S2:心跳设计,华睿模块正常工作后,向管理模块发送心跳报文;S3:链路修复,模块在工作过程中重启后,需要对数据链路进行修复,保证修复完成后,重新进行数据传输;S4:双交换切换设计,当管理下达通道切换后,完成数据通道切换。优选的,针对模块级复位设计了单板复位方案:主(备)管理读取配置文件,获取机箱内的模块信息,主(备)管理启动后,等待处理模块通过网络向它注册,处理模块启动后发送注册信息(包含槽位号、模块型号),主管理进行记录并判断启动状态(首次启动还是复位启动),主管理发送确认包给处理模块,告知处理模块是否需要进行链路修复,等待故障模块链路修复完成后,打开数据流通道,处理模块定时向机箱管理发送心跳,机箱管理监测并复位已注册但没有心跳的槽位。优选的,针对插箱级复位设计了机箱复位方案:插箱复位采用Inhibit+交换GPIO+Sysrst组合实现,Inhibit控制各个负载槽的下电,交换通过GPIO5(P3后出)控制交换接口下电,Sysrst实现交换复位,机箱管理实时判断交换接口、交换板内SRIO、负载心跳报文的状态(所有负载的心跳包全都未收到),如有任一故障,则由主交换切换至备交换,如已是备交换,则启动插箱复位。优选的,针对管理冗余设计了双管理方案:利用系统中的两个独立的I2C通道,华睿模块通过I2C通道1发送bit信息给主管理,通过I2C通道2发送bit信息给备管理;主管理和备管理同时收集bit信息,通过网络上报给系统中的主控台;但如果bit信息未更新,则不上报。优选的,针对SRIO交换冗余设计了双交换方案:双交换设计包括SRIO和网络的双交换,SRIO双交换中,华睿2号处理模块的两路对外SRIO各路由至两个交换,主备切换时应用所用SRIO数据通道亦切换,当主修复并重新加入平台时,其重新获得平台控制权,原备采用退避策略,将当前系统管理信息告知主;网络双交换主要通过对5396内部端口转发策略进行设计,将华睿端口进来的数据不再转发到其余负载端口,实现破环设计,包括主备切换后网络状态确认。与现有技术相比,本专利技术的有益效果是:从单模块冗余扩展到多重冗余,从单模块备份提升到系统备份;不仅在处理模块上实现了故障重构,同时在网络交换和SRIO交换上实现了冗余备份,在智能机箱管理上实现了bit冗余上报,提升整个系统的冗余深度和稳定性。提高系统故障恢复时间:故障恢复时间和监测及启动相关,华睿模块故障恢复时间<40秒;SRIO通道故障切换时间<3秒;网络故障切换时间<1毫秒;针对SRIO数据通道,整个切换过程中的数据波动<7%,针对网络数据通道,切换过程中无扰动影响;冗余系统降低了模块与模块的关联,提高系统重构粒度和可靠性,增强应用设计的灵活性。提高故障定位和分析能力:冗余设计中,管理会记录出问题时对应的故障模块,根据故障模块可以过滤出绑定在该模块的任务,再根据故障后记录的pc指针和堆栈等状态信息,定位出故障时的任务及函数,协助系统迅速排查出问题。附图说明图1为本专利技术单板复位流程框图;图2为本专利技术机箱复位流程图;图3为本专利技术双交换工作流程图;图4为本专利技术双管理竞争主管理流程图;图5为本专利技术主管理故障监测状态图;图6为本专利技术华睿模块注册、复位及心跳任务流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1、图2、图3、图4、图5和图6,本专利技术提供一种技术方案:包括多层复位和多级冗余功能;其中多层复位包括:模块级复位和插箱级复位;其中多级冗余:包括管理冗余、SRIO交换冗余、网络冗余和bit上报冗余,相关软件包括4个主要功能模块。针对模块级复位设的单板复位工作流程为:主(备)管理读取配置文件,获取机箱内的模块信息。主(备)管理启动后,等待华睿模块通过网络向它注册。华睿模块启动后发送注册信息(包含槽位号、模块型号),主管理进行记录并判断启动状态(首次启动还是复位启动);主管理发送确认包给华睿模块,告知华睿模块是否需要进行链路修复,关闭数据流通道;等待故障模块链路修复完成后,打开数据流通道;华睿模块定时向机箱管理发送心跳,机箱管理监测并复位已注册但没有心跳的槽位。针对插箱级复位设计的机箱复位方案采用Inhibit+交换G本文档来自技高网...

【技术保护点】
1.信息处理平台冗余系统设计,其特征在于:包括多层复位和多级冗余功能;/n其中多层复位包括:模块级复位和插箱级复位;/n其中多级冗余:包括管理冗余、SRIO交换冗余、网络冗余和bit上报冗余,相关软件包括4个主要功能模块。/n

【技术特征摘要】
1.信息处理平台冗余系统设计,其特征在于:包括多层复位和多级冗余功能;
其中多层复位包括:模块级复位和插箱级复位;
其中多级冗余:包括管理冗余、SRIO交换冗余、网络冗余和bit上报冗余,相关软件包括4个主要功能模块。


2.根据权利要求1所述的信息处理平台冗余系统设计,其特征在于,针对管理冗余进行主备管理设计:
S1:主备竞争初始化,管理模块上电后通过竞争获取管理权限;
S2:Bit数据冗余上报,物理上采用双通道,数据上采用IPMB协议,收集处理模块bit的上报信息,实时处理上报;
S3:处理模块单板复位,管理收集华睿模块注册信息和心跳信息,同时配合机箱的配置信息,控制华睿模块单板复位;
S4:交换故障切换,备管理实时监测主管理的心跳报文,判断是否控制交换的通道切换;
S5:机箱复位控制,根据机箱状态信息,控制机箱复位。


3.根据权利要求1所述的信息处理平台冗余系统设计,其特征在于,针对SRIO交换冗余进行SRIO双交换设计:
S1:主备交换非对称枚举算法设计;
S2:主备交换的冗余路由设计;
S3:交换通道切换设计,监测交换内部链路状态信息,通知主管理是否进行通道切换。


4.根据权利要求1所述的信息处理平台冗余系统设计,其特征在于,针对网络冗余进行网络破环设计及冗余设计。


5.根据权利要求1所述的信息处理平台冗余系统设计,其特征在于,针对bit上报冗余进行华睿模块功能设计:
S1:启动注册功能,华睿模块启动后,向管理模块进行注册;
S2:心跳设计,华睿模块正常工作后,向管理模块发送心跳报文;
S3:链路修复,模块在工作过程中重启后,需要对数据链路进行修复,保证修复完成后,重新进行数据传输;
S4:双交换切换设计,当管理下达通道切换后,完成数据通道切换。


6.根据权利要求1所述的信息处理平台冗余系统设计,其...

【专利技术属性】
技术研发人员:朱秉颖许光政
申请(专利权)人:江苏华创微系统有限公司中国电子科技集团公司第十四研究所
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1