System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种带内外故障注入与验证设备和方法技术_技高网

一种带内外故障注入与验证设备和方法技术

技术编号:40512134 阅读:11 留言:0更新日期:2024-03-01 13:28
本发明专利技术公开一种带内外故障注入与验证设备和方法,属于嵌入式计算机技术领域。该设备由故障管理部件、带外管理部件和带内管理部件组成,所述故障管理部件,用于通过状态监控总线控制带外管理部件和带内管理部件实施故障注入和验证;所述带外管理部件,用于进行异构计算模块硬件资源的状态监控与故障注入工作;所述带内管理部件,用于进行异构计算模块软件资源的状态监控与故障注入工作。本发明专利技术采用基于图表可视化、交互式的设计方案,通过阈值调整、负载加压以及掉电模拟等软硬件故障注入方式,实现对异构高可靠软硬件资源的带内外故障注入,具有操作简单、实用性强的优点,为验证异构高可靠系统可靠性和可用性奠定基础。

【技术实现步骤摘要】

本专利技术属于嵌入式计算机,更具体地,涉及一种带内外故障注入与验证设备和方法


技术介绍

1、异构高可靠系统是支撑嵌入式计算实现高可靠、高性能运行的基础设施平台,通常由资源异构、结构冗余的若干计算、交换和监控模块经动态可配置的高速总线互连而成,具备运算能效性高、资源扩展性好等特点。

2、异构高可靠系统是能够根据任务的性能需求和关键等级,自适应地分配和优化计算资源,以实现任务高效运行,且常被应用于核反应堆控制、水下生命保障、声光电信号处理、信息加解密等重要场合,若发生故障会造成系统损毁、人员伤亡、财产损失和环境严重破坏等问题。由此可见,异构高可靠系统亟需设计一种故障注入及验证工具,评估系统的可靠性与可用性。


技术实现思路

1、针对现有技术的缺陷,本专利技术的目的在于提供一种带内外故障注入与验证设备和方法,旨在解决填补对异构高可靠系统软硬件资源的带内外故障注入的空白。

2、为实现上述目的,第一方面,本专利技术提供了一种带内外故障注入与验证设备,包括:一个故障管理部件、多个带外管理部件和多个带内管理部件,所述带外管理部件和带内管理部件成对部署于异构高可靠系统中的每个异构计算模块内;

3、所述故障管理部件,用于通过状态监控总线控制带外管理部件和带内管理部件实施故障注入和验证;

4、所述带外管理部件,用于进行异构计算模块硬件资源的状态监控与故障注入工作;

5、所述带内管理部件,用于进行异构计算模块软件资源的状态监控与故障注入工作。</p>

6、优选地,所述故障管理部件包括:故障注入面板、硬件资源监控模块和软件资源监控模块;

7、所述故障注入面板上设有多个故障注入按钮;所述故障注入按钮的按下操作与带内外故障注入索引表中内容绑定,用于控制带内/外管理部件进行带内外故障注入;

8、所述硬件资源监控,用于获取带外管理部件监控到的cpu、fpga、dsp硬件资源的工作状态信息;

9、所述软件资源监控,用于获取带内管理部件监控到的虚拟机和容器资源的工作状态信息。

10、优选地,所述故障管理部件上部署grafana服务,用于显示故障注入按钮、硬件资源的工作状态信息和软件资源的工作状态信息;部署prometheus服务,用于获取带外管理部件和带内管理部件的状态监控信息。

11、优选地,故障管理部件本地的闪存中存放有带内外故障注入接口索引表和带内外故障模拟方式表;

12、所述带内外故障注入接口索引表,表项内容包括:存放索引号、故障节点、故障信息、故障注入接口和故障注入方式;

13、所述带内外故障模拟方式表,表项内容包括:故障类型和故障模拟方式,供图形化交互式方式进行故障注入。

14、优选地,所述带外管理部件上部署ipmi_exporter服务,用于采集带外管理部件监控到的cpu、fpga、dsp硬件资源的工作状态信息;所述带内管理部件部署node-exporter服务,用于收集宿主机的系统指标数据,部署cadvisor服务,用于收集、聚合、处理和导出有关正在运行的容器的信息。

15、为实现上述目的,第二方面,本专利技术提供了一种带内外故障注入方法,该方法应用于如第一方面所述的带内外故障注入与验证设备中的故障管理部件,该方法包括:

16、s301.启动grafana界面程序,显示带内外故障信息和故障注入接口;

17、s302.获取带内外故障注入接口索引表;

18、s303.初始化故障注入程序面板;

19、s304.向server端发送http socket请求,所述server端为待注入故障的带外管理部件或者带内管理部件;

20、s305.与server端建立web socket链接;

21、s306.接收对带内外故障模拟方式的选择,进行故障注入;

22、s307.在grafana界面程序观测故障注入现象是否与预期符合。

23、为实现上述目的,第三方面,本专利技术提供了一种带内外故障注入方法,该方法应用于如第一方面所述的带内外故障注入与验证设备中的带外管理部件或者带内管理部件,该方法包括:

24、s401.启动故障注入接口服务端程序;

25、s402.接收client端发送的http socket请求,所述client端为故障管理部件;

26、s403.与client端建立web socket链接;

27、s404.接收故障注入请求;

28、s405.执行故障注入操作。

29、为实现上述目的,第四方面,本专利技术提供了一种带内外故障注入验证方法,该方法应用于如第一方面所述的带内外故障注入与验证设备中的故障管理部件,该方法包括:

30、s501.完成上电自检工作;

31、s502.向带外管理部件和带内管理部件发送上电和时间同步命令;

32、s503.开启自身tsdb数据库,记录时序数据;

33、s504.开启prometheus服务和grafana服务;

34、s505.通过prometheus服务获取带外管理部件和带内管理部件的状态监控信息;

35、s506.通过时序数据方式存储监控信息,并通过grafana进行数据展示;

36、s507.通过web socket的方式,在grafana界面上进行带内外故障注入;

37、s508.在grafana界面上查看故障注入结果是否与预期符合。

38、为实现上述目的,第五方面,本专利技术提供了一种带内外故障注入验证方法,该方法应用于如第一方面所述的带内外故障注入与验证设备中的带外管理部件,该方法包括:

39、s601.上电自检后与接收故障管理部件命令进行时间同步;

40、s602.开启ipmi_exporter服务;

41、s603.开启带外故障注入接口,等待故障管理部件进行故障注入;

42、s604.获取异构计算模块传感器信息,监控其带外工作状态;

43、s605.存储传感器数据信息。

44、为实现上述目的,第六方面,本专利技术提供了一种带内外故障注入验证方法,该方法应用于如第一方面所述的带内外故障注入与验证设备中的带内管理部件,该方法包括:

45、s701.上电自检后与接收故障管理部件命令进行时间同步;

46、s702.开启node-exporter服务;

47、s703.开启cadvisor服务;

48、s704.开启带内故障注入接口,等待故障管理部件进行故障注入;

49、s705.获取异构计算模块传感器信息,监控其带内工作状态。

50、s706.存储传感器数据信息。

51、总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,具本文档来自技高网...

【技术保护点】

1.一种带内外故障注入与验证设备,其特征在于,包括:一个故障管理部件、多个带外管理部件和多个带内管理部件,所述带外管理部件和带内管理部件成对部署于异构高可靠系统中的每个异构计算模块内;

2.如权利要求1所述的设备,其特征在于,所述故障管理部件包括:故障注入面板、硬件资源监控模块和软件资源监控模块;

3.如权利要求2所述的设备,其特征在于,所述故障管理部件上部署Grafana服务,用于显示故障注入按钮、硬件资源的工作状态信息和软件资源的工作状态信息;部署Prometheus服务,用于获取带外管理部件和带内管理部件的状态监控信息。

4.如权利要求2或3所述的设备,其特征在于,故障管理部件本地的闪存中存放有带内外故障注入接口索引表和带内外故障模拟方式表;

5.如权利要求1所述的设备,其特征在于,所述带外管理部件上部署ipmi_exporter服务,用于采集带外管理部件监控到的CPU、FPGA、DSP硬件资源的工作状态信息;所述带内管理部件部署Node-Exporter服务,用于收集宿主机的系统指标数据,部署cAdvisor服务,用于收集、聚合、处理和导出有关正在运行的容器的信息。

6.一种带内外故障注入方法,其特征在于,该方法应用于如权利要求1至5任一项所述的带内外故障注入与验证设备中的故障管理部件,该方法包括:

7.一种带内外故障注入方法,其特征在于,该方法应用于如权利要求1至5任一项所述的带内外故障注入与验证设备中的带外管理部件或者带内管理部件,该方法包括:

8.一种带内外故障注入验证方法,其特征在于,该方法应用于如权利要求1至5任一项所述的带内外故障注入与验证设备中的故障管理部件,该方法包括:

9.一种带内外故障注入验证方法,其特征在于,该方法应用于如权利要求1至5任一项所述的带内外故障注入与验证设备中的带外管理部件,该方法包括:

10.一种带内外故障注入验证方法,其特征在于,该方法应用于如权利要求1至5任一项所述的带内外故障注入与验证设备中的带内管理部件,该方法包括:

...

【技术特征摘要】

1.一种带内外故障注入与验证设备,其特征在于,包括:一个故障管理部件、多个带外管理部件和多个带内管理部件,所述带外管理部件和带内管理部件成对部署于异构高可靠系统中的每个异构计算模块内;

2.如权利要求1所述的设备,其特征在于,所述故障管理部件包括:故障注入面板、硬件资源监控模块和软件资源监控模块;

3.如权利要求2所述的设备,其特征在于,所述故障管理部件上部署grafana服务,用于显示故障注入按钮、硬件资源的工作状态信息和软件资源的工作状态信息;部署prometheus服务,用于获取带外管理部件和带内管理部件的状态监控信息。

4.如权利要求2或3所述的设备,其特征在于,故障管理部件本地的闪存中存放有带内外故障注入接口索引表和带内外故障模拟方式表;

5.如权利要求1所述的设备,其特征在于,所述带外管理部件上部署ipmi_exporter服务,用于采集带外管理部件监控到的cpu、fpga、dsp硬件资源的工作状态信息;所述带内管理部件部署node...

【专利技术属性】
技术研发人员:龚念杨丹王跃午胡哲琨
申请(专利权)人:中国船舶集团有限公司第七〇九研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1