System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种内存故障的处置方法、系统、存储介质和终端技术方案_技高网

一种内存故障的处置方法、系统、存储介质和终端技术方案

技术编号:41253142 阅读:3 留言:0更新日期:2024-05-11 09:14
本申请提供一种不可纠正内存故障的处置方法,包括:当检测到目标主机发生不可纠正内存故障时,确定对应的硬件故障日志;解析硬件故障日志中不可纠正内存故障的报错内容,得到内存故障物理地址;根据所述内存故障物理地址确定发生所述不可纠正内存故障的内存条对应的插槽位置;生成包含插槽位置的不可纠正内存故障告警信息;告警信息用于处置不可纠正内存故障。本申请能够及时定位故障内存条的插槽位置,提高发生不可纠正内存故障时的故障处置效率,降低由于内存条故障可能造成的系统宕机风险,保证主机和系统稳定运行。本申请还提供一种不可纠正内存故障的处置系统、计算机可读存储介质和终端,具有上述有益效果。

【技术实现步骤摘要】

本申请涉及网络安全领域,特别涉及一种内存故障的处置方法、系统、存储介质和终端


技术介绍

1、当前,针对于不可纠正错误内存故障(也称为ue内存故障,ue,英文全称为uncorrected error)的处理,操作系统面对bios固件层的内存隔离恢复策略无感知,导致操作系统和bios层无法密切配合甚至产生冲突,错过早期最佳的内存故障隔离预防期,使得内存故障导致的操作系统宕机和上层应用异常停止运行的概率较高。同时不可纠正错误内存故障排查不方便,无法快速定位ue内存条位置,难以及时消除系统宕机风险。

2、因此,如何有效实现不可纠正错误内存故障的及时处置是本领域技术人员亟需解决的技术问题。


技术实现思路

1、本申请的目的是提供一种不可纠正内存故障的处置方法、不可纠正内存故障的处置系统、存储介质和终端,能够快速定位故障内存条位置,及时消除内存故障。

2、为解决上述技术问题,本申请提供一种不可纠正内存故障的处置方法,具体技术方案如下:

3、当检测到目标主机发生所述不可纠正内存故障时,确定对应的硬件故障日志;

4、解析所述硬件故障日志中所述不可纠正内存故障的报错内容,得到内存故障物理地址;

5、向edac调试接口写入所述内存故障物理地址,映射得到存在所述不可纠正内存故障的内存条对应的插槽位置;

6、生成包含所述插槽位置的告警信息;所述告警信息用于处置所述不可纠正内存故障。

7、可选的,还包括:

8、若所述内存故障为未达到预设响应阈值的可纠正内存故障,对所述内存故障执行静默隔离恢复。

9、可选的,当检测到目标主机发生不可纠正内存故障时,还包括:

10、对所述目标主机进行内存故障分析,得到至少包含内存故障数量的分析结果;

11、若所述内存故障数量大于预设阈值,根据所述分析结果拒绝启动所述目标主机上的新服务,并将所述目标主机上的当前服务迁移至正常主机。

12、可选的,还包括:

13、获取目标主机的设备型号;

14、若所述设备型号的目标主机支持配置信息导出,导出所述目标主机的固件配置信息,根据所述固件配置信息优化固件内存故障处置选项;

15、若所述设备型号的目标主机未支持配置信息导出,解析所述目标主机的寄存器值,根据所述寄存器值优化所述固件内存故障处置选项;

16、其中,所述固件内存故障处置选项包括服务器是否支持ue恢复、服务器是否屏蔽可纠正内存故障信号和服务器是否开启故障扫描中的至少一项。

17、可选的,确定对应的硬件故障日志之后,还包括:

18、若所述目标主机存在宕机记录或重启记录,获取基板管理控制器中的系统事件日志;

19、解析所述系统事件日志,若存在处理器内部错误故障,将所述目标主机标记为故障状态,并调整所述目标主机的应用层服务部署策略,生成更换内存条的提示信息。

20、可选的,根据所述内存故障物理地址确定所述不可纠正内存故障的内存条对应的插槽位置包括:

21、向edac调试接口写入所述内存故障物理地址,映射得到存在所述不可纠正内存故障的内存条对应的插槽位置。

22、本申请还提供一种不可纠正内存故障的处置系统,包括:

23、日志确定模块,用于检测到目标主机发生所述不可纠正内存故障时,确定对应的硬件故障日志;

24、地址解析模块,用于解析所述硬件故障日志中所述不可纠正内存故障的报错内容,得到内存故障物理地址;

25、插槽确定模块,用于向edac调试接口写入所述内存故障物理地址,映射得到存在所述不可纠正内存故障的内存条对应的插槽位置;

26、告警模块,用于生成包含所述插槽位置的告警信息;所述告警信息用于处置所述不可纠正内存故障。

27、可选的,还包括:

28、故障类型检测模块,用于在检测到内存故障时,确定所述内存故障的故障类型;

29、主机标记模块,用于若所述内存故障为达到预设响应阈值的可纠正内存故障,或为所述不可纠正内存故障,标记存在所述内存故障的目标主机为非健康状态;

30、应用层策略调整模块,用于调整处于所述非健康状态下的所述目标主机的应用层服务部署策略。

31、本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法的步骤。

32、本申请还提供一种终端,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如上所述的方法的步骤。

33、本申请提供一种不可纠正内存故障的处置方法,包括:当检测到目标主机发生不可纠正内存故障时,确定对应的硬件故障日志;解析所述硬件故障日志中所述不可纠正内存故障的报错内容,得到内存故障物理地址;根据所述内存故障物理地址确定发生所述不可纠正内存故障的内存条对应的插槽位置;生成包含所述插槽位置的告警信息;所述告警信息用于处置所述不可纠正内存故障。

34、本申请在发生不可纠正内存故障时,从硬件故障日志中解析报错内容以得到内存故障物理地址,由于通常不可纠正内存故障不会在内核日志中记录错误检测与纠正信息,无法直接确定出现不可纠正内存故障具体是哪一个内存条,为此本申请解析报错内容得到的内存故障物理地址,从而根据内存故障物理地址确定内存条对应的插槽位置,以便直接根据插槽位置对出现故障的内存条进行处置,及时定位故障内存条的插槽位置,提高发生不可纠正内存故障时的故障处置效率,降低由于内存条故障可能造成的系统宕机风险,保证主机和系统稳定运行。

35、本申请还提供一种不可纠正内存故障的处置系统、计算机可读存储介质和终端,具有上述有益效果,此处不再赘述。

本文档来自技高网...

【技术保护点】

1.一种内存故障的处置方法,其特征在于,包括:

2.根据权利要求1所述的处置方法,其特征在于,还包括:

3.根据权利要求2所述的处置方法,其特征在于,当检测到目标主机发生不可纠正内存故障时,还包括:

4.根据权利要求1所述的处置方法,其特征在于,还包括:

5.根据权利要求2所述的处置方法,其特征在于,确定对应的硬件故障日志之后,还包括:

6.根据权利要求1所述的处置方法,其特征在于,根据所述内存故障物理地址确定所述不可纠正内存故障的内存条对应的插槽位置包括:

7.一种不可纠正内存故障的处置系统,其特征在于,包括:

8.根据权利要求7所述的处置系统,其特征在于,还包括:

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6任一项所述的不可纠正内存故障的处置方法的步骤。

10.一种终端,其特征在于,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如权利要求1-6任一项所述的不可纠正内存故障的处置方法的步骤。

...

【技术特征摘要】

1.一种内存故障的处置方法,其特征在于,包括:

2.根据权利要求1所述的处置方法,其特征在于,还包括:

3.根据权利要求2所述的处置方法,其特征在于,当检测到目标主机发生不可纠正内存故障时,还包括:

4.根据权利要求1所述的处置方法,其特征在于,还包括:

5.根据权利要求2所述的处置方法,其特征在于,确定对应的硬件故障日志之后,还包括:

6.根据权利要求1所述的处置方法,其特征在于,根据所述内存故障物理地址确定所述不可纠正内存故障的内存条对应的插槽...

【专利技术属性】
技术研发人员:高仲于李诗逸刁家庆丁辉
申请(专利权)人:深信服科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1