一种内存可靠性评估方法、装置及存储介质制造方法及图纸

技术编号:36187266 阅读:7 留言:0更新日期:2022-12-31 20:54
本申请公开了一种内存可靠性评估方法、装置及存储介质,涉及存储领域,有助于基于全面的内存故障信息准确的评估内存可靠性。方法包括:获取计算设备的目标运行日志包;对目标运行日志包进行解析,得到参数组数据;其中,参数组数据包括计算设备的内存故障参数;将参数组数据输入内存故障预测模型,得到计算设备的内存故障预测结果;其中,内存故障预测结果用于表征计算设备的内存故障的严重程度。表征计算设备的内存故障的严重程度。表征计算设备的内存故障的严重程度。

【技术实现步骤摘要】
一种内存可靠性评估方法、装置及存储介质


[0001]本申请涉及存储领域,尤其涉及一种内存可靠性评估方法、装置及存储介质。

技术介绍

[0002]计算设备中的动态随机存取存储器(dynamic random access memory,DRAM)是常用的随机存取存储器,随着计算技术的发展,DRAM的容量越来越大,同时故障率也随之升高。
[0003]相关技术中,对于计算设备的内存故障,可以由集中运维管理平台通过标准的故障上报接口(例如redfish接口)定期向被管理的计算设备收集内存故障信息,基于内存故障信息完成对计算设备内存的可靠性评估,并呈现告警。然而,有些计算设备没有定义标准的故障上报接口,无法获取其内存故障信息;或者因标准故障上报接口协议限制,上述集中运维管理平台通过标准接口收集的故障信息不全面,导致集中运维管理平台无法基于全面的故障信息对内存可靠性进行准确的评估。

技术实现思路

[0004]本申请提供了一种内存可靠性评估方法、装置及存储介质,有助于基于全面的内存故障信息准确的评估内存可靠性。
[0005]为实现上述技术目的,本申请采用如下技术方案:
[0006]第一方面,本申请提供了一种内存可靠性评估方法,该方法应用于集中运维管理平台,方法包括:获取计算设备的目标运行日志包;对目标运行日志包进行解析,得到参数组数据;其中,参数组数据包括计算设备的内存故障参数;将参数组数据输入内存故障预测模型,得到计算设备的内存故障预测结果;其中,内存故障预测结果用于表征计算设备的内存故障的严重程度。
[0007]可以理解的是,采集计算设备的目标运行日志包,若目标运行日志是计算设备的全部运行日志包,则其中记录了计算设备的完整运行过程,其中包含计算设备的所有内存故障信息,因此获取目标运行日志包能够获得所有的内存故障信息,可以有效避免因标准接口协议限制导致收集的故障信息不全面的问题,从而可以基于全面的内存故障信息准确的评估内存可靠性,便于在后续维护设备和内存时,可以参考准确的技术评估值。
[0008]在一种可能的实现方式中,获取计算设备的目标运行日志包,包括:接收日志采集工具导入的计算设备的目标运行日志包。
[0009]可以理解的是,集中运维管理平台只需要接收日志采集工具发送的运行日志包,不需要占用集中运维管理平台的运算资源,减少对平台其他运算的影响。
[0010]在另一种可能的实现方式中,上述获取计算设备的目标运行日志包后,上述方法还包括:接收第一指令,通过第一指令对应的日志包解析流程对目标运行日志包进行解析,得到参数组数据;其中,第一指令用于指示目标运行日志包所属类别;类别包括带外运行日志包类别和带内运行日志包类别。
[0011]可以理解的是,通过接收第一指令来区分目标运行日志包的类别,可以快速对目标运行日志包的类别进行区分,节约集中运维管理平台的计算资源。
[0012]在另一种可能的实现方式中,上述获取计算设备的目标运行日志包,包括:向计算设备发送指示信息,指示信息用于指示获取目标运行日志包;接收计算设备针对指示信息返回的目标运行日志包。
[0013]可以理解的是,上述集中运维管理平台可以设置定时采集目标运行日志包的程序,根据设置自动获取目标运行日志包,该方法可以减少人工参与,提高获取目标运行日志包的效率,减少人力资源。
[0014]在另一种可能的实现方式中,上述对目标运行日志包进行解析,得到参数组数据,包括:当目标运行日志包属于带外运行日志包类别时,通过带外日志解析流程对目标运行日志包进行解析,得到参数组数据;当目标运行日志包属于带内运行日志包类别时,通过带内日志解析流程对目标运行日志包进行解析,得到参数组数据。
[0015]可以理解的是,对不同的目标运行日志包采取不同的解析方法,可以避免因格式不同而造成参数组的参数解析不出来的问题,或者不会因带内或带外日志包含的参数组的区别,而造成解析出来的参数组的具体内容不全面的问题,因此,该方法可以提高解析效率,同时能全面解析出参数组包含的参数。
[0016]在另一种可能的实现方式中,上述方法还包括:当计算设备的内存故障严重程度满足预设条件时,输出告警信息。
[0017]可以理解的是,输出告警信息的方法包括但不限于如通过大屏显示,或通过扬声器播放音频的方法。输出告警信息可以有效提示工作人员哪些计算设备的内存故障较为严重,从而及时采取解决措施。
[0018]在另一种可能的实现方式中,上述方法还包括:以内存故障严重程度由高到低的顺序输出多个计算设备的内存故障预测结果;其中,多个计算设备的内存故障预测结果是基于多个计算设备的目标运行日志包得到。
[0019]可以理解的是,将内存故障预测结果以内存故障严重程度由高到低的顺序通过显示屏输出,可以让运维人员直观的看到各个计算设备的内存的好坏,同时可以有先看到故障严重程度较高的计算设备,方便及时采取相关措施。另外,在后续采购内存时,避免内存可靠性差的内存,优先选择可靠性好的内存。
[0020]在一种可能的实现方式中,当目标运行日志包属于带外运行日志包类别时,参数组还包括计算设备的内存运行配置参数;计算设备的内存固有类别参数。
[0021]可以理解的是,带外运行日志包中包含上述参数组,而带内运行日志包中不包含上述与内存出厂参数及配置参数相关内容,因此只在运行日志包属于带外运行日志包类别时,选择解析上述参数。在后续对计算设备进行评估时,参考上述内容,可以更加全面的对计算设备的内存进行评估,其结果更可靠。
[0022]在另一种可能的实现方式中,参数组还包括:计算设备的内存运行状态参数。
[0023]可以理解的是,运行日志中还可以解析出上述参数内容,在后续对计算设备进行评估时,参考上述内容,可以更加全面的对计算设备的内存进行评估,其结果更可靠。
[0024]在另一种可能的实现方式中,内存故障预测模型使用的是机器学习算法。
[0025]可以理解的是,内存故障预测模型可以使用多种内存评估算法,但是机器学习算
法可以针对内存的各项参数,综合对内存可靠性进行评估,结果准确。
[0026]第二方面,本申请提供一种内存可靠性评估装置。该内存可靠性评估装置包括应用于第一方面或第一方面中任一种可能的设计方式的方法的各个模块。
[0027]第三方面,本申请提供一种内存可靠性评估装置,包括存储器和处理器。存储器和处理器耦合;存储器用于存储计算机程序代码,计算机程序代码包括计算机指令。当处理器执行该计算机指令时,使得该内存可靠性评估装置执行如第一方面及其任一种可能的实现方式的内存可靠性评估方法。
[0028]第四方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质包括计算机指令。其中,当计算机指令在内存可靠性评估装置上运行时,使得该内存可靠性评估装置执行如第一方面及其任一种可能的实现方式的内存可靠性评估方法。
[0029]第五方面,本申请提供一种计算机程序产品,该计算机程序产本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内存可靠性评估方法,其特征在于,所述方法包括:获取计算设备的目标运行日志包;对所述目标运行日志包进行解析,得到参数组数据;其中,所述参数组数据包括所述计算设备的内存故障参数;将所述参数组数据输入内存故障预测模型,得到所述计算设备的内存故障预测结果;其中,所述内存故障预测结果用于表征所述计算设备的内存故障的严重程度。2.根据权利要求1所述的方法,其特征在于,所述获取所述计算设备的目标运行日志包,包括:接收日志采集工具导入的所述计算设备的目标运行日志包。3.根据权利要求1或2所述的方法,其特征在于,所述对所述目标运行日志包进行解析,得到参数组数据,包括:接收第一指令,通过所述第一指令对应的日志包解析流程对所述目标运行日志包进行解析,得到所述参数组数据;其中,所述第一指令用于指示所述目标运行日志包所属类别;所述类别包括带外运行日志包类别或带内运行日志包类别。4.根据权利要求1所述的方法,其特征在于,所述获取计算设备的目标运行日志包,包括:向所述计算设备发送指示信息,所述指示信息用于指示获取所述目标运行日志包;接收所述计算设备针对所述指示信息返回的所述目标运行日志包。5.根据权利要求1至4任一项所述的方法,其特征在于,所述对所述目标运行日志包进行解析,得到参数组数据,包括:当所述目标运行日志包属于带外运行日志包类别时,通过带外日志解析流程对所述目标运行日志包进行解析,得到所述参数组数据;当所述目标运行日志包属于带内运行日志包类别时,通过带内日志解析流程对所述目标运行日志包进行解析,得...

【专利技术属性】
技术研发人员:鲍全洋张光彪韦炜玮
申请(专利权)人:超聚变数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1