可纠正内存故障的处置方法、系统、存储介质和终端技术方案

技术编号:35837014 阅读:14 留言:0更新日期:2022-12-03 14:07
本申请提供一种可纠正内存故障的处置方法,包括:检测所述可纠正内存故障,通过预设接口隔离所述可纠正内存故障对应的内存页;将所述内存页划分至软件内存故障隔离区;迁移所述内存故障隔离区中的所有数据至无故障内存区域。本申请结合硬件和软件对发生的可纠正故障进行处置,在检测可纠正内存故障时,软件层面及时对可纠正内存故障进行隔离,确保了发生的可纠正内存故障不蔓延累积形成不可纠正内存故障,降低CE内存故障对系统的负面影响。本申请还提供一种可纠正内存故障的处置系统、计算机可读存储介质和终端,具有上述有益效果。具有上述有益效果。具有上述有益效果。

【技术实现步骤摘要】
可纠正内存故障的处置方法、系统、存储介质和终端


[0001]本申请涉及电子设备领域,特别涉及可纠正内存故障的处置方法、系统、存储介质和终端。

技术介绍

[0002]当前,针对可纠正内存故障,即CE(Corrected error)内存故障,尚不存在系统解决方案,或者抑制效果到不到预期。业界主流方案主要有几种:完全屏蔽CE报错,设置静态CE阈值或者完全不考虑CE内存故障情况。其中完全屏蔽CE报错会导致系统对CE内存故障无感知,少量的CE内存故障会逐渐蔓延加重,最终发展成UE内存故障,造成宕机。且设置静态CE阈值只能靠经验值来设定,不一定符合真实场景的情况,阈值设置偏低结果更不考虑CE内存故障的情况,极易影响系统性能,也会让内存故障加重,升级成为UE内存故障。
[0003]因此,如何有效实现可纠正内存故障处置是本领域技术人员亟需解决的技术问题。

技术实现思路

[0004]本申请的目的是提供一种可纠正内存故障的处置方法、系统、存储介质和终端,能够有效处置可纠正内存故障。
[0005]为解决上述技术问题,本申请提供一种可纠正内存故障的处置方法,具体技术方案如下:
[0006]检测可纠正内存故障;
[0007]通过预设接口隔离所述可纠正内存故障对应的内存页;
[0008]将所述内存页划分至软件内存故障隔离区;
[0009]迁移所述内存故障隔离区中的所有数据至无故障内存区域。
[0010]可选的,所述方法还包括:
[0011]利用自适应双DRAM设备更正算法处置所述可纠正内存故障,或利用单设备数据校正算法处置所述可纠正内存故障。
[0012]可选的,迁移所述内存故障隔离区中的所有数据至无故障内存区域之后,还包括:
[0013]将所述内存故障隔离区的隔离记录保存至固化隔离文件。
[0014]可选的,还包括:
[0015]利用硬件内存扫描引擎扫描未使用内存区域;
[0016]若发现内存故障区域时,将所述内存故障区域划分至硬件内存隔离区。
[0017]可选的,还包括:
[0018]移除所述可纠正内存故障对应故障内存条,或,利用封装后修复对所述可纠正内存故障执行行修复。
[0019]可选的,利用封装后修复对所述可纠正内存故障执行行修复包括:
[0020]将指向所述可纠正内存故障的访问永久性重新映射至备用内存行。
[0021]可选的,利用封装后修复对所述可纠正内存故障执行行修复包括:
[0022]将指向所述可纠正内存故障的访问重新映射至预设冗余行,并在设备重启后恢复映射关系。
[0023]本申请还提供一种可纠正内存故障的处置系统,包括:
[0024]故障检测模块,用于检测可纠正内存故障;
[0025]软件处置模块,用于通过预设接口隔离所述可纠正内存故障对应的内存页;将所述内存页划分至软件内存故障隔离区;迁移所述内存故障隔离区中的所有数据至无故障内存区域。
[0026]本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法的步骤。
[0027]本申请还提供一种终端,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如上所述的方法的步骤。
[0028]本申请提供一种可纠正内存故障的处置方法,包括:检测所述可纠正内存故障,;通过预设接口隔离所述可纠正内存故障对应的内存页;将所述内存页划分至软件内存故障隔离区;迁移所述内存故障隔离区中的所有数据至无故障内存区域。
[0029]本申请结合硬件和软件对发生的可纠正故障进行处置,在检测可纠正内存故障时,在软件层面及时对可纠正内存故障进行隔离,确保了发生的可纠正内存故障不蔓延累积形成不可纠正内存故障,降低CE内存故障对系统的负面影响。
[0030]本申请还提供一种可纠正内存故障的处置系统、计算机可读存储介质和终端,具有上述有益效果,此处不再赘述。
附图说明
[0031]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0032]图1为本申请实施例所提供的一种可纠正内存故障的处置方法的流程图;
[0033]图2为本申请实施例所提供的一种可纠正内存故障的处置系统结构示意图:
[0034]图3为本申请实施例所提供的一种终端的结构示意图。
具体实施方式
[0035]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0036]当前,完全屏蔽CE报错,设置静态CE阈值或者完全不考虑CE内存故障情况。使得少量的CE内存故障会逐渐蔓延加重,最终发展成UE(Uncorrected error,不可纠正错误故障)内存故障,不可纠正错误已经超出了硬件平台的容错范围,已有容错纠正方案无法恢复此类型的数据错误,会导致系统宕机或应用停止运行,不可纠正错误通常是多比特数据错误。
[0037]为了解决上述问题,参见图1,图1为本申请实施例所提供的一种可纠正内存故障的处置方法的流程图,该方法如下:
[0038]S101:检测所述可纠正内存故障;
[0039]本步骤旨在检测可纠正内存故障,在此对于采用何种检测方式不作限定,可以直接对内存运行状态进行监控,并在监控到内存异常时确定其中的可纠正内存故障。也可以对于内存故障的日志或者运行记录进行监控,从而确定其中的可纠正内存故障。
[0040]所谓可纠正内存故障,是在硬件平台的容错范围内可以被纠正的数据错误,已有容错纠正方案可恢复此错误,系统或应用不会因此类型错误停止运行,可纠正错误通常是单bit数据错误。
[0041]S102:通过预设接口隔离所述可纠正内存故障对应的内存页;
[0042]S103:将所述内存页划分至软件内存故障隔离区;
[0043]S104:迁移所述内存故障隔离区中的所有数据至无故障内存区域。
[0044]步骤S102至S104旨在从软件层面对于已使用部分内存区域发生的可纠正内存故障进行故障处置。具体的,已被申请使用的内存区域,若检测到进程访问故障内存区域触发可纠正内存故障时,系统会通过预设接口隔离内存页。在此对于采用何种预设接口不作限定,例如可以采用soft offline接口实时隔离,以便修复对应内存页,并划分内存故障隔离区,迁移隔离区内所有数据到无故障内存区域。具体的,若采用soft offline接口本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内存故障的处置方法,其特征在于,包括:检测可纠正内存故障;通过预设接口隔离所述可纠正内存故障对应的内存页;将所述内存页划分至软件内存故障隔离区;迁移所述内存故障隔离区中的所有数据至无故障内存区域。2.根据权利要求1所述的处置方法,其特征在于,所述方法还包括:利用自适应双DRAM设备更正算法处置所述可纠正内存故障,或利用单设备数据校正算法处置所述可纠正内存故障。3.根据权利要求1或2所述的处置方法,其特征在于,迁移所述内存故障隔离区中的所有数据至无故障内存区域之后,还包括:将所述内存故障隔离区的隔离记录保存至固化隔离文件。4.根据权利要求1所述的处置方法,其特征在于,还包括:利用硬件内存扫描引擎扫描未使用内存区域;若发现内存故障区域时,将所述内存故障区域划分至硬件内存隔离区。5.根据权利要求1或4所述的处置方法,其特征在于,迁移所述内存故障隔离区中的所有数据至无故障内存区域之后,还包括:移除所述可纠正内存故障对应故障内存条,或,利用封装后修复对所述可纠正内存故障执行行修复。6.根据权利要求5所述的处置方法,其特征在于...

【专利技术属性】
技术研发人员:高仲于李诗逸刁家庆丁辉
申请(专利权)人:深信服科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1