一种内存错误的处理方法、装置及介质制造方法及图纸

技术编号:38130700 阅读:7 留言:0更新日期:2023-07-08 09:38
本发明专利技术公开了一种内存错误的处理方法、装置及介质,适用于计算机技术领域。获取内存CE故障的内存数据,其中内存数据由内存CE故障开始后采集的故障数据,内存数据为CE数据;根据内存数据的数据特性设定对应的处理策略;当内存数据满足预设条件时,则根据预设条件对应的处理策略对满足预设条件的内存数据进行隔离处理。通过CE数据的内存数据满足预设条件时,则根据预设条件对应的处理策略对满足预设条件的内存数据进行隔离处理,并不是对所有CE数据进行处理,当满足预设条件时也就意味着CE数据将要产生UCE数据,对易产生UCE的内存数据采取故障隔离措施。在避免系统宕机的同时,也节省内存空间和系统资源,提高系统的性能。提高系统的性能。提高系统的性能。

【技术实现步骤摘要】
一种内存错误的处理方法、装置及介质


[0001]本专利技术涉及计算机
,特别是涉及一种内存错误的处理方法、装置及介质。

技术介绍

[0002]内存错误是系统错误中最常见的一种,大致分为两种:可纠正错误(Correctable Error,CE)和不可纠正错误(Uncorrectable Error,UCE)。当CE产生以后如果不做处理就会演变成UCE,若演变成UCE,则会导致系统宕机。
[0003]现有的为了避免系统宕机,会在生成CE时直接进行隔离处理,此时会减少内存空间,同时对系统的资源造成浪费,也会影响系统的性能问题。
[0004]因此,如何节省系统资源的同时减少CE的隔离处理是本领域技术人员亟需要解决的。

技术实现思路

[0005]本专利技术的目的是提供一种内存错误的处理方法、装置及介质,对易产生UCE的内存数据采取故障隔离措施。在避免系统宕机的同时,也节省内存空间和系统资源,提高系统的性能。
[0006]为解决上述技术问题,本专利技术提供一种内存错误的处理方法,包括:
[0007]获取内存CE故障的内存数据,其中所述内存数据由所述内存CE故障开始后采集的故障数据,所述内存数据为CE数据;
[0008]根据所述内存数据的数据特性设定对应的处理策略;
[0009]当所述内存数据满足预设条件时,则根据所述预设条件对应的所述处理策略对满足所述预设条件的所述内存数据进行隔离处理。
[0010]优选地,所述根据所述内存数据的数据特性设定对应的处理策略,包括:
[0011]当所述内存数据的数据特性存在一种变量因素时,则确定所述处理策略为最小二乘法策略;
[0012]当所述内存数据的数据特性存在多种变量因素且所述内存数据为连续数据时,则确定所述处理策略为所述最小二乘法策略与决策树策略;
[0013]当所述内存数据的数据特性存在多种变量因素且所述内存数据为离散数据时,则确定所述处理策略为所述决策树策略;
[0014]其中,所述内存数据的所述变量因素至少包括历史cell故障次数、故障cell所在内存ROW错误次数、故障cell所在内存cache line错误次数、故障cell相邻column cell故障次数、故障cell相邻Row的cell故障次数、内存寿命和cell演变成uce数据。
[0015]优选地,所述最小二乘法策略的确定过程,包括:
[0016]采集UCE故障发生的历史数据;
[0017]根据所述历史数据截取所述内存CE故障到所述UCE故障发生之前的故障数据;
[0018]根据所述故障数据划分目标故障数据和有效故障数据;
[0019]对所述有效故障数据进行最小二乘法处理得到预设拟合曲线。
[0020]优选地,所述预设条件为所述内存数据对应的实际拟合曲线均大于所述预设拟合曲线,所述根据所述预设条件对应的所述处理策略对满足所述预设条件的所述内存数据进行隔离处理,包括:
[0021]根据所述内存数据进行所述最小二乘法处理得到所述实际拟合曲线;
[0022]当所述实际拟合曲线对应的数据均大于所述预设拟合曲线对应的数据时,则确定所述内存数据满足所述预设条件,且所述内存数据存在UCE风险;
[0023]对满足所述预设条件的所述内存数据进行隔离处理。
[0024]优选地,所述决策树策略的确定过程,包括:
[0025]获取UCE故障发生的历史数据;
[0026]根据所述历史数据提取对应的特征变量;
[0027]根据各所述特征变量对所述历史数据划分为对应的训练集数据和测试集数据;
[0028]获取决策树深度参数;
[0029]根据所述决策树参数、各所述训练集数据建立决策树模型。
[0030]优选地,所述预设条件为所述内存数据经过所述决策树模型的输出结果的概率大于预设概率,所述根据所述预设条件对应的所述处理策略对满足所述预设条件的所述内存数据进行隔离处理,包括:
[0031]获取所述内存数据和对应的所述变量因素的因素信息;
[0032]调用所述决策树模型,将所述因素信息和所述内存数据输入至所述决策树模型;
[0033]获取所述决策树模型的输出结果;
[0034]当所述输出结果的概率大于所述预设概率时,则确定所述内存数据满足所述预设条件,且所述内存数据存在UCE风险;
[0035]对满足所述预设条件的所述内存数据进行隔离处理。
[0036]优选地,所述处理决策为所述最小二乘法策略与所述决策树策略时,所述预设条件为所述内存数据对应的实际拟合曲线均大于所述预设拟合曲线且所述内存数据经过所述决策树模型的输出结果的概率大于预设概率,所述根据所述预设条件对应的所述处理策略对满足所述预设条件的所述内存数据进行隔离处理,包括:
[0037]根据所述内存数据进行所述最小二乘法处理得到所述实际拟合曲线;
[0038]当所述实际拟合曲线对应的数据均大于所述预设拟合曲线对应的数据时,则确定所述内存数据存在初始UCE风险;
[0039]获取所述内存数据对应的所述变量因素的因素信息;
[0040]调用所述决策树模型,将所述因素信息和所述内存数据输入至所述决策树模型;
[0041]获取所述决策树模型的输出结果;
[0042]当所述输出结果的概率大于所述预设概率时,则确定所述内存数据满足所述预设条件,且所述内存数据存在UCE风险;
[0043]对满足所述预设条件的所述内存数据进行隔离处理。
[0044]为解决上述技术问题,本专利技术还提供一种内存错误的处理装置,包括:
[0045]获取模块,用于获取内存CE故障的内存数据,其中所述内存数据由所述内存CE故障开始后采集的故障数据,所述内存数据为CE数据;
[0046]设定模块,用于根据所述内存数据的数据特性设定对应的处理策略;
[0047]处理模块,用于当所述内存数据满足预设条件时,则根据所述预设条件对应的所述处理策略对满足所述预设条件的所述内存数据进行隔离处理。
[0048]为解决上述技术问题,本专利技术还提供一种内存错误的处理装置,包括:
[0049]存储器,用于存储计算机程序;
[0050]处理器,用于执行所述计算机程序时实现如上述所述的内存错误的处理方法的步骤。
[0051]为解决上述技术问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的内存错误的处理方法的步骤。
[0052]本专利技术提供的一种内存错误的处理方法,包括:获取内存CE故障的内存数据,其中内存数据由内存CE故障开始后采集的故障数据,内存数据为CE数据;根据内存数据的数据特性设定对应的处理策略;当内存数据满足预设条件时,则根据预设条件对应的处理策略对满足预设条件的内存数据进行隔离处理。该方法通过CE数据的内存数据满足预设条本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内存错误的处理方法,其特征在于,包括:获取内存CE故障的内存数据,其中所述内存数据由所述内存CE故障开始后采集的故障数据,所述内存数据为CE数据;根据所述内存数据的数据特性设定对应的处理策略;当所述内存数据满足预设条件时,则根据所述预设条件对应的所述处理策略对满足所述预设条件的所述内存数据进行隔离处理。2.根据权利要求1所述的内存错误的处理方法,其特征在于,所述根据所述内存数据的数据特性设定对应的处理策略,包括:当所述内存数据的数据特性存在一种变量因素时,则确定所述处理策略为最小二乘法策略;当所述内存数据的数据特性存在多种变量因素且所述内存数据为连续数据时,则确定所述处理策略为所述最小二乘法策略与决策树策略;当所述内存数据的数据特性存在多种变量因素且所述内存数据为离散数据时,则确定所述处理策略为所述决策树策略;其中,所述内存数据的所述变量因素至少包括历史cell故障次数、故障cell所在内存ROW错误次数、故障cell所在内存cache line错误次数、故障cell相邻column cell故障次数、故障cell相邻Row的cell故障次数、内存寿命和cell演变成uce数据。3.根据权利要求2所述的内存错误的处理方法,其特征在于,所述最小二乘法策略的确定过程,包括:采集UCE故障发生的历史数据;根据所述历史数据截取所述内存CE故障到所述UCE故障发生之前的故障数据;根据所述故障数据划分目标故障数据和有效故障数据;对所述有效故障数据进行最小二乘法处理得到预设拟合曲线。4.根据权利要求3所述的内存错误的处理方法,其特征在于,所述预设条件为所述内存数据对应的实际拟合曲线均大于所述预设拟合曲线,所述根据所述预设条件对应的所述处理策略对满足所述预设条件的所述内存数据进行隔离处理,包括:根据所述内存数据进行所述最小二乘法处理得到所述实际拟合曲线;当所述实际拟合曲线对应的数据均大于所述预设拟合曲线对应的数据时,则确定所述内存数据满足所述预设条件,且所述内存数据存在UCE风险;对满足所述预设条件的所述内存数据进行隔离处理。5.根据权利要求2所述的内存错误的处理方法,其特征在于,所述决策树策略的确定过程,包括:获取UCE故障发生的历史数据;根据所述历史数据提取对应的特征变量;根据各所述特征变量对所述历史数据划分为对应的训练集数据和测试集数据;获取决策树深度参数;根据所述决策树参数、各所述训练集数据建立决...

【专利技术属性】
技术研发人员:贾帅帅李道童艾山彬陈衍东
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1