【技术实现步骤摘要】
内存错误处理方法和装置
[0001]本申请是分案申请,原申请的申请号是201910157218.0,原申请日是2019年03月01日,原申请的全部内容通过引用结合在本申请中。
[0002]本申请涉及计算机
,尤其涉及内存错误处理方法和装置。
技术介绍
[0003]针对服务器中的应用层软件,suse、redhat等厂商提供了内存页隔离(page offline)等技术,以保障应用层软件使用内存空间的健康性。内存页隔离是操作系统(operating system,OS)层隔离使用内存页的技术。内存页被隔离后,不能再供应用层软件使用。
[0004]目前,OS层对可纠正错误(corrected errors,CE)不进行处理,仅在内存页发生不可纠正错误(uncorrected errors,UCE),且具体是选择处理(SW recoverable action optional,SRAO)错误、不需要处理(uncorrected no action,UCNA)错误和必须处理(SW recoverable act ...
【技术保护点】
【技术特征摘要】
1.一种内存错误处理方法,其特征在于,所述方法应用于计算机装置中的处理器,所述方法包括:获取第一错误描述信息,所述第一错误描述信息用于描述第一内存页的错误类型;根据所述第一错误描述信息确定所述第一内存页的错误类型是可纠正错误中的非镜像回写成功错误;当所述第一内存页发生所述非镜像回写成功错误的次数达到M时,对所述第一内存页进行隔离,所述M为大于1的整数。2.根据权利要求1所述的方法,其特征在于,所述非镜像回写成功错误包括:巡检可纠正错误、读写可纠正错误、搬移可纠正错误或镜像回写失败错误中的任意一种。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:获取第二错误描述信息,所述第二错误描述信息用于描述第二内存页错误类型;根据所述第二错误描述信息确定所述第二内存页发生的错误是不可纠正错误中的非突发致命错误;对所述第二内存页进行隔离。4.根据权利要求3所述的方法,其特征在于,所述非突发致命错误包括:不需要处理UCNA错误、选择处理SRAO错误、必须处理SRAR错误或巡检不可纠正错误中的任意一种。5.根据权利要求4所述的方法,其特征在于,当所述非突发致命错误是SRAO错误、UCNA错误或SRAR错误时,在对所述第二内存页进行隔离之后,不关闭使用所述第二内存页的应用。6.一种内存错误处理装置,其特征在于,所述内存错误处理装置为计算机装置中的处理器,所述内存错误处理装置包括:获取单元,用于获取第一错误描述信息,所述...
【专利技术属性】
技术研发人员:李钟,楼佳,周栋树,
申请(专利权)人:超聚变数字技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。