内存错误动态处理方法、系统、终端及存储介质技术方案

技术编号:32164802 阅读:23 留言:0更新日期:2022-02-08 15:19
本发明专利技术提供一种内存错误动态处理方法、系统、终端及存储介质,包括:将处理器配置为错误引脚启用模式,所述错误引脚在内存发生错误时向基板管理控制器发送电平信号,以使基板管理控制器读取从处理器底层错误检测寄存器读取错误信息;根据所述错误信息执行错误验证程序,得到验证数据,根据所述验证数据获取错误类型,所述错误类型为软件错误或硬件错误的任一种;根据所述错误类型在服务器重启过程中选取相应的修复工具,并执行所述修复工具对内存进行修复。本发明专利技术可减轻OS业务压力(调用SMI所造成的资源申请)转为BMC处理分析内存错误。当内存错误过多时,也可动态转化成结合基于载波侦听多路访问协议中断的内存错误处理程序再分析处理内存错误。分析处理内存错误。分析处理内存错误。

【技术实现步骤摘要】
内存错误动态处理方法、系统、终端及存储介质


[0001]本专利技术涉及服务器
,具体涉及一种内存错误动态处理方法、系统、终端及存储介质。

技术介绍

[0002]内存(Memory)是计算机的重要部件之一,也称内存储器和主存储器,它用于暂时存放CPU中的运算数据,与硬盘等外部存储器交换的数据。它是外存与CPU进行沟通的桥梁,计算机中所有程序的运行都在内存中进行,内存性能的强弱影响计算机整体发挥的水平。只要计算机开始运行,操作系统就会把需要运算的数据从内存调到CPU中进行运算,当运算完成,CPU将结果传送出来。内存的运行也决定计算机整体运行快慢的程度。内存条由内存芯片、电路板、金手指等部分组成。随着服务器市场蓬勃的发展,内存故障是服务器宕机的最常见原因之一,另外内存的纳米制程也在提高,现在普遍芯片工艺都提高到10nm以内了,芯片制程的提高也代表着内存坏块率更高。传统的服务器内存CE检错机制是通过SMI中断或者CMCI中断处理。
[0003]当采用SMI中断方式处理时,由于之前的内存纳米制程不够小,所以错误率不高,产生的中断也不会很高。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种内存错误动态处理方法,其特征在于,包括:将处理器配置为错误引脚启用模式,所述错误引脚在内存发生错误时向基板管理控制器发送电平信号,以使基板管理控制器读取从处理器底层错误检测寄存器读取错误信息;根据所述错误信息执行错误验证程序,得到验证数据,根据所述验证数据获取错误类型,所述错误类型为软件错误或硬件错误的任一种;根据所述错误类型在服务器重启过程中选取相应的修复工具,并执行所述修复工具对内存进行修复。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:处理器底层错误检测寄存器通过PCIE链路与基板管理控制器连接,如果接收到BMC返回的读取错误信息失败的提示,则判定PCIE链路故障,并启用基于载波侦听多路访问协议中断的内存错误处理程序。3.根据权利要求1所述的方法,其特征在于,将处理器配置为错误引脚启用模式,所述错误引脚在内存发生错误时向基板管理控制器发送电平信号,以使基板管理控制器读取从处理器底层错误检测寄存器读取错误信息,包括:所述错误引脚设置在处理器上,且所述错误引脚连接基板管理控制器。4.根据权利要求1所述的方法,其特征在于,将处理器配置为错误引脚启用模式,所述错误引脚在内存发生错误时向基板管理控制器发送电平信号,以使基板管理控制器读取从处理器底层错误检测寄存器读取错误信息,包括:所述电平信号控制基板管理控制器通过中断方式触发异步消息处理程序,所述异步消息处理程序收集处理器底层错误检测寄存器的错误信息。5.根据权利要求1所述的方法,其特征在于,根据所述错误信息执行错误验证程序,得到验证数据,根据所述验证数据获取错误类型,所述错误类型为软件错误或硬件错误的任一种,包括:重复执行读写操作,基板管理控制器在每次执行读写操作之后采集错误信息...

【专利技术属性】
技术研发人员:贾帅帅李道童艾山彬陈衍东
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1