【技术实现步骤摘要】
基于RAS的内存信息收集解析方法、系统、设备及介质
[0001]本专利技术属于内存故障信息处理
,具体涉及一种基于RAS的内存信息收集解析方法、系统、设备及介质。
技术介绍
[0002]RAS,是Reliability Availability Serviceability的简称,可靠性、可用性和可维护性。
[0003]DIMM,是Dual Inline Memory Modules的简称,双列直插内存模块。
[0004]随着数据中心的发展,服务器的应用越来越广泛,服务器的可靠性、可用性、可维护性就越来越重要。由于服务器的程序是在内存中运行的,随着内存频率越来越高,内存颗粒的密度越来越大,内存容量也越来越大,导致内存出现问题的概率越来越多,而内存故障已成为数据中心出现故障次数最多的问题。
[0005]内存RAS系统是服务器内部的内存故障管理系统,可自动恢复部分内存故障,但当内存故障严重至无法恢复时,服务器会直接宕机,此时会需要通过带外管理系统来恢复或软件重启,尤其当出现内存硬件永久性故障,还需要 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于RAS的内存信息收集解析方法,其特征在于,包括如下步骤:S1.基板管理控制器对可靠性可用性可维护性内存管理系统的内存信息进行自检,收集双列直插内存模块信息;S2.基板管理控制器对保存的双列直插内存模块信息文件进行解析,并根据内存故障情况单独记录内存故障日志文件;S3.基板管理控制器对内存故障日志文件进行分析,对内存故障导致的服务器宕机故障进行预判,并在预判结果超过预设阈值时,进行预警。2.如权利要求1所述的基于RAS的内存信息收集解析方法,其特征在于,步骤S1具体步骤如下:S11.基板管理控制器接收安全外壳协议登录指令,判断需要监测所有在位双列直插内存模块信息还是指定名称的双列直插内存模块信息;当需要监测所有在位双列直插内存模块信息时,进入步骤S12;当需要监测指定名称的双列直插内存模块信息时,进入步骤S13;S12.基板管理控制器通过信息收集指令使用高速串行计算机扩展总线标准通道访问可靠性可用性可维护性内存故障管理系统,进行所有双列直插内存模块信息自检,并进行收集,进入步骤S14;S13.基板管理控制器根据输入的双列直插内存模块名称通过信息收集指令,使用高速串行计算机扩展总线标准通道访问可靠性可用性可维护性内存故障管理系统进行指定双列直插内存模块信息自检,并进行收集,进入步骤S14;S14.基板管理控制器将收集的双列直插内存模块信息进行保存,生成双列直插内存模块信息原始文件。3.如权利要求2所述的基于RAS的内存信息收集解析方法,其特征在于,步骤S2具体步骤如下:S21.基板管理控制器通过信息解析指令对双列直插内存模块信息原始文件进行解析,判断内存是否存在故障;若是,进入步骤S22;若否,进入步骤S23;S22.基板管理控制器将故障内存的双列直插内存模块信息保存到内存故障日志文件中;S23.基板管理控制器将解析后的双列直插内存模块信息文件进行保存,生成双列直插内存模块信息解析文件。4.如权利要求3所述的基于RAS的内存信息收集解析方法,其特征在于,步骤S14中,基板管理控制器将双列直插内存模块信息原始文件按照设定的路径存储在数字安全卡处;步骤S22中,基板管理控制器将内存故障日志文件按照设定的路径存在数字安全卡卡处;步骤S23中,基板管理控制器将解析后的双列直插内存模块信息文件按照设定路径存储在数字安全卡处。5.如权利要求4所述的基于RAS的内存信息收集解析方法,其特征在于,还包括如下步骤:
技术研发人员:张梦婷,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。