一种内存故障检测方法、装置及其介质制造方法及图纸

技术编号:36124856 阅读:9 留言:0更新日期:2022-12-28 14:31
本申请公开了一种内存故障检测方法、装置及其介质,涉及服务器技术领域,用于定位故障内存并检测故障原因,针对目前对于故障原因的确定方法繁琐且不易实施的问题,提供了一种内存故障检测方法,当服务器的BMC与BIOS建立通信连接后,可以获取BIOS在进行自检后得到的内存信息。针对内存信息,可以通过特定位置的数据确定各个内存的运行情况,从而实现对于故障原因的确定,并返回对应内存的不同故障信息以告知运维人员内存故障情况,使得运维人员无需自己通过手动调取BIOS日志的形式确定故障原因,大大简化了内存故障检测流程,且对运维人员的要求更小,更有利于实际实施。更有利于实际实施。更有利于实际实施。

【技术实现步骤摘要】
一种内存故障检测方法、装置及其介质


[0001]本申请涉及服务器
,特别是涉及一种内存故障检测方法、装置及其介质。

技术介绍

[0002]内存(memory)也被称为内存储器,其主要用于暂时存放中央处理器(Central Processing Unit,CPU)中的运算数据,以及与硬盘等外部存储器交换的数据,是服务器中重要的部件之一。内存也决定了服务器能否稳定运行,如果内存发生故障,服务器则会出现开机不显示或者宕机等问题。因此,当内存发生故障时,快速找到发生故障原因,并快速定位发生故障的内存,对于维修人员及时解决内存故障、保障服务器正常运行尤其重要。
[0003]目前,服务器在主板上各个内存卡槽附近设置有发光二极管(light

emitting diode,LED),用于指示对应卡槽内存是否出现故障,当服务器的操作系统(Operating System,OS)检测到内存不可用时会进行报错,并控制相应内存卡槽处的LED灯常亮进行故障定位。但这种方式无法区分内存具体的故障原因。想要确定故障原因,目前一般先将服务器断电,通过跳帽的方式清CMOS,然后再上电开机,进入基本输入输出系统(Basic Input Output System,BIOS)设置模式,也即BIOS Setup,通过运维人员查看内存信息,实现内存故障的定位以及故障原因的确定,步骤繁琐且对运维人员的要求较高,在实际应用中较难实施。
[0004]CMOS:是Complementary Metal Oxide Semiconductor(互补金属氧化物半导体)的缩写。它是指制造大规模集成电路芯片用的一种技术或用这种技术制造出来的芯片,是电脑主板上的一块可读写的随机存取存储器(Random Access Memory,RAM)芯片。因为可读写的特性,所以在电脑主板上用来保存BIOS设置完电脑硬件参数后的数据。
[0005]所以,现在本领域的技术人员亟需要一种内存故障检测方法,解决目前在进行内存故障检测时,对于故障原因的确定方法繁琐且不易实施的问题。

技术实现思路

[0006]本申请的目的是提供一种内存故障检测方法、装置及其介质,以解决目前在进行内存故障检测时,对于故障原因的确定方法繁琐且不易实施的问题。
[0007]为解决上述技术问题,本申请提供一种内存故障检测方法,BMC与BIOS之间存在通信连接,包括:
[0008]获取BIOS自检后得到的内存信息;
[0009]根据内存信息定位故障内存并判断故障原因;
[0010]根据故障内存和故障原因返回对应的故障信息。
[0011]优选的,故障原因包括内存损坏、内存不在位和内存未通过训练。
[0012]优选的,各内存卡槽处分别设置有与BMC连接的内存故障灯;
[0013]对应的,根据故障内存和故障原因返回对应的故障信息包括:
[0014]若故障原因为内存损坏,则控制故障内存对应的内存故障灯以第一闪烁方式进行
闪烁;
[0015]若故障原因为内存不在位,则控制故障内存对应的内存故障灯以第二闪烁方式进行闪烁;
[0016]若故障原因为内存未通过训练,则控制故障内存对应的内存故障灯以第三闪烁方式进行闪烁;其中,第一闪烁方式、第二闪烁方式和第三闪烁方式不同。
[0017]优选的,服务器包括与BMC连接的故障原因指示灯和设置在各内存卡槽处的故障定位灯,故障原因指示灯至少存在三种不同的颜色,且分别对应不同的故障原因;
[0018]对应的,根据故障内存和故障原因返回对应的故障信息包括:
[0019]控制故障内存对应的故障定位灯常亮,并根据故障原因控制对应颜色的故障原因指示灯常亮。
[0020]优选的,各内存卡槽处分别成组设置有与BMC连接的内存故障灯,且每组的各内存故障灯至少存在三种不同颜色,分别对应不同的故障原因;
[0021]对应的,根据故障内存和故障原因返回对应的故障信息包括:
[0022]控制故障内存对应的内存故障灯组中、内存故障原因对应颜色的内存故障灯常亮。
[0023]优选的,还包括:
[0024]当判断出存在故障内存时,将对应的内存信息发送至存储器中进行存储。
[0025]优选的,将对应的内存信息发送至存储器中进行存储包括:
[0026]若故障内存对应的故障原因为内存损坏,则将内存信息保存至第一存储器中;
[0027]若故障内存对应的故障原因为内存不在位,则将内存信息保存至第二存储器中;
[0028]若故障内存对应的故障原因为内存未通过训练,则将内存信息保存至第三存储器中。
[0029]为解决上述技术问题,本申请还提供一种内存故障检测装置,包括:
[0030]信息获取模块,用于获取BIOS自检后得到的内存信息;
[0031]故障判断模块,用于根据内存信息定位故障内存并判断故障原因;
[0032]故障返回模块,用于根据故障内存和故障原因返回对应的故障信息。
[0033]优选的,还包括:
[0034]存储模块,用于当判断出存在所述故障内存时,将对应的内存信息发送至存储器中进行存储。
[0035]为解决上述技术问题,本申请还提供一种内存故障检测装置,包括:
[0036]存储器,用于存储计算机程序;
[0037]处理器,用于执行计算机程序时实现如上述的内存故障检测方法的步骤。
[0038]为解决上述技术问题,本申请还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述的内存故障检测方法的步骤。
[0039]本申请提供的内存故障检测方法,当服务器的BMC与BIOS建立通信连接后,可以获取BIOS在进行自检后的自检信息,于本方案中,主要关注其中关于内存的自检信息,也即内存信息。针对上述的内存信息,可以通过特定位置的数据确定各个内存的运行情况,从而实现对于故障原因的确定,并返回对应内存的不同故障信息以告知运维人员内存故障情况,
使得运维人员无需自己通过手动调取BIOS日志的形式确定故障原因,大大简化了内存故障检测流程,且对运维人员的要求更小,更有利于实际实施。
[0040]本申请提供的内存故障检测装置、及计算机可读存储介质,与上述方法对应,效果同上。
附图说明
[0041]为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0042]图1为本专利技术提供的一种内存故障检测方法的流程图;
[0043]图2为本专利技术提供的一种内存故障检测电路的结构图;
[0044]图3为本专利技术提供的另一种内存故障检测方法的流程图;
[0045]图4为本专利技术提供的一种结合图2电路的内本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内存故障检测方法,其特征在于,BMC与BIOS之间存在通信连接,包括:获取BIOS自检后得到的内存信息;根据所述内存信息定位故障内存并判断故障原因;根据所述故障内存和所述故障原因返回对应的故障信息。2.根据权利要求1所述的内存故障检测方法,其特征在于,所述故障原因包括内存损坏、内存不在位和内存未通过训练。3.根据权利要求2所述的内存故障检测方法,其特征在于,各内存卡槽处分别设置有与所述BMC连接的内存故障灯;对应的,所述根据所述故障内存和所述故障原因返回对应的故障信息包括:若所述故障原因为内存损坏,则控制所述故障内存对应的所述内存故障灯以第一闪烁方式进行闪烁;若所述故障原因为内存不在位,则控制所述故障内存对应的所述内存故障灯以第二闪烁方式进行闪烁;若所述故障原因为内存未通过训练,则控制所述故障内存对应的所述内存故障灯以第三闪烁方式进行闪烁;其中,所述第一闪烁方式、所述第二闪烁方式和所述第三闪烁方式不同。4.根据权利要求2所述的内存故障检测方法,其特征在于,服务器包括与所述BMC连接的故障原因指示灯和设置在各内存卡槽处的故障定位灯,所述故障原因指示灯至少存在三种不同的颜色,且分别对应不同的所述故障原因;对应的,所述根据所述故障内存和所述故障原因返回对应的故障信息包括:控制所述故障内存对应的所述故障定位灯常亮,并根据所述故障原因控制对应颜色的所述故障原因指示灯常亮。5.根据权利要求2所述的内存故障检测方法,其特征在于,各内存卡槽处分别成组设置有与所述BMC连接的内...

【专利技术属性】
技术研发人员:李文佳
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1