The invention discloses a method and system including BMC control, scalable memory based on fast fault location, select the BMC chip as the main control chip, the BMC chip through I2C bus and multi-channel selection of the chip is connected; multi-channel selection chip is connected through the GPIO signal when the LED lamp; the memory fault occurs, the fault information is sent to the CPU; PCH Southbridge gets all memory information through DMI, and then send LPC bus to the BMC chip; the BMC chip to collect information data fault memory; an external pin of the BMC chip on the access to a monitor button, when you press the button when the BMC chip monitoring, then send the command to view the fault memory of the BMC chip, and then by the control of the LED lights. The invention greatly improves the efficiency of fault memory positioning, saves the hardware space, saves labor cost, improves efficiency, and reduces the production cost to a certain extent.
【技术实现步骤摘要】
一种基于BMC控制的可扩展的多内存故障快速定位的方法及系统
本专利技术涉及计算机数据存储
,具体地说是一种基于BMC控制的可扩展的多内存故障快速定位的方法及系统。
技术介绍
随着信息技术的不断发展,服务器的应用更加广泛,对服务器的性能配置各方面提出了更高的要求,服务器单板可支持内存卡的数量已经高达几十根,内存卡一旦出现故障,需要快速定位检测出内存卡槽位的故障位置,以便对内存条进行更换或者维护处理。传统的内存故障检测主要依赖两种方法:一是依靠内存压力测试,当初步判断属于内存故障后,需要从十几条内存中定位哪条内存出现了故障,使用内存压力测试工具,对系统平台和内存进行分批测试,逐渐缩小范围,最终定位哪条内存故障但是此方法存在一定的局限性,由于内存条数量高达几十根,压力测试时间过长,而且故障未必能够复现,复现困难,且不能做到精准定位。另一种方法是在系统下生成mcelog记录,通过查找日志中的内存报错信息以及报错频率来定位故障内存在主板上的具体位置,该方法的局限性在于,生成的日志文件需要工作人员要对报错日志的内容进行仔细研读,大量浏览日志文件逐一查找各个内存的日志信息 ...
【技术保护点】
一种基于BMC控制的可扩展的多内存故障快速定位的方法,其特征在于,包括,选择BMC芯片作为主控制芯片,所述的BMC芯片通过I2C bus与多通道选择芯片相连;所述的多通道选择芯片通过GPIO信号连接LED灯;当内存条发生故障时,故障信息发送到CPU;PCH南桥通过DMI获取所有内存条的信息,然后经过LPC bus发送到所述的BMC芯片;所述的BMC芯片收集整理故障内存条的信息数据;所述的BMC芯片的一个外部引脚上接入一个监测按钮,当按下监测按钮时,则发送查看故障内存条的命令给所述的BMC芯片,然后由所述的BMC芯片控制点亮所述的LED灯。
【技术特征摘要】
1.一种基于BMC控制的可扩展的多内存故障快速定位的方法,其特征在于,包括,选择BMC芯片作为主控制芯片,所述的BMC芯片通过I2Cbus与多通道选择芯片相连;所述的多通道选择芯片通过GPIO信号连接LED灯;当内存条发生故障时,故障信息发送到CPU;PCH南桥通过DMI获取所有内存条的信息,然后经过LPCbus发送到所述的BMC芯片;所述的BMC芯片收集整理故障内存条的信息数据;所述的BMC芯片的一个外部引脚上接入一个监测按钮,当按下监测按钮时,则发送查看故障内存条的命令给所述的BMC芯片,然后由所述的BMC芯片控制点亮所述的LED灯。2.根据权利要求1所述的方法,其特征在于,所述的BMC芯片为AST2400A1-GP,所述的AST2400A1-GP提供9组I2Cbus;所述的BMC芯片通过每组I2Cbus与一颗多通道选择芯片相连。3.根据权利要求1或2所述的方法,其特征在于,所述的多通道选择芯片为PCA9555PW,所述的PCA9555PW一颗输出16路GPIO信号,每个GPIO连接一个LED灯。4.根据权利要求3所述的方法,其特征在于,所述的每个LED灯摆放在对应的一个内存槽位的一侧。5.根据权利要求1所述的方法,其特征在于,所述的BMC芯片收集整理故障内存条的信息数据,包括故障内存条的卡槽位置以及数量。6.根据权利...
【专利技术属性】
技术研发人员:宋丽青,奚立达,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。