一种服务器BMC失效时散热控制系统及方法技术方案

技术编号:22363587 阅读:47 留言:0更新日期:2019-10-23 04:31
本发明专利技术涉及服务器散热技术领域,提供一种服务器BMC失效时散热控制系统及方法,系统包括基板管理控制器BMC、控制器、选通器以及待控风扇;控制器通过I2C总线从所述基板管理控制器BMC同步获取最新的风扇控制策略;控制器与基板管理控制器BMC之间通过心跳包机制进行在线互动检测,当检测到基板管理控制器BMC正常在线时,基板管理控制器BMC控制待控风扇的转动状态,当检测到基板管理控制器BMC不在线时,控制器控制待控风扇的转动状态,从而实现当BMC失效时,保证服务器的正常运行,既减少硬件链路连接,降低硬件设计复杂度和系统设计复杂度,又充分利用控制的资源、降低成本且提高系统稳定性。

A cooling control system and method for server BMC failure

【技术实现步骤摘要】
一种服务器BMC失效时散热控制系统及方法
本专利技术属于服务器散热控制
,尤其涉及一种服务器BMC失效时散热控制系统及方法。
技术介绍
在服务器运行过程中,有效地控制散热,是保证服务器稳定运行的关键。在当前的服务器设计中,一般采用BMC(BaseboardManagementController,基板管理控制器)对服务器主板进行管理。BMC可以监控主板的健康信息,实现功耗、温度和风扇转速的检测以及主板风扇的控制。当前的服务器应用中,人们对于服务器在功耗以及稳定性方面的要求越来越高,但是,BMC芯片的方案会存在一定的失效比率。若当BMC在某些情况下失效,主板风扇便失去控制,则服务器散热将受到影响,若系统过热则将导致系统宕机,对服务器稳定性造成影响。目前,存在当服务器的BMC失效时散热的控制方案,例如下述两种:(1)专利号为CN201510614465.0、专利技术名称为一种防止BMC失效后服务器系统过热的方法的专利技术专利,其具体实现过程为:在服务器内部,采用BMC作为风扇转速的控制器,并且BMC在正常工作状态下输出周期性的脉冲信号作为喂狗信号,将BMC芯片连接单片机,该单片机作为BMC工作状态的监测单元,通过监测BMC丢出的喂狗信号,实现对BMC是否正常工作的监测,当BMC失效后,调控风扇转速,保证系统的正常散热。该一种防止BMC失效后服务器系统过热的方法与现有技术相比,实现BMC工作状态的监控,通过检测MBC的工作状态,当发现BMC失效工作异常后,选通线路选通脉冲发生器生成的信号实现风扇的转速的控制,保证服务器可以正常工作,实用性强,易于推广。但是,脉冲发生器用来生成BMC失效后风扇的控制信号,脉冲发生器通过调节上下拉电阻阻值实现脉冲宽度的调节,即采用可变电阻进行脉冲调节,在BMC失效后,通过调节电阻阻值,使脉冲发生器生成客户需要风扇控制信号,从而实现风扇保持在可控转速的工作状态下。此种方式无法根据服务器系统实际温度进行自动调节风扇的转速。存在调节不便利,甚至散热不够,导致服务器宕机的情况。(2)专利号为201710047345.6、专利名称为一种服务器散热控制方法及系统的专利技术专利,其具体公开如下内容:BMC按照预设的周期向控制器发送喂狗信号,并向待控制风扇发送第一控制信号,通过第一控制信号控制待控制风扇;控制器接收BMC发送的喂狗信号,根据喂狗信号确定BMC是否发生故障,如果是,则向风扇控制芯片发送触发指令;风扇控制芯片接收控制器发送的触发指令,根据触发指令,向待控制风扇发送第二控制信号,通过第二控制信号控制待控制风扇。该方法可以使风扇控制芯片在BMC失效时,控制主板风扇,能够提高服务器的稳定性。但是,该服务器散热控制系统设计较为复杂。
技术实现思路
针对现有技术中的缺陷,本专利技术提供了一种既可减少硬件链路连接,降低硬件设计复杂度和系统设计复杂度,又能充分利用控制的资源、降低成本且提高系统稳定性的服务器BMC失效时散热控制系统。本专利技术所提供的技术方案是:一种服务器BMC失效时散热控制系统,包括基板管理控制器BMC、控制器、选通器以及待控风扇;所述选通器分别与所述基板管理控制器BMC和控制连接,且所述控制器与所述基板管理控制器BMC之间通过I2C总线通讯连接,所述选通器与所述待控风扇连接;其中,所述控制器通过所述I2C总线从所述基板管理控制器BMC同步获取最新的风扇控制策略;所述控制器与所述基板管理控制器BMC之间通过心跳包机制进行在线互动检测,当检测到所述基板管理控制器BMC正常在线时,所述选通器控制保持所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,所述基板管理控制器BMC控制所述待控风扇的转动状态,当检测到所述基板管理控制器BMC不在线时,所述选通器控制切断所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,在所述控制器与所述待控风扇之间建立信号连通,所述控制器控制所述待控风扇的转动状态。作为一种改进的方案,所述选通器包括第一数据输入接口、第二数据输入接口、控制接口以及数据输出接口;其中,第一数据输入接口与所述基板管理控制器BMC连接,所述第二数据输入接口、控制接口分别与所述控制器连接,所述数据输出接口与所述待控风扇连接。作为一种改进的方案,所述控制器定期通过所述I2C总线向所述基板管理控制器BMC发送心跳包,所述基板管理控制器BMC接收到所述心跳包后,向所述控制器反馈一个响应报文;当所述控制连续发送若干次心跳包,且收不到所述基板管理控制器BMC的响应报文时,则判定所述基板管理控制器BMC出现异常状态。作为一种改进的方案,在所述控制器控制所述待控风扇的转动状态时,所述控制器持续向所述基板管理控制器BMC发送心跳包,判断所述基板管理控制器BMC是否有响应报文的应答;当接收到所述基板管理控制器BMC反馈的响应报文时,则判定所述基板管理控制器BMC重新生效,并控制所述选通器在所述基板管理控制器BMC与所述待控风扇之间重新建立连通状态,由所述基板管理控制器BMC控制所述待控风扇的转动状态。作为一种改进的方案,当在所述控制器与所述待控风扇之间建立信号连通时,所述控制器控制读取温度传感器的温度参数,同时依据从所述基板管理控制器同步的风扇控制策略对所述温度参数进行解析,生成风扇控制信号,控制待控风扇转动。作为一种改进的方案,所述服务器BMC失效时散热控制系统还包括与所述控制器连接的蜂鸣器和告警LED灯。本专利技术的另一目的在于提供一种基于服务器BMC失效时散热控制系统的服务器BMC失效时散热控制方法,所述方法包括下述步骤:控制器与所述基板管理控制器BMC之间通过心跳包机制进行在线互动检测,判断基板管理控制器BMC是否正常在线;当检测到所述基板管理控制器BMC正常在线时,所述选通器控制保持所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,所述基板管理控制器BMC控制所述待控风扇的转动状态;当检测到所述基板管理控制器BMC不在线时,所述选通器控制切断所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,在所述控制器与所述待控风扇之间建立信号连通,所述控制器控制所述待控风扇的转动状态。作为一种改进的方案,所述方法还包括下述步骤:控制器定期通过所述I2C总线向所述基板管理控制器BMC发送心跳包,所述基板管理控制器BMC接收到所述心跳包后,向所述控制器反馈一个响应报文;当所述控制连续发送若干次心跳包,且收不到所述基板管理控制器BMC的响应报文时,则判定所述基板管理控制器BMC出现异常状态;在所述控制器控制所述待控风扇的转动状态时,所述控制器持续向所述基板管理控制器BMC发送心跳包,判断所述基板管理控制器BMC是否有响应报文的应答;当接收到所述基板管理控制器BMC反馈的响应报文时,则判定所述基板管理控制器BMC重新生效,并控制所述选通器在所述基板管理控制器BMC与所述待控风扇之间重新建立连通状态,由所述基板管理控制器BMC控制所述待控风扇的转动状态。作为一种改进的方案,所述方法还包括下述步骤:当在所述控制器与所述待控风扇之间建立信号连通时,所述控制器控制读取温度传感器的温度参数,同时依据从所述基板管理控制器同步的风扇控制策略对所述温度参数进行解析,生成风扇控制信号,控制待控风扇转动。作为一种改本文档来自技高网
...

【技术保护点】
1.一种服务器BMC失效时散热控制系统,其特征在于,包括基板管理控制器BMC、控制器、选通器以及待控风扇;所述选通器分别与所述基板管理控制器BMC和控制连接,且所述控制器与所述基板管理控制器BMC之间通过I2C总线通讯连接,所述选通器与所述待控风扇连接;其中,所述控制器通过所述I2C总线从所述基板管理控制器BMC同步获取最新的风扇控制策略;所述控制器与所述基板管理控制器BMC之间通过心跳包机制进行在线互动检测,当检测到所述基板管理控制器BMC正常在线时,所述选通器控制保持所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,所述基板管理控制器BMC控制所述待控风扇的转动状态,当检测到所述基板管理控制器BMC不在线时,所述选通器控制切断所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,在所述控制器与所述待控风扇之间建立信号连通,所述控制器控制所述待控风扇的转动状态。

【技术特征摘要】
1.一种服务器BMC失效时散热控制系统,其特征在于,包括基板管理控制器BMC、控制器、选通器以及待控风扇;所述选通器分别与所述基板管理控制器BMC和控制连接,且所述控制器与所述基板管理控制器BMC之间通过I2C总线通讯连接,所述选通器与所述待控风扇连接;其中,所述控制器通过所述I2C总线从所述基板管理控制器BMC同步获取最新的风扇控制策略;所述控制器与所述基板管理控制器BMC之间通过心跳包机制进行在线互动检测,当检测到所述基板管理控制器BMC正常在线时,所述选通器控制保持所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,所述基板管理控制器BMC控制所述待控风扇的转动状态,当检测到所述基板管理控制器BMC不在线时,所述选通器控制切断所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,在所述控制器与所述待控风扇之间建立信号连通,所述控制器控制所述待控风扇的转动状态。2.根据权利要求1所述的服务器BMC失效时散热控制系统,其特征在于,所述选通器包括第一数据输入接口、第二数据输入接口、控制接口以及数据输出接口;其中,第一数据输入接口与所述基板管理控制器BMC连接,所述第二数据输入接口、控制接口分别与所述控制器连接,所述数据输出接口与所述待控风扇连接。3.根据权利要求2所述的服务器BMC失效时散热控制系统,其特征在于,所述控制器定期通过所述I2C总线向所述基板管理控制器BMC发送心跳包,所述基板管理控制器BMC接收到所述心跳包后,向所述控制器反馈一个响应报文;当所述控制连续发送若干次心跳包,且收不到所述基板管理控制器BMC的响应报文时,则判定所述基板管理控制器BMC出现异常状态。4.根据权利要求3所述的服务器BMC失效时散热控制系统,其特征在于,在所述控制器控制所述待控风扇的转动状态时,所述控制器持续向所述基板管理控制器BMC发送心跳包,判断所述基板管理控制器BMC是否有响应报文的应答;当接收到所述基板管理控制器BMC反馈的响应报文时,则判定所述基板管理控制器BMC重新生效,并控制所述选通器在所述基板管理控制器BMC与所述待控风扇之间重新建立连通状态,由所述基板管理控制器BMC控制所述待控风扇的转动状态。5.根据权利要求4所述的服务器BMC失效时散热控制系统,其特征在于,当在所述控制器与所述待控风扇之间建立信号连通时,所述控制器控制读取温度传感器的温度参数,同时依据从所述基板管理控制器同步...

【专利技术属性】
技术研发人员:韩红瑞
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1