一种板级服务器防烧板方法、系统及板级服务器技术方案

技术编号:27684387 阅读:14 留言:0更新日期:2021-03-17 03:42
本发明专利技术公开了一种板级服务器防烧板方法、系统及板级服务器,预先为服务器内的目标组PR,在不同的输入电流变化率、供电线路温度及供电线路温度变化率下,相应设置不同的防烧板保护策略;根据不同防烧板保护策略的设置情况,确定与目标组PR的实际输入电流变化率、实际供电线路温度及实际供电线路温度变化率对应的目标防烧板保护策略,并按照目标防烧板保护策略对服务器采取防烧板保护措施。可见,本申请摒弃纯侦测电流大小的方式,建立电流变化率、温度、温度变化率三位一体的侦测体系,通过判断三者的相互变化来制定防烧板保护策略,做到防烧板的全防护,能有效避免发生各烧板状况,提高了板卡的可靠性。

【技术实现步骤摘要】
一种板级服务器防烧板方法、系统及板级服务器
本专利技术涉及服务器安全领域,特别是涉及一种板级服务器防烧板方法、系统及板级服务器。
技术介绍
随着云计算的发展,大规模的数据中心越来越多,作为数据中心基本单元的服务器的可靠性设计成为重中之重。而在服务器的可靠性设计中,服务器的防烧板设计是最重要的部分。现有技术中,板级服务器的防烧板架构如图1所示,在系统的PSU(Powersupplyunit,电源供应单元)和各组PR(powerrail,电源轨-为服务器部件供电)之间串接EFUSE(电子熔断器)来侦测各组PR的输入电流,并将各组PR的输入电流传送至BMC(BaseboardManagementController,基板管理控制器),BMC通过各组PR的输入电流的大小来判断系统板卡是否存在烧板风险,若存在烧板风险,则通知PSU断电,实现防烧板设计。但是,现有的防烧板架构只对超大电流的烧板有预防作用,对一般电流的烧板或者服务器相对轻载下的烧板是不起作用的。比如,一个EFUSE对应一组CPU(中央处理器)和Memery(存储器)的PR,按照目前的功耗设计要求,在重载下功耗要到600W,此EFUSE要通过的正常电流为600/12=50A,在考虑设计余量和侦测精度的情况下,一般设计的防烧板电流要到80A以上,而实际烧板时电流并不会触发这么大,但如果防烧板电流设计过小,则不满足系统正常工作设计的电流要求,所以,现有的防烧板架构只能避免超大电流的烧板状况,导致板卡的可靠性降低。因此,如何提供一种解决上述技术问题的方案是本领域的技术人员目前需要解决的问题。
技术实现思路
本专利技术的目的是提供一种板级服务器防烧板方法、系统及板级服务器,摒弃纯侦测电流大小的方式,建立电流变化率、温度、温度变化率三位一体的侦测体系,通过判断三者的相互变化来制定防烧板保护策略,做到防烧板的全防护,能有效避免发生各烧板状况,提高了板卡的可靠性。为解决上述技术问题,本专利技术提供了一种板级服务器防烧板方法,应用于包含一一检测N组PR的输入电流的N组电流传感器及一一检测N组PR的供电线路温度的N组温度传感器的服务器;N为正整数;所述板级服务器防烧板方法包括:预先为所述服务器内的目标组PR,在不同的输入电流变化率、供电线路温度及供电线路温度变化率下,相应设置不同的防烧板保护策略;其中,所述目标组PR为任一组PR;从所述目标组PR对应的电流传感器及温度传感器中相应获取所述目标组PR的实际输入电流及实际供电线路温度,并根据所述目标组PR的实际输入电流求取所述目标组PR的实际输入电流变化率,且根据所述目标组PR的实际供电线路温度求取所述目标组PR的实际供电线路温度变化率;根据不同防烧板保护策略的设置情况,确定与所述目标组PR的实际输入电流变化率、实际供电线路温度及实际供电线路温度变化率对应的目标防烧板保护策略,并按照所述目标防烧板保护策略对所述服务器采取防烧板保护措施。优选地,预先为所述服务器内的目标组PR,在不同的输入电流变化率、供电线路温度及供电线路温度变化率下,相应设置不同的防烧板保护策略的过程,包括:预先为目标组PR的输入电流变化率设置电流变化率安全阈值,为所述目标组PR的供电线路温度设置温度安全阈值,为所述目标组PR的供电线路温度变化率设置温度变化率安全阈值;当所述目标组PR的实际输入电流变化率超过所述电流变化率安全阈值,且所述目标组PR的供电线路温度变化率超过所述温度变化率安全阈值时,控制所述服务器的PSU立即切断供电输出;当所述目标组PR的实际供电线路温度超过所述温度安全阈值,且所述目标组PR的实际输入电流变化率超过所述电流变化率安全阈值或所述目标组PR的供电线路温度变化率超过所述温度变化率安全阈值时,控制所述PSU在预设安全时间后切断供电输出;当所述目标组PR的实际输入电流变化率未超过所述电流变化率安全阈值,或所述目标组PR的实际供电线路温度未超过所述温度安全阈值且所述目标组PR的供电线路温度变化率未超过所述温度变化率安全阈值时,控制所述PSU保持供电输出。优选地,为目标组PR的输入电流变化率设置电流变化率安全阈值的过程,包括:根据不同器件的个体差异和信号干扰因素,确定目标组PR的输入电流变化率的误差系数;获取所述目标组PR的OCP电流值除以所述目标组PR在正常工作时的最大电流值的电流倍数;将所述电流倍数与所述误差系数相加,得到电流变化率系数;获取所述服务器在正常工作状态下从轻载到最重载时,所述目标组PR的最大输入电流变化率;将所述最大输入电流变化率乘以所述电流变化率系数,得到所述电流变化率安全阈值。优选地,为所述目标组PR的供电线路温度设置温度安全阈值的过程,包括:根据所述目标组PR的供电线路所连接的半导体器件在温度增加下的电流承载能力,确定温度安全设定值;根据所述服务器的系统反应时间,确定温度预留值;将所述温度安全设定值减去所述温度预留值,得到所述温度安全阈值。优选地,为所述目标组PR的供电线路温度变化率设置温度变化率安全阈值的过程,包括:获取所述服务器即将烧板时的第一温度变化率,并获取所述服务器的最高散热能力对应的第二温度变化率;将所述第一温度变化率减去所述第二温度变化率,得到所述温度变化率安全阈值。优选地,所述目标组PR对应的温度传感器放置于所述目标组PR的供电线路上流通最大电流的位置。优选地,所述板级服务器防烧板方法还包括:将所述目标组PR的实际输入电流变化率、实际供电线路温度及实际供电线路温度变化率进行记录,以便于故障复盘分析。为解决上述技术问题,本专利技术还提供了一种板级服务器防烧板系统,应用于包含一一检测N组PR的输入电流的N组电流传感器及一一检测N组PR的供电线路温度的N组温度传感器的服务器;N为正整数;所述板级服务器防烧板系统包括:预设模块,用于预先为所述服务器内的目标组PR,在不同的输入电流变化率、供电线路温度及供电线路温度变化率下,相应设置不同的防烧板保护策略;其中,所述目标组PR为任一组PR;计算模块,用于从所述目标组PR对应的电流传感器及温度传感器中相应获取所述目标组PR的实际输入电流及实际供电线路温度,并根据所述目标组PR的实际输入电流求取所述目标组PR的实际输入电流变化率,且根据所述目标组PR的实际供电线路温度求取所述目标组PR的实际供电线路温度变化率;保护模块,用于根据不同防烧板保护策略的设置情况,确定与所述目标组PR的实际输入电流变化率、实际供电线路温度及实际供电线路温度变化率对应的目标防烧板保护策略,并按照所述目标防烧板保护策略对所述服务器采取防烧板保护措施。优选地,所述预设模块包括:阈值设定子模块,用于预先为目标组PR的输入电流变化率设置电流变化率安全阈值,为所述目标组PR的供电线路温度设置温度安全阈值,为所述目标组PR的供电线路温度变化率设置温度变化率安全阈值;第一保护策略子本文档来自技高网
...

【技术保护点】
1.一种板级服务器防烧板方法,其特征在于,应用于包含一一检测N组PR的输入电流的N组电流传感器及一一检测N组PR的供电线路温度的N组温度传感器的服务器;N为正整数;所述板级服务器防烧板方法包括:/n预先为所述服务器内的目标组PR,在不同的输入电流变化率、供电线路温度及供电线路温度变化率下,相应设置不同的防烧板保护策略;其中,所述目标组PR为任一组PR;/n从所述目标组PR对应的电流传感器及温度传感器中相应获取所述目标组PR的实际输入电流及实际供电线路温度,并根据所述目标组PR的实际输入电流求取所述目标组PR的实际输入电流变化率,且根据所述目标组PR的实际供电线路温度求取所述目标组PR的实际供电线路温度变化率;/n根据不同防烧板保护策略的设置情况,确定与所述目标组PR的实际输入电流变化率、实际供电线路温度及实际供电线路温度变化率对应的目标防烧板保护策略,并按照所述目标防烧板保护策略对所述服务器采取防烧板保护措施。/n

【技术特征摘要】
1.一种板级服务器防烧板方法,其特征在于,应用于包含一一检测N组PR的输入电流的N组电流传感器及一一检测N组PR的供电线路温度的N组温度传感器的服务器;N为正整数;所述板级服务器防烧板方法包括:
预先为所述服务器内的目标组PR,在不同的输入电流变化率、供电线路温度及供电线路温度变化率下,相应设置不同的防烧板保护策略;其中,所述目标组PR为任一组PR;
从所述目标组PR对应的电流传感器及温度传感器中相应获取所述目标组PR的实际输入电流及实际供电线路温度,并根据所述目标组PR的实际输入电流求取所述目标组PR的实际输入电流变化率,且根据所述目标组PR的实际供电线路温度求取所述目标组PR的实际供电线路温度变化率;
根据不同防烧板保护策略的设置情况,确定与所述目标组PR的实际输入电流变化率、实际供电线路温度及实际供电线路温度变化率对应的目标防烧板保护策略,并按照所述目标防烧板保护策略对所述服务器采取防烧板保护措施。


2.如权利要求1所述的板级服务器防烧板方法,其特征在于,预先为所述服务器内的目标组PR,在不同的输入电流变化率、供电线路温度及供电线路温度变化率下,相应设置不同的防烧板保护策略的过程,包括:
预先为目标组PR的输入电流变化率设置电流变化率安全阈值,为所述目标组PR的供电线路温度设置温度安全阈值,为所述目标组PR的供电线路温度变化率设置温度变化率安全阈值;
当所述目标组PR的实际输入电流变化率超过所述电流变化率安全阈值,且所述目标组PR的供电线路温度变化率超过所述温度变化率安全阈值时,控制所述服务器的PSU立即切断供电输出;
当所述目标组PR的实际供电线路温度超过所述温度安全阈值,且所述目标组PR的实际输入电流变化率超过所述电流变化率安全阈值或所述目标组PR的供电线路温度变化率超过所述温度变化率安全阈值时,控制所述PSU在预设安全时间后切断供电输出;
当所述目标组PR的实际输入电流变化率未超过所述电流变化率安全阈值,或所述目标组PR的实际供电线路温度未超过所述温度安全阈值且所述目标组PR的供电线路温度变化率未超过所述温度变化率安全阈值时,控制所述PSU保持供电输出。


3.如权利要求2所述的板级服务器防烧板方法,其特征在于,为目标组PR的输入电流变化率设置电流变化率安全阈值的过程,包括:
根据不同器件的个体差异和信号干扰因素,确定目标组PR的输入电流变化率的误差系数;
获取所述目标组PR的OCP电流值除以所述目标组PR在正常工作时的最大电流值的电流倍数;
将所述电流倍数与所述误差系数相加,得到电流变化率系数;
获取所述服务器在正常工作状态下从轻载到最重载时,所述目标组PR的最大输入电流变化率;
将所述最大输入电流变化率乘以所述电流变化率系数,得到所述电流变化率安全阈值。


4.如权利要求2所述的板级服务器防烧板方法,其特征在于,为所述目标组PR的供电线路温度设置温度安全阈值的过程,包括:
根据所述目标组PR的供电线路所连接的半导体器件在温度增加下的电流承载能力,确定温度安全设定值;
根据所述服务器的系统反应时间,确定温度预留值;
将所述温度安全设定值减去所述温度预留值,得到所述温度安全阈值。


5.如权利要求2所述的板级服务器防烧板方法,其特征在于,为所述目...

【专利技术属性】
技术研发人员:吴福宽
申请(专利权)人:浪潮电子信息产业股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1