【技术实现步骤摘要】
一种冗余电源告警信号的处理方法及装置
本专利技术实施例涉及服务器系统设计领域,具体来说涉及一种冗余电源告警信号的处理方法及装置。
技术介绍
AI服务器是人工智能模型训练和推理的计算力载体,在当今的人工智能发展中扮演着重要角色。与通用服务器相比,AI服务器更加注重对计算力性能的追求,因为该类型的服务器最主要的作用就是用来进行数据的计算,而且是异构计算系统。通俗来讲,AI服务器除了具有通用的计算单元CPU之外,还有例如GPU、ASIC加速卡及FPGA等专门针对大规模并行化矩阵运算而设计的计算加速器,CPU只负责少量的通用类计算,而AI模型训练和推理所需的计算力主要由这些专用部件来提供。由于AI服务器比通用服务器在系统结构方面更加复杂,因此其功耗也比通用服务器要大很多,所以随着服务器技术的不断发展,对服务器电源系统的负载能力、安全性、扩展性和通用性等方面也提出了更高的要求。为保证AI服务器电源的可靠性,现有PSU通常设计成3+3冗余的形式,即使用6个PSU,每个PSU输出一个故障信号给CPLD,6个故障信号在CPLD内部经 ...
【技术保护点】
1.一种冗余电源告警信号的处理方法,其特征在于,包括以下步骤:/n对PSU输出的故障信号进行与运算,得到告警信号并发送给BMC;/n对PSU输出的在位信号与故障信号进行逻辑算数运算,并将运算结果发送给CPU;/nCPU根据运算结果选择是否进行系统节流处理。/n
【技术特征摘要】
1.一种冗余电源告警信号的处理方法,其特征在于,包括以下步骤:
对PSU输出的故障信号进行与运算,得到告警信号并发送给BMC;
对PSU输出的在位信号与故障信号进行逻辑算数运算,并将运算结果发送给CPU;
CPU根据运算结果选择是否进行系统节流处理。
2.根据权利要求1所述的一种冗余电源告警信号的处理方法,其特征在于,所述对PSU输出的故障信号进行与运算,得到告警信号并发送给BMC,包括下述步骤:
将PSU输出的故障信号发送至CPLD的逻辑与单元进行与运算,若其中一个PSU发生故障,则逻辑与单元输出告警信号至BMC进行异常记录。
3.根据权利要求1所述的一种冗余电源告警信号的处理方法,其特征在于,所述对PSU输出的在位信号与故障信号进行逻辑算数运算,并将运算结果发送给CPU,包括下述步骤:
在CPLD中设置逻辑运算单元;
将PSU输出的在位信号与故障信号发送至CPLD的逻辑运算单元进行逻辑算数运算,比较PSU的在位数量减去故障数量的值是否小于冗余值,
若是,则向CPU输出低电平节流控制信号;
若否,则向CPU输出高电平节流控制信号。
4.根据权利要求3所述的一种冗余电源告警信号的处理方法,其特征在于,所述CPU根据运算结果选择是否进行系统节流处理,包括下述步骤:
若CPU接收到低电平节流控制信号,则启动对系统的节流处理;若接收到高电平节流控制信号,则不进行节流...
【专利技术属性】
技术研发人员:李艳艳,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。