【技术实现步骤摘要】
一种高性能计算集群平台散热的控制方法及系统
[0001]本专利技术实施例涉及电力
,尤其涉及一种高性能计算集群平台散热的控制方法及系统。
技术介绍
[0002]传统的高性能计算集群(HPC)平台的散热一般包括三大设备的散热,即服务器中计算卡的散热、服务器机箱的散热以及服务器机柜的散热。现有的传统的HPC平台的服务器中计算卡的散热、服务器机箱的散热以及服务器机柜的散热设备一般是单独散热,存在功率高、耗能大、效率低以及噪音大的问题。
技术实现思路
[0003]本专利技术实施例提供一种高性能计算集群平台散热的控制方法及系统,以解决现有的传统的高性能计算集群平台的服务器中计算卡的散热、服务器机箱的散热以及服务器机柜的散热设备存在的功率高、耗能大、效率低以及噪音大的问题。
[0004]为实现上述技术问题,本专利技术采用以下技术方案:
[0005]第一方面,本专利技术实施例提供了一种高性能计算集群平台散热的控制方法,包括:
[0006]所述高性能计算集群平台散热的控制方法包括:散热设备主动调 ...
【技术保护点】
【技术特征摘要】
1.一种高性能计算集群平台散热的控制方法,其特征在于,所述高性能计算集群平台散热的控制方法包括:散热设备主动调整方法,和/或,散热设备被动调整方法;所述散热设备主动调整方法包括:获取高性能计算作业调度系统的作业调度的作业操作的流程;根据所述作业操作的流程,调整执行所述作业操作的流程的服务器计算卡、服务器机箱和/或服务器所在机柜的散热设备的功率;所述散热设备被动调整方法包括:采集温度数据,并计算温度预警数据;根据所述温度预警数据,调整发生温度预警的服务器计算卡、服务器机箱和/或服务器所在机柜的散热设备的功率。2.根据权利要求1所述高性能计算集群平台散热的控制方法,其特征在于,所述获取高性能计算作业调度系统的作业调度的作业操作的流程,包括:通过作业调度系统底层的自动路由计算服务器节点,获取所述服务器机箱的作业操作的流程,并获取所述服务器所在机柜的作业操作的流程;通过作业调度系统底层的自动路由服务器节点的计算卡,获取所述服务器计算卡的作业操作的流程;根据所述作业操作的流程,调整执行所述作业操作的流程的服务器计算卡、服务器机箱以及服务器所在机柜的散热设备的功率,包括:通过软件控制器或硬件控制器,得到所述服务器计算卡、服务器机箱以及服务器所在机柜的散热设备的原功率值;根据所述作业操作的流程以及所述原始功率值,调整执行所述作业操作的流程的服务器计算卡、服务器机箱以及服务器所在机柜的散热设备的功率。3.根据权利要求2所述高性能计算集群平台散热的控制方法,其特征在于,所述作业操作的流程包括作业提交流程、作业恢复流程、作业取消流程、作业暂停流程;根据所述作业操作的流程以及所述原始功率值,调整执行所述作业操作的流程的服务器计算卡、服务器机箱以及服务器所在机柜的散热设备的功率,包括:在作业提交流程与作业恢复流程,调整服务器计算卡、服务器机箱以及服务器所在机柜的散热设备的功率值=原功率值+作业操作的流程的类型对应的调整功率*权重值;在作业取消流程与作业暂停流程,调整服务器计算卡、服务器机箱以及服务器所在机柜的散热设备的功率值=原功率值
‑
作业操作的流程的类型对应的调整功率*权重值。4.根据权利要求3所述高性能计算集群平台散热的控制方法,其特征在于,在根据所述作业操作的流程以及所述原始功率值,调整执行所述作业操作的流程的服务器计算卡、服务器机箱以及服务器所在机柜的散热设备的功率之后,还包括:同步更新所述服务器计算卡、服务器机箱以及服务器所在机柜的散热设备队列数据。5.根据权利要求1所述高性能计算集群平台散热的控制方法,其特征在于,在所述采集温度数据,并计算温度预警数据之前,还包括:对服务器计算卡、服务器机箱以及服务器所在机柜的散热设备进行初始化;其中,所述对服务器计算卡、服务器机箱以及服务器所在机柜的散热设备进行初始化,
包括:设置所述服务器计算卡的散热设备的功率值等于数据字典数据库中相应服务器计算卡的散热设备初始值;设置所述服务器机箱的散热设备的功率值等于数据字典数据库中的相应服务器机箱的散热设备初始值;设置所述服务器...
【专利技术属性】
技术研发人员:孙建军,
申请(专利权)人:联泰集群北京科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。