一种降低计算集群的功耗的方法、系统、设备及存储介质技术方案

技术编号:26169574 阅读:29 留言:0更新日期:2020-10-31 13:33
本申请公开了一种降低计算集群的功耗的方法,包括:按照预设的检测周期检测计算集群中的各个节点,当检测出任意一个节点在当前的检测时刻未运行作业,且在当前的检测时刻之前的第一时长内均未运行作业,将该节点作为被筛选出的节点;关闭各个被筛选出的节点。应用本申请的方案,可以有效地降低计算集群的功耗,又能够保障不会出现将正在运行作业的节点异常关闭的情况。本申请还提供了一种降低计算集群的功耗的系统、设备及存储介质,具有相应技术效果。

【技术实现步骤摘要】
一种降低计算集群的功耗的方法、系统、设备及存储介质
本专利技术涉及集群管理
,特别是涉及一种降低计算集群的功耗的方法、系统、设备及存储介质。
技术介绍
随着企业对超算越来越重视,国内建造了越来越多的大型HPC(HighPerformanceComputing,高性能计算)超算中心。超算中心的设备越来越多,规模越来越庞大,因此,集群的整体功耗也逐步增大,产生的电费极其昂贵,导致超算中心整体的运行成本逐步增高。高性能集群的任务基本是一个托管状态,任务分发到整个集群中,为了降低HPC集群的整体功耗,现有的一种方案是依赖管理员监视集群的作业运行状况,手动停止没有运行作业的空载服务器,从而降低集群的整体功耗。但是,由于是管理员手动操作,管理员无法实时掌控集群内的作业运行情况,经常会出现机器长时间空转之后才被关闭的情况。并且,集群内作业数量多,且不断地变化,手动关闭、开启节点的方式只能在一定程度上降低集群功耗,还会带来人力成本的提高,或者是作业增多时管理员未及时开启被关闭的节点而导致大量作业长时间堆积,影响集群整体业务的不利情况。目前本文档来自技高网...

【技术保护点】
1.一种降低计算集群的功耗的方法,其特征在于,包括:/n按照预设的检测周期检测计算集群中的各个节点,当检测出任意一个节点在当前的检测时刻未运行作业,且在当前的检测时刻之前的第一时长内均未运行作业,将该节点作为被筛选出的节点;/n关闭各个被筛选出的节点。/n

【技术特征摘要】
1.一种降低计算集群的功耗的方法,其特征在于,包括:
按照预设的检测周期检测计算集群中的各个节点,当检测出任意一个节点在当前的检测时刻未运行作业,且在当前的检测时刻之前的第一时长内均未运行作业,将该节点作为被筛选出的节点;
关闭各个被筛选出的节点。


2.根据权利要求1所述的降低计算集群的功耗的方法,其特征在于,还包括:
针对所述计算集群的任意一个计算分组,当确定出属于该计算分组的作业队列超过为该计算分组配置的作业阈值时,判断该计算分组中是否包括被关闭的节点;
如果是,则开启该计算分组中至少一个被关闭的节点。


3.根据权利要求2所述的降低计算集群的功耗的方法,其特征在于,还包括:
针对所述计算集群的任意一个计算分组,当确定出属于该计算分组的作业队列超过为该计算分组配置的作业阈值,且判断出该计算分组中不包括被关闭的节点,则输出第一提示信息。


4.根据权利要求2所述的降低计算集群的功耗的方法,其特征在于,针对所述计算集群的任意一个计算分组,当该计算分组被关闭的节点中需要被开启的节点数量超过预设的数量阈值时,通过预设的分批次开启的方式进行节点开启。


5.根据权利要求1所述的降低计算集群的功耗的方法,其特征在于,所述计算集群为HPC集群。


6.一种降低计算集群的功耗的系统,其特征在于,包括:
节点筛选模块,用于按照预设的检测周...

【专利技术属性】
技术研发人员:袁绍辛永欣
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1