【技术实现步骤摘要】
本申请涉及服务器,尤其涉及一种作业分配方法及计算设备。
技术介绍
1、在采用slurm的场景下,在计算集群中的节点划分成不同的队列之后。用户提交作业时需要提交到指定的队列方可进行计算,如果该队列接收的作业较多,而该队列中的节点资源不满足作业申请的数目时,将会出现作业排队现象。在其他的队列空闲时,不同队列之间的作业负载会出现不均衡的现象,节点资源的利用率也会降低。因此,目前亟需一种提高节点资源利用率的方法。
技术实现思路
1、本申请实施例提供了一种作业分配方法及计算设备,在节点集群的作业处于拥堵时,借用其他节点集群处于空闲的计算资源实现资源扩展,后续通过借用的节点执行作业,提高资源利用率。
2、第一方面,本申请实施例提供了一种作业分配方法,应用于计算设备,计算设备用于对多个节点集群进行管理,每个节点集群中包括一个或多个计算节点,方法包括:
3、在确定多个节点集群中的第一节点集群的作业处于拥堵状态时,基于多个节点集群中第一节点集群之外的其他节点集群的空闲节点数目,确定目
...【技术保护点】
1.一种作业分配方法,其特征在于,应用于计算设备,所述计算设备用于对多个节点集群进行管理,每个所述节点集群中包括一个或多个计算节点,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
3.根据权利要求1或2所述的方法,其特征在于,所述目标空闲节点配置有支援时长,所述支援时长指示了所述目标空闲节点支援处理所述第一节点集群的作业的时长;
4.根据权利要求1至3任一所述的方法,其特征在于,所述基于所述第一节点集群中的计算节点和所述目标空闲节点,分配所述第一节点集群的作业,包括:
5.根据权利要求4所述的
...【技术特征摘要】
1.一种作业分配方法,其特征在于,应用于计算设备,所述计算设备用于对多个节点集群进行管理,每个所述节点集群中包括一个或多个计算节点,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
3.根据权利要求1或2所述的方法,其特征在于,所述目标空闲节点配置有支援时长,所述支援时长指示了所述目标空闲节点支援处理所述第一节点集群的作业的时长;
4.根据权利要求1至3任一所述的方法,其特征在于,所述基于所述第一节点集群中的计算节点和所述目标空闲节点,分配所述第一节点集群的作业,包括:
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
6.根据权利要求1至5任一所述的方法,其特征在于,所述第一节点集...
【专利技术属性】
技术研发人员:刘昭,
申请(专利权)人:超聚变数字技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。