【技术实现步骤摘要】
一种作业自动化调度方法及装置、系统、设备、存储介质
[0001]本申请涉及计算机
,尤其涉及一种作业自动化调度方法及装置、系统、设备、存储介质。
技术介绍
[0002]当前业界衡量作业调度系统的效能通常有三个指标:一是作业的吞吐率,即单位时间内完成作业的数量;二是计算资源的利用率;三是对作业调度的公平性。
[0003]随着建成投产的计算集群的数量增多,各计算集群的资源利用率存在不均衡的情况和不同时段的潮汐效应,各计算集群之间的协同调度需求开始呈现。在多个计算集群组成的一个大的计算系统中,即多个计算集群并网时,如果沿用原有的作业调度方法,将用户提交的作业任务直接派发到一个计算集群进行执行,若该计算集群的计算资源不足,则上述作业将会排队等待,直至该计算集群相应队列的空闲计算资源满足作业运行需求,上述作业才能够在该计算集群上运行。在上述作业排队等待过程中,即使其他计算集群的计算资源空闲,处于排队状态的作业也无法被重新调度到其他计算集群的队列上运行,这将导致整个作业调度系统的效能降低。
技术实现思路
[0004]本申请提供了一种作业自动化调度方法及装置、系统、设备、存储介质,用于解决目前作业调度系统的效能较低的问题。
[0005]为达到上述目的,本申请采用如下技术方案:
[0006]第一方面,本申请提供了一种作业自动化调度方法,应用于算网大脑,算网大脑部署于作业自动化调度系统。作业自动化调度系统,还包括:算网门户、至少一个调度器、至少一个计算集群。算网大脑与算网门户通信连接。算网 ...
【技术保护点】
【技术特征摘要】
1.一种作业自动化调度方法,应用于算网大脑,所述算网大脑部署于作业自动化调度系统;所述作业自动化调度系统,还包括:算网门户、至少一个调度器、至少一个计算集群;所述算网大脑与所述算网门户通信连接;所述算网大脑与所述至少一个调度器通信连接;所述算网门户与所述至少一个调度器通信连接;所述至少一个调度器与所述至少一个计算集群一一对应;所述调度器与所述计算集群通信连接;其特征在于,所述作业自动化调度方法,包括:所述算网大脑接收所述算网门户发送的待执行作业的算力资源需求、调度策略要求和使用的应用程序名称;所述算力资源需求、所述调度策略要求和所述使用的应用程序名称为所述算网门户从第一作业队列中优先级最高的所述待执行作业的作业信息中获取的;所述算网大脑根据所述算力资源需求、所述调度策略要求和所述使用的应用程序名称,确定目标计算集群;所述算网大脑将所述目标计算集群的集群信息发送至所述算网门户,以使所述算网门户将所述作业信息发送至所述目标计算集群对应的调度器,并由所述调度器将所述作业信息转发至所述目标计算集群。2.根据权利要求1所述的方法,其特征在于,所述算网大脑根据所述算力资源需求、所述调度策略要求和所述使用的应用程序名称,确定目标计算集群,包括:所述算网大脑根据所述算力资源需求、所述使用的应用程序名称确定至少一个计算集群;若所述至少一个计算集群的数量为零个,所述算网大脑向所述算网门户发送等待指令;所述等待指令用于指示所述算网门户将所述作业信息存放至所述第一级队列;若所述至少一个计算集群的数量为一个,所述算网大脑确定所述计算集群为所述目标集群;若所述至少一个计算集群的数量为大于等于两个,所述算网大脑根据所述调度策略要求,确定所述目标计算集群。3.根据权利要求2所述的方法,其特征在于,所述调度策略包括:计算资源空闲或计算资源利用率最低或排队作业最少;所述算网大脑根据所述调度策略要求,确定所述目标计算集群,包括:所述算网大脑将所述调度策略要求与计算集群的集群信息进行匹配,确定所述目标计算集群;所述集群信息为所述算网大脑从所述调度器获取并存储。4.一种作业自动化调度方法,应用于算网门户;所述算网门户部署于作业自动化调度系统;其特征在于,所述自动化调度方法,包括:所述算网门户获取第一级作业队列中优先级最高的待执行作业的作业信息;所述作业信息包括:算力资源需求、调度策略要求、使用的应用程序名称;所述算网门户将所述算力资源需求、所述调度策略要求和所述使用的应用程序名称发送至所述算网大脑,以使所述算网大脑根据所述算力资源需求、所述调度策略要求和所述使用的应用程序名称确定目标计算集群;所述算网门户接收所述算网大脑发送的所述目标计算集群的集群信息;所述算网门户将所述作业信息发送至所述目标计算集群对应的调度器,以使所述目标调度器将所述作业信息转发至所述目标计算集群。
5.根据权利要求4所述的方法,其特征在于,所述算网门户将所述作业信息发送至所述目标计算集群对应的调度器,以使所述目标调度器将所述作业信息转发至所述目标计算集群,包括:所述算网门户将所述作业信息发送至所述目标计算集群的调度器;所述调度器将所述作业信息提交至所述目标计算集群的第二作业队列;所述目标计算集群处理所述第二作业队列中优先级最高的待执行作业。6.根据权利要求4所述的方法,其特征在于,所述方法还包括:所述算网门户接收待执行作业的作业信息;所述算网门户将所述待执行作业提交至所述第一级作业队列。7.一种作业自动化调度装置,应用于算网大脑,所述算网大脑部署于作业自动化调度系统;所述作业自动化调度系统,还包括:算网门户、至少一个调度器、至少一个计算集群;所述算网大脑与所述算网门户通信连接;所述算网大脑与所述至少一个调度器通信连接;所述算网门户与所述至少一个调度器通信连接;所述至少一个调度器与所述至少一个计算集群一一对应;所述调度器与所述计算集群通信连接;其特征在于,所述作业自动化调度装置,包括:接收模块,用于接收所述算网门户发送的待执行作业的算力资源需求、调度策略要求和使用的应用程序名称;所述...
【专利技术属性】
技术研发人员:邓玲,杨振东,杨志芬,
申请(专利权)人:中国联合网络通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。