算力调度系统、方法、装置和存储介质制造方法及图纸

技术编号:34173695 阅读:26 留言:0更新日期:2022-07-17 11:23
本申请实施例提供一种算力调度系统、方法、装置和存储介质,涉及计算机技术领域,能够在考虑到网络状况的情况下实现算力资源的调度,该系统包括:调度器和与调度器连接的至少一个可编程网络,该调度器用于执行以下步骤:获取算力资源请求,算力资源请求包括目标业务的业务特征信息,用于请求为目标业务分配算力资源;基于业务特征信息,确定目标业务所需的目标算力资源的特征信息;根据目标算力资源的特征信息、多个算力节点的空闲算力情况,以及至少一个可编程网络的网络状况信息,从多个算力节点中确定调度策略,调度策略包括目标算力节点和调用目标算力节点的方式;目标算力节点,用于执行目标业务。用于执行目标业务。用于执行目标业务。

Computing power scheduling system, method, device and storage medium

【技术实现步骤摘要】
算力调度系统、方法、装置和存储介质


[0001]本申请涉及计算机
,尤其涉及算力调度系统、方法、装置和存储介质。

技术介绍

[0002]随着云计算的不断深入,在基础设施领域已经有越来越多的企业采用云计算作为统一资源管理方式,并且随着云资源池的规模不断扩大,算力节点的调度主要采用分布式的方式来实现。而传统的基于云计算或者云原生的算力资源的调度方式都是基于网络已经开通的情况下,实现算力空闲或者负载的方式来实现的。
[0003]传统的算力资源通过云原生以及云计算等方式等虚拟化技术实现算力调度和编排。基于Openstack或者Kuberentes的资源调度方式,主要是基于算力节点的空闲度来作为算力调度策略的主要依据。以Kubernetes的资源调度组件Schedule为例,其中Schedule是Kubernetes的核心组件,负责为用户声明的Pod资源选择合适的算力节点(node),同时保证算力节点集群资源的最大化利用。其任务资源调度流程如图1所示,传统的算力资源调度方式主要是在IP可达的情况下,通过监测的方式采集算力节点上的CPU、存储等信息,并且将这些信息上送到资源管理器(resource manager)中,然后再由资源调度器(Schedule)来根据用户需求进行策略调度,将任务调度到指定的算力节点上。
[0004]上述方法,在调度过程中仅考虑了算力节点的资源(如CPU资源或存储资源)情况,这可能导致实际的算力资源调度效率较低。

技术实现思路

[0005]本申请实施例提供一种算力调度系统、方法、装置和存储介质,能够在考虑到网络状况的情况下实现算力资源的调度,从而提高算力资源的调度效率。
[0006]为达到上述目的,本申请实施例采用如下技术方案:
[0007]第一方面,本申请实施例提供一种算力调度系统,包括:调度器和与调度器连接的至少一个可编程网络,至少一个可编程网络连接多个算力节点;调度器用于执行以下步骤:获取算力资源请求,算力资源请求包括目标业务的业务特征信息,用于请求为目标业务分配算力资源;基于业务特征信息,确定目标业务所需的目标算力资源的特征信息;目标算力资源的特征信息包括以下至少一种:目标算力资源种类、大小,目标算力资源所属的目标算力节点的类型;根据目标算力资源的特征信息、多个算力节点的空闲算力情况,以及至少一个可编程网络的网络状况信息,从多个算力节点中确定调度策略,调度策略包括目标算力节点和调用目标算力节点的方式;目标算力节点,用于执行目标业务。
[0008]一种可能的实现方式中,算力调度系统还包括服务器;调度器还用于将目标算力节点的标识发送给服务器;服务器用于根据目标算力节点的标识,建立服务器与目标算力节点间的数据通道。
[0009]一种可能的实现方式中,目标算力节点,还用于:将目标算力节点的能力信息和当前资源使用情况信息中的至少一种发送给服务器;其中,目标算力节点的能力信息包括目
标算力节点的处理能力、I/O传输能力中的至少一种。
[0010]一种可能的实现方式中,上述调度器与至少一个可编程网络之间设置有翻译器,翻译器用于实现服务器支持的通信协议与至少一个可编程网络支持的通信协议之间的转换。
[0011]一种可能的实现方式中,上述至少一个可编程网络包括多个可编程网络,目标算力节点的数量为多个,多个算力节点中任意两个算力节点分布在不同可编程网络中。
[0012]一种可能的实现方式中,上述至少一个可编程网络包括第一可编程网络;第一可编程网络,用于获取并向翻译器发送第一可编程网络的网络状况信息,第一可编程网络连接的算力节点的标识信息,第一可编程网络连接的算力节点上的应用的IP信息中的至少一种。
[0013]第二方面,本申请实施例提供一种算力调度方法,应用于调度系统中的调度器,调度系统还包括:与调度器连接的至少一个可编程网络,至少一个可编程网络连接多个算力节点;方法包括:获取算力资源请求,算力资源请求包括目标业务的业务特征信息,用于请求为目标业务分配算力资源;基于业务特征信息,确定目标业务所需的目标算力资源的特征信息;目标算力资源的特征信息包括以下至少一种:目标算力资源种类、大小,目标算力资源所属的目标算力节点的类型;根据目标算力资源的特征信息、多个算力节点的空闲算力情况,以及至少一个可编程网络的网络状况信息,从多个算力节点中确定调度策略,调度策略包括目标算力节点和调用目标算力节点的方式;目标算力节点,用于执行目标业务。
[0014]相比传统技术中仅考虑了算力节点的资源(如CPU资源或存储资源)情况进行算力调度的方式,本申请实施例是调度器基于获取算力资源请求确定目标业务所需的目标算力资源的特征信息,然后,再根据目标算力资源的特征信息、多个算力节点的空闲算力情况,以及至少一个可编程网络的网络状况信息,从多个算力节点中确定目标算力节点,从而保障了目标算力节点的网络状况的良好,进而提高算力资源的调度效率。
[0015]一种可能的实现方式中,上述算力调度方法还包括:将目标算力节点的标识发送给服务器,以使得服务器根据目标算力节点的标识建立与目标算力节点间的数据通道。
[0016]第三方面,本申请实施例提供一种算力调度方法,应用于调度系统中的可编程网格,该可编程网络包括路由器,其中,路由器连接多个算力节点;该方法包括:获取以下至少一种信息:可编程网络的网络状况信息、多个算力节点的标识信息或多个算力节点上的应用的IP信息;向翻译器发送至少一种信息;至少一种信息用于翻译器向调度器发送至少一种信息,以使得调度器执行算力调度方法。
[0017]第四方面,本申请实施例提供一种算力调度装置,算力调度装置包括:获取模块和确定模块;获取模块,用于获取算力资源请求,算力资源请求包括目标业务的业务特征信息,用于请求为目标业务分配算力资源;确定模块,用于基于业务特征信息,确定目标业务所需的目标算力资源的特征信息;目标算力资源的特征信息包括以下至少一种:目标算力资源种类、大小,目标算力资源所属的目标算力节点的类型;确定模块,还用于根据目标算力资源的特征信息、多个算力节点的空闲算力情况,以及至少一个可编程网络的网络状况信息,从多个算力节点中确定调度策略,调度策略包括目标算力节点和调用目标算力节点的方式;目标算力节点,用于执行目标业务。
[0018]第五方面,本申请实施例提供一种算力调度装置,算力调度装置包括:获取模块和
发送模块;
[0019]获取模块,用于获取以下至少一种信息:可编程网络的网络状况信息、多个算力节点的标识信息或多个算力节点上的应用的IP信息;发送模块,用于向翻译器发送至少一种信息;至少一种信息用于翻译器向调度器发送至少一种信息,以使得调度器执行算力调度方法。
[0020]第六方面,本申请实施例提供一种算力调度装置,包括存储器和处理器,存储器与处理器耦合;存储器用于存储计算机程序代码,其中,计算机程序代码包括计算机指令;当计算机指令被处理器执行时,使得算力调度装置执行第二方面或第三方面中任一方面本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种算力调度系统,其特征在于,包括:调度器和与所述调度器连接的至少一个可编程网络,所述至少一个可编程网络连接多个算力节点;所述调度器用于执行以下步骤:获取算力资源请求,所述算力资源请求包括目标业务的业务特征信息,用于请求为所述目标业务分配算力资源;基于所述业务特征信息,确定所述目标业务所需的目标算力资源的特征信息;所述目标算力资源的特征信息包括以下至少一种:所述目标算力资源种类、大小,所述目标算力资源所属的目标算力节点的类型;根据所述目标算力资源的特征信息、所述多个算力节点的空闲算力情况,以及所述至少一个可编程网络的网络状况信息,从所述多个算力节点中确定调度策略,所述调度策略包括目标算力节点和调用所述目标算力节点的方式;所述目标算力节点,用于执行所述目标业务。2.根据权利要求1所述的算力调度系统,其特征在于,所述算力调度系统还包括服务器;所述调度器,还用于将所述目标算力节点的标识发送给所述服务器;所述服务器,用于根据所述目标算力节点的标识,建立所述服务器与所述目标算力节点间的数据通道。3.根据权利要求2所述的算力调度系统,其特征在于,所述目标算力节点,还用于:将目标算力节点的能力信息和当前资源使用情况信息中的至少一种发送给所述服务器;其中,目标算力节点的能力信息包括目标算力节点的处理能力、I/O传输能力中的至少一种。4.根据权利要求2或3所述的算力调度系统,其特征在于,所述调度器与所述至少一个可编程网络之间设置有翻译器,所述翻译器用于实现所述服务器支持的通信协议与所述至少一个可编程网络支持的通信协议之间的转换。5.根据权利要求4所述的算力调度系统,其特征在于,所述至少一个可编程网络包括多个可编程网络,所述目标算力节点的数量为多个,多个所述算力节点中任意两个算力节点分布在不同可编程网络中。6.根据权利要求4所述的算力调度系统,其特征在于,所述至少一个可编程网络包括第一可编程网络;所述第一可编程网络,用于获取并向所述翻译器发送所述第一可编程网络的网络状况信息,所述第一可编程网络连接的算力节点的标识信息,所述第一可编程网络连接的算力节点上的应用的IP信息中的至少一种。7.一种算力调度方法,其特征在于,应用于调度系统中的调度器,所述调度系统还包括:与所述调度器连接的至少一个可...

【专利技术属性】
技术研发人员:李铭轩
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1