算力资源调度方法及其装置制造方法及图纸

技术编号:31903790 阅读:19 留言:0更新日期:2022-01-15 12:41
本申请公开了一种算力资源调度方法及其装置,涉及资源调度领域。该方法包括:根据来自用户设备的第一业务的业务请求信息,获取用户设备所在的地理位置。根据用户设备所在的地理位置与算力网络中的各个算力域的地理位置之间的距离,将算力网络中的各个算力域按照由近及远的顺序进行排序得到第一排序结果,每个算力域包括多个算力节点。根据业务请求信息以及第一排序结果确定承载第一业务的目标算力节点。目标算力节点为目标算力域中满足第一业务的需求的至少一个算力节点中的一个。目标算力域为第一排序结果中第一个包括满足第一业务的需求的算力节点的算力域。该方法可以快速调度到可以承载第一业务的目标算力节点。度到可以承载第一业务的目标算力节点。度到可以承载第一业务的目标算力节点。

【技术实现步骤摘要】
算力资源调度方法及其装置


[0001]本申请涉及资源调度领域,尤其涉及一种算力资源调度方法及其装置。

技术介绍

[0002]人工智能(artificial intelligence,AI)业务是指利用AI技术的业务,AI技术是指通过普通计算机程序来呈现人类智能的技术。AI技术中,算力(资源)、算法、以及数据是重要的三要素。三要素中,算力可以看作AI技术的基础平台,直接影响着AI技术的应用。而AI业务的部署又依赖于AI技术的应用,因此,算力直接影响着AI业务的部署。
[0003]目前,AI业务的部署主要通过算力网络进行,算力网络可以将来源于个人或者企业闲置的零散算力的算力资源和网络资源进行统一管理调度,以满足不同AI业务的需求。而不同的AI业务需求可能会有不同的网络调度的方法。

技术实现思路

[0004]本申请提供一种算力资源调度方法及其装置,可以快速调度到满足第一业务的需求的算力节点,调度的速度较快。
[0005]第一方面,本申请提供一种算力资源调度方法,该方法包括:
[0006]接收来自用户设备的第一业本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种算力资源调度方法,其特征在于,所述方法包括:接收来自用户设备的第一业务的业务请求信息;根据所述第一业务的业务请求信息,获取所述用户设备所在的地理位置;根据所述用户设备所在的地理位置与算力网络中的各个算力域的地理位置之间的距离,将所述算力网络中的各个算力域按照由近及远的顺序进行排序,得到第一排序结果;其中,所述算力网络中的每个算力域包括多个算力节点;根据所述第一业务的业务请求信息、以及所述第一排序结果,确定承载所述第一业务的目标算力节点;所述目标算力节点为目标算力域中包括的满足所述第一业务的需求的至少一个算力节点中的一个;所述目标算力域为所述第一排序结果中第一个包括满足所述第一业务的需求的算力节点的算力域。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一业务的业务请求信息、以及所述第一排序结果,确定承载所述第一业务的目标算力节点,包括:从所述第一排序结果中的第一个算力域开始,采用第一算法,根据所述第一业务的业务请求信息,计算所述算力域中的每个算力节点对所述第一业务的可用值;当第一个算力域中对所述第一业务的可用值最大的算力节点满足所述第一业务的需求时,确定第一个算力域中对所述第一业务的可用值最大的算力节点为所述目标算力节点;当第一个算力域中对所述第一业务的可用值最大的算力节点不满足所述第一业务的需求时,从下一个算力域中确定所述目标算力节点,直到得到所述目标算力节点。3.根据权利要求1所述的方法,其特征在于,所述根据所述第一业务的业务请求信息、以及所述第一排序结果,确定承载所述第一业务的目标算力节点,包括:从所述第一排序结果中的第一个算力域开始,采用第一算法,根据所述第一业务的业务请求信息,计算所述算力域中的每个算力节点对所述第一业务的可用值;当第一个算力域中包括多个满足所述第一业务的需求的算力节点时,将多个所述算力节点按照对所述第一业务的可用值从小到大的顺序进行排序,得到第二排序结果;根据第二排序结果,确定对所述第一业务的可用值满足所述第一业务的需求的多个所述算力节点中的一个为所述目标算力节点。4.根据权利要求3所述的方法,其特征在于,所述当第一个算力域中包括多个满足所述第一业务的需求的算力节点时,将多个所述算力节点按照对所述第一业务的可用值从小到大的顺序进行排序,得到第二排序结果;所述根据第二排序结果,确定对所述第一业务的可用值满足所述第一业务的需求的多个所述算力节点中的一个为所述目标算力节点,包括:从所述第一个算力域中的多个满足所述第一业务的需求的算力节点中,确定除了对所述第一业务的可用值最大的算力节点之外的任意一个算力节点为所述目标算力节点。5.根据权利要求4所述的方法,其特征在于,所述从所述第一个算力域中的多个满足所述第一业务的需求的算力节点中,确定除了对第一业务的可用值最大的算力节点之外的任意一个算力节点为所述目标算力节点,包括:从所述第一个算力域中的多个满足所述第一业务的需求的算力节点中,确定对所述第一业务的可用值最小的算力节点为所述目标算力节点。6.根据权利要求2

5任一项所述的方法,其特征在于,所述采用第一算法,根据所述第
一业务的业务请求信息,计算所述算力域中的每个算力节点对所述第一业务的可用值,包括:根据所述第一业务的业务请求信息,获取所述用户设备所在的地理位置、所述第一业务的优先级、所述第一业务的计算类型、以及所述第一业务的算力大小需求;根据所述用户设备所在的地理位置、所述第一业务的优先级、所述第一业务的计算类型、所述第一业务的算力大小需求、预设的算力节点所能提供的计算类型、以及预设的算力节点所能提供的算力大小,计算所述算力域中的每个算力节点对所述第一业务的可用值。7.根据权利要求6所述的方法,其特征在于,所述根据所述用户设备所在的地理位置、所述第一业务的优先级、所述第一业务的计算类型、所述第一业务的算力大小需求、预设的算力节点所能提供的计算类型、以及预设的算力节点所能提供的算力大小,计算所述算力域中的每个算力节点对所述第一业务的可用值,包括:对所述算力域中的每个算力节点:根据所述用户设备所在的地理位置与所述算力节点所在的所述算力域的地理位置,计算所述用户设备与所述算力节点之间的网络传输时延;计算第一权重系数与所述网络传输时延的比值;计算第二权重系数与所述第一业务的优先级的和;根据所述第一业务的计算类型和所述算力节点所能提供的计算类型确定第一值;根据所述第一业务的算力大小需求和所述算力节点所能提供的算力大小确定第二值;根据所述第一权重系数与所述网络传输时延的比值、所述第二权重系数与所述第一业务的优先级的和、所述第一值、所述第二值、以及补偿系数,计算所述算力节点对所述第一业务的可用值。8.根据权利要求1所述的方法,其特征在于,所述根据所述用户设备所在的地理位置与算力网络中的各个算力域的地理位置之间的距离,将所述算力网络中的各个算力域按照由近及远的顺序进行排序,包括:计算所述用户设备所在的地理位置与算力网络中的各个算力域的地理位置之间的欧式距离;根据所述用户设备所在的地理位置与算力网络中的各个算力域的地理位置之间的欧式距离,将所述算力网络中的各个算力域按照由近及远的顺序进行排序。9.根据权利要求8所述的方法,其特征在于,所述计算所述用户设备所在的地理位置与算力网络中的各个算力域的地理位置之间的欧式距离之前,所述方法还包括:对每个所述算力域:根据所述算力域中包括的各个算力节点的地理位置,确定所述算力域的地理位置。10.根据权利要求9所述的方法,其特征在于,所述对每个所述算力域:根据所述算力域...

【专利技术属性】
技术研发人员:李建飞曹畅张帅何涛
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1