算力任务调度方法及装置、计算机可读存储介质制造方法及图纸

技术编号:39132843 阅读:7 留言:0更新日期:2023-10-23 14:51
本发明专利技术提供了一种算力任务调度方法及装置、计算机可读存储介质,属于算力网络技术领域。算力任务调度方法,应用于第一设备,包括:获取并广播待调度的算力任务的任务需求,所述任务需求至少包括所述算力任务的存储需求和计算需求;若在预设时间内接收到计算设备返回的闲置资源信息,根据所述闲置资源信息确定完成所述算力任务的目标计算设备,所述闲置资源信息包括所述计算设备的存储资源的信息和计算能力的信息;将所述算力任务发送给所述目标计算设备;接收所述目标计算设备返回的所述算力任务的计算结果。本发明专利技术的技术方案能够使得端侧的闲置资源得到合理有效的使用。端侧的闲置资源得到合理有效的使用。端侧的闲置资源得到合理有效的使用。

【技术实现步骤摘要】
算力任务调度方法及装置、计算机可读存储介质


[0001]本专利技术涉及算力网络
,特别是指一种算力任务调度方法及装置、计算机可读存储介质。

技术介绍

[0002]随着深度学习以及智能设备的迅速发展,虚拟现实、自动驾驶、人脸识别等智能应用服务已经在我们身边广泛应用,这些应用都需要算力资源来完成。在智能算法研究不断突破和提升的过程中,对于算力的需求也在同步增加。如果采用集中式计算,如云计算,虽然云中心算力丰富,但是会耗费越来越多的网络带宽资源,并引入传输时延。如果采用端侧计算,目前端侧智能设备的算力已经得到大幅提升,但是如果无限制的跟随算法算力需求的提升来提高端侧设备的算力,一方面会带来智能设备制造成本的提升,另一方面设备更新周期会越来越短,从而造成浪费。
[0003]目前已经部署了大量具有丰富算力资源的端侧智能设备,如摄像头、智能音箱、智能汽车等,这些设备会存在大量的算力闲置时段,随着算力网络的发展,会将云、边、端的资源进行整合,但是算力协同还处于起步阶段,对端侧算力的调用、端侧协同机制和传输方法鲜有涉及,因此研究如何通过端侧算力共享,发挥闲置端侧算力效用具有十分重要的意义。

技术实现思路

[0004]本专利技术要解决的技术问题是提供一种算力任务调度方法及装置、计算机可读存储介质,能够使得端侧的闲置资源得到合理有效的使用。
[0005]为解决上述技术问题,本专利技术的实施例提供技术方案如下:
[0006]一方面,提供一种算力任务调度方法,应用于第一设备,包括:
[0007]获取并广播待调度的算力任务的任务需求,所述任务需求至少包括所述算力任务的存储需求和计算需求;
[0008]若在预设时间内接收到计算设备返回的闲置资源信息,根据所述闲置资源信息确定完成所述算力任务的目标计算设备,所述闲置资源信息包括所述计算设备的存储资源的信息和计算能力的信息,所述闲置资源信息为所述计算设备判断自身能够满足所述任务需求后返回,所述目标计算设备选自返回闲置资源信息的计算设备;
[0009]将所述算力任务发送给所述目标计算设备;
[0010]接收所述目标计算设备返回的所述算力任务的计算结果。
[0011]一些实施例中,所述存储需求包括:所述算力任务的全部数据大小、计算设备加载所述算力任务的数据所需的内存容量;
[0012]所述计算需求包括:整数运算次数和浮点数运算次数;
[0013]所述存储需求用于所述计算设备判断自身的存储资源是否能够满足所述存储需求,所述计算需求用于所述计算设备判断自身的计算能力是否能够满足所述计算需求。
[0014]一些实施例中,所述任务需求还包括所述算力任务的时延需求,所述时延需求用
于所述计算设备判断自身是否能够在所述时延需求要求的时间内完成所述计算需求。
[0015]一些实施例中,所述任务需求还包括所述算力任务的时延需求,所述根据所述闲置资源信息确定完成所述算力任务的目标计算设备包括:
[0016]根据所述闲置资源信息确定存储资源满足所述存储需求和计算能力满足所述计算需求的计算设备为候选计算设备;
[0017]根据所述候选计算设备与所述第一设备之间的信息交互速率、所述计算能力和所述任务需求计算所述候选计算设备完成所述算力任务的时延;
[0018]确定时延满足所述时延需求的多个候选计算设备;
[0019]将所述多个候选计算设备中时延最小的候选计算设备确定为目标计算设备。
[0020]一些实施例中,所述任务需求还包括所述算力任务的功耗需求,所述闲置资源信息还包括所述计算设备的功率,所述根据所述闲置资源信息确定完成所述算力任务的目标计算设备包括:
[0021]确定时延满足所述时延需求的多个候选计算设备之后,根据所述计算设备的功率和计算能力、所述算力任务的计算需求计算所述多个候选计算设备完成所述算力任务的功耗;
[0022]将所述多个候选计算设备中功耗最小的候选计算设备确定为目标计算设备。
[0023]一些实施例中,所述根据所述候选计算设备与所述第一设备之间的信息交互速率、所述计算能力和所述任务需求计算所述候选计算设备完成所述算力任务的时延包括:
[0024]根据所述信息交互速率计算所述第一设备和所述候选计算设备之间传递所述闲置资源信息和所述任务需求所需要的第一时长;
[0025]根据所述信息交互速率和所述存储需求计算所述第一设备和所述候选计算设备之间传递所述算力任务的全部数据所需要的第一传递时长;
[0026]根据所述计算需求和所述计算能力计算所述候选计算设备计算所述算力任务所需要的运算时长;
[0027]根据所述信息交互速率计算所述第一设备和所述候选计算设备之间传递所述算力任务的计算结果所需要的第二传递时长;
[0028]根据所述第一时长、所述第一传递时长、所述运算时长和所述第二传递时长确定所述时延。
[0029]本专利技术实施例还提供了一种算力任务调度方法,应用于计算设备,包括:
[0030]接收第一设备广播的待调度的算力任务的任务需求,所述任务需求至少包括所述算力任务的存储需求和计算需求;
[0031]判断自身是否能够满足所述存储需求和计算需求;
[0032]在判断自身能够满足所述存储需求和计算需求后,向所述第一设备发送闲置资源信息,所述闲置资源信息包括所述计算设备的存储资源的信息和计算能力的信息。
[0033]一些实施例中,在所述计算设备为所述第一设备确定的目标计算设备的情况下,向所述第一设备发送闲置资源信息之后,所述方法还包括:
[0034]接收所述第一设备发送的所述算力任务;
[0035]完成所述算力任务的计算,并将所述算力任务的计算结果发送给所述第一设备。
[0036]一些实施例中,所述存储需求包括:所述算力任务的全部数据大小、计算设备加载
所述算力任务的数据所需的内存容量;所述计算需求包括:整数运算次数和浮点数运算次数;所述判断自身是否能够满足所述存储需求和计算需求包括:
[0037]判断所述计算设备的空闲存储空间的大小是否大于所述算力任务的全部数据大小、所述计算设备的内存是否大于加载所述算力任务的数据所需的内存容量,所述计算设备的计算能力是否能完成所述计算需求。
[0038]一些实施例中,所述任务需求还包括所述算力任务的时延需求,所述判断自身是否能够满足所述存储需求和计算需求还包括:
[0039]判断所述计算设备是否能够在所述时延需求要求的时间内完成所述计算需求。
[0040]本专利技术实施例还提供了一种算力任务调度装置,应用于第一设备,包括处理器和收发机,
[0041]所述处理器用于获取并广播待调度的算力任务的任务需求,所述任务需求至少包括所述算力任务的存储需求和计算需求;若在预设时间内接收到计算设备返回的闲置资源信息,根据所述闲置资源信息确定完成所述算力任务的目标计算设备,所述闲置资源信息包括所述计算设备的存储资本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种算力任务调度方法,其特征在于,应用于第一设备,包括:获取并广播待调度的算力任务的任务需求,所述任务需求至少包括所述算力任务的存储需求和计算需求;若在预设时间内接收到计算设备返回的闲置资源信息,根据所述闲置资源信息确定完成所述算力任务的目标计算设备,所述闲置资源信息包括所述计算设备的存储资源的信息和计算能力的信息,所述闲置资源信息为所述计算设备判断自身能够满足所述任务需求后返回,所述目标计算设备选自返回闲置资源信息的计算设备;将所述算力任务发送给所述目标计算设备;接收所述目标计算设备返回的所述算力任务的计算结果。2.根据权利要求1所述的方法,其特征在于,所述存储需求包括:所述算力任务的全部数据大小、计算设备加载所述算力任务的数据所需的内存容量;所述计算需求包括:整数运算次数和浮点数运算次数;所述存储需求用于所述计算设备判断自身的存储资源是否能够满足所述存储需求,所述计算需求用于所述计算设备判断自身的计算能力是否能够满足所述计算需求。3.根据权利要求1所述的方法,其特征在于,所述任务需求还包括所述算力任务的时延需求,所述时延需求用于所述计算设备判断自身是否能够在所述时延需求要求的时间内完成所述计算需求。4.根据权利要求3所述的方法,其特征在于,所述任务需求还包括所述算力任务的时延需求,所述根据所述闲置资源信息确定完成所述算力任务的目标计算设备包括:根据所述闲置资源信息确定存储资源满足所述存储需求和计算能力满足所述计算需求的计算设备为候选计算设备;根据所述候选计算设备与所述第一设备之间的信息交互速率、所述计算能力和所述任务需求计算所述候选计算设备完成所述算力任务的时延;确定时延满足所述时延需求的多个候选计算设备;将所述多个候选计算设备中时延最小的候选计算设备确定为目标计算设备。5.根据权利要求4所述的方法,其特征在于,所述任务需求还包括所述算力任务的功耗需求,所述闲置资源信息还包括所述计算设备的功率,所述根据所述闲置资源信息确定完成所述算力任务的目标计算设备包括:确定时延满足所述时延需求的多个候选计算设备之后,根据所述计算设备的功率和计算能力、所述算力任务的计算需求计算所述多个候选计算设备完成所述算力任务的功耗;将所述多个候选计算设备中功耗最小的候选计算设备确定为目标计算设备。6.根据权利要求4或5所述的方法,其特征在于,所述根据所述候选计算设备与所述第一设备之间的信息交互速率、所述计算能力和所述任务需求计算所述候选计算设备完成所述算力任务的时延包括:根据所述信息交互速率计算所述第一设备和所述候选计算设备之间传递所述闲置资源信息和所述任务需求所需要的第一时长;根据所述信息交互速率和所述存储需求计算所述第一设备和所述候选计算设备之间传递所述算力任务的全部数据所需要的第一传递时长;根据所述计算需求和所述计算能力计算所述候选计算设备计算所述算力任务所需要
的运算时长;根据所述信息交互速率计算所述第一设备和所述候选计算设备之间传递所述算力任务的计算结果所需要的第二传递时长;根据所述第一时长、所述第一传递时长、所述运算时长和所述第二传递时长确定所述时延。...

【专利技术属性】
技术研发人员:祝淑琼徐青青王琪
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1