一种任务流的资源调度方法、装置、电子设备及存储介质制造方法及图纸

技术编号:45537233 阅读:19 留言:0更新日期:2025-06-13 17:39
本发明专利技术提供一种任务流的资源调度方法、装置、电子设备及存储介质,该方法包括获取计算任务的初始有向无环图,根据初始有向无环图执行初始任务流,并监测初始任务流中每个任务节点的资源占用率,若检测到至少一个资源占用率大于或等于对应的预设占用率阈值,则对初始有向无环图进行迭代更新,得到当前有向无环图,迭代更新包括重新组合分配至任务节点的异构计算资源和更新任务节点的串并行关系至少之一,若未检测到资源占用率大于或等于对应的预设占用率阈值,则监测初始有向无环图的系统时延,以通过初始有向无环图的迭代更新降低系统时延;本发明专利技术提高异构计算资源分配的合理性和任务执行效率,降低了计算任务的系统时延。

【技术实现步骤摘要】

本申请涉及任务调度,尤其涉及一种任务流的资源调度方法、装置、电子设备及存储介质


技术介绍

1、近年来,深度神经网络(deep neural network,dnn)已成为推动人工智能技术发展的核心力量,广泛应用于自动驾驶、智能监控、语音识别、图像分类等多个领域。如今,多种深度学习框架,如tensorflow lite、pytorch mindspore等训练的模型可部署在带图形处理单元(graphics processing unit,gpu)算力的服务器上,也开始支持通过适配部署在带人工智能(artificial intelligence,ai)算力的边缘设备上。边缘计算使得智能设备能够在本地执行复杂的推理任务,避免了高延迟的云端处理,带动了ai边缘计算领域的发展。随着边缘计算具备ai算力,如何在边缘设备上提高端侧模型的部署效率和推理效率,成为模型部署研究的关键问题。

2、针对高效快速部署的问题,基于训练环境与运行环境的差异,提出了建立语法树抽象部署过程的解决方案。例如,将模型额外处理过程和推理过程通过语法树抽象,合并为一个目标代码,直接部本文档来自技高网...

【技术保护点】

1.一种任务流的资源调度方法,其特征在于,所述方法包括:

2.根据权利要求1所述的任务流的资源调度方法,其特征在于,通过所述初始有向无环图的迭代更新降低所述系统时延,包括:

3.根据权利要求2所述的任务流的资源调度方法,其特征在于,得到当前有向无环图之后,还包括:

4.根据权利要求1-3任一项所述的任务流的资源调度方法,其特征在于,重新组合分配至所述任务节点的异构计算资源,包括:

5.根据权利要求4所述的任务流的资源调度方法,其特征在于,重新组合分配至所述任务节点的异构计算资源和更新所述任务节点的串并行关系至少之一之前,还包括:

...

【技术特征摘要】

1.一种任务流的资源调度方法,其特征在于,所述方法包括:

2.根据权利要求1所述的任务流的资源调度方法,其特征在于,通过所述初始有向无环图的迭代更新降低所述系统时延,包括:

3.根据权利要求2所述的任务流的资源调度方法,其特征在于,得到当前有向无环图之后,还包括:

4.根据权利要求1-3任一项所述的任务流的资源调度方法,其特征在于,重新组合分配至所述任务节点的异构计算资源,包括:

5.根据权利要求4所述的任务流的资源调度方法,其特征在于,重新组合分配至所述任务节点的异构计算资源和更新所述任务节点的串并行关...

【专利技术属性】
技术研发人员:许成弟陈怡刘明
申请(专利权)人:中冶赛迪信息技术重庆有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1