计算资源的调度方法、装置、设备及存储介质制造方法及图纸

技术编号:37991382 阅读:8 留言:0更新日期:2023-06-30 10:05
本申请实施例提供了一种计算资源的调度方法、装置及电子设备,该方法包括:获取多个待调度算子中每个待调度算子的第一调度策略;将每个待调度算子的第一调度策略中的部分调度策略,确定为每个待调度算子的第二调度策略;确定每个待调度算子的第一运行时延记录;根据每个待调度算子的第一运行时延记录,预估每个待调度算子的第二运行时延记录;根据每个待调度算子的第一运行时延记录和第二运行时延记录,确定每个待调度算子的目标调度策略;目标运行调度策略为第一调度策略中的一个调度策略。略。略。

【技术实现步骤摘要】
计算资源的调度方法、装置、设备及存储介质


[0001]本专利技术涉及一种计算资源的调度方法,尤其涉及一种计算资源的调度方法、装置、电子设备及计算机存储介质。

技术介绍

[0002]目前深度学习网络部署运行到实际设备上时,会先对网络中的算子进行编译优化,即对算子进行自动调优,以使得深度学习网络的性能更优。目前自动调优的方法通常是利用机器学习算法作为代价模型,来建立调度参数和算子性能之间的关系,从而通过预测找出较优参数解。这种调度方式虽然可以得到调度参数的全局最优解,但由于缺乏一定的加速策略使得整个调优过程耗时较大,效率较低,并且由于机器学习算法本身需要进行多次训练才能具备一定的准确性,而算法训练也是一个较为耗时的过程。

技术实现思路

[0003]本专利技术实施例主要提供一种计算资源的调度方法、装置、电子设备及计算机存储介质。
[0004]本专利技术实施例提供了一种计算资源的调度方法,所述计算资源的调度方法包括:
[0005]获取多个待调度算子中每个待调度算子的第一调度策略;所述第一调度策略用于表示所述每个待调度算子的调度参数集合的多组取值,所述调度参数集合的每组取值包括所述调度参数集合中每个调度参数的一个取值;
[0006]将所述每个待调度算子的第一调度策略中的部分调度策略,确定为所述每个待调度算子的第二调度策略;
[0007]确定所述每个待调度算子的第一运行时延记录;所述第一运行时延记录为根据所述每个待调度算子的第二调度策略,得到的所述每个待调度算子的实际运行时延记录;
[0008]根据所述每个待调度算子的第一运行时延记录,预估所述每个待调度算子的第二运行时延记录;所述第二运行时延记录为根据所述每个待调度算子的第三调度策略,得到的所述每个待调度算子的运行时延记录;所述第三调度策略为所述第一调度策略中除所述第二调度策略外的其它调度策略;
[0009]根据所述每个待调度算子的第一运行时延记录和第二运行时延记录,确定所述每个待调度算子的目标调度策略;所述目标运行调度策略为所述第一调度策略中的一个调度策略。
[0010]上述方案中,所述每个待调度算子的调度参数包括:输入通道参数;所述将所述每个待调度算子的第一调度策略中的部分调度策略,确定为所述每个待调度算子的第二调度策略,包括:确定所述每个待调度算子的输入通道参数的第一取值;根据所述每个待调度算子的输入通道参数的第一取值,确定所述每个待调度算子的第一调度策略中第一类型的调度策略;所述第一类型的调度策略表示所述每个待调度算子的输入通道参数的取值为所述第一取值的第一调度策略;将所述每个待调度算子的第一调度策略中第一类型的调度策
略,确定为所述每个待调度算子的第二调度策略。
[0011]可以看出,根据待调度算子的输入通道参数的第一取值,对待调度算子的第一调度策略进行采样,即确定待调度算子的第一调度策略中第一类型的调度策略,将第一类型的调度策略确定为待调度算子的第二调度策略,使得仅需要确定每个待调度算子在第二调度策略下的实际运行时延记录,能够有效降低待调度算子在调度过程中消耗的时间,提高待调度算子的调度效率。
[0012]上述方案中,所述每个待调度算子的调度参数还包括:输出通道参数;所述在确定所述每个待调度算子的输入通道参数的第一取值之前,所述方法还包括:根据所述多个待调度算子之间的依赖关系,确定所述每个待调度算子的依赖的算子;确定所述每个待调度算子的依赖的算子的输出通道参数的第二取值;所述确定所述每个待调度算子的输入通道参数的第一取值,包括:将所述每个待调度算子的依赖的算子的输出通道参数的第二取值,确定为所述每个待调度算子的输入通道参数的第一取值。
[0013]可以看出,基于每个待调度算子的依赖的算子的输出通道参数的第二取值,确定待调度算子的输入通道参数的第一取值,能够降低待调度算子做数据转换的运行开销。
[0014]上述方案中,所述每个待调度算子的调度参数包括:输出通道参数;所述确定所述每个待调度算子的第一运行时延记录,包括:确定所述每个待调度算子的运行时延,所述每个待调度算子的运行时延表示根据所述每个待调度算子的第二调度策略,实际运行所述每个待调度算子所需的时间;确定所述每个待调度算子的第二调度策略的类型;所述第二调度策略的类型是根据所述每个待调度算子的输出通道参数的取值确定的;根据所述每个待调度算子的第二调度策略的类型,以及所述每个待调度算子的运行时延,确定所述每个待调度算子在各个类型的第二调度策略下的目标运行时延;所述目标运行时延表示所述每个待调度算子在每个类型的调度策略下满足第一预设条件的运行时延,所述第一预设条件包括:所述每个待调度算子在每个类型的调度策略下的运行时延小于第一阈值;根据所述每个待调度算子在各个类型的第二调度策略下的目标运行时延,确定所述每个待调度算子的第一运行时延记录。
[0015]可以看出,通过确定每个待调度算子在各个类型的第二调度策略下的目标运行时延,可以得到每个待调度算子的第一运行时延记录,使得根据每个待调度算子的第一运行时延记录,预估每个待调度算子的第二运行时延记录的准确性更高。
[0016]上述方案中,所述每个待调度算子的调度参数包括:输入通道参数和输出通道参数;所述根据所述每个待调度算子的第一运行时延记录,预估所述每个待调度算子的第二运行时延记录,包括:确定所述每个待调度算子的第三调度策略的类型,所述第三调度策略的类型是根据所述每个待调度算子的输入通道参数和输出通道参数的取值确定的;根据所述每个待调度算子的第三调度策略的类型,以及所述每个待调度算子的第一运行时延记录,预估所述每个待调度算子在各个类型的第三调度策略下的目标运行时延;所述目标运行时延表示所述每个待调度算子在每个类型的调度策略下满足第一预设条件的运行时延,所述第一预设条件包括:所述每个待调度算子在每个类型的调度策略下的运行时延小于第一阈值;根据所述每个待调度算子在各个类型的第三调度策略下的目标运行时延,确定所述每个待调度算子的第二运行时延记录。
[0017]可以看出,基于每个待调度算子的第三调度策略的类型,以及每个待调度算子的
第一运行时延记录,可以预估每个待调度算子在各个类型的第三调度策略下的目标运行时延,从而得到每个待调度算子的第二运行时延记录,能够有效降低待调度算子在调度过程中消耗的时间,提高待调度算子的调度效率。
[0018]上述方案中,所述根据所述每个待调度算子的第一运行时延记录和第二运行时延记录,确定所述每个待调度算子的目标调度策略,包括:根据所述每个待调度算子的第一运行时延记录和第二运行时延记录,确定所述每个待调度算子的候选调度策略;所述每个待调度算子的候选调度策略为所述第一调度策略中的调度策略;在所述每个待调度算子的候选调度策略为所述每个待调度算子的第二调度策略的情况下,将所述每个待调度算子的候选调度策略确定为所述每个待调度算子的目标调度策略。
[0019]可以看出,根据每个待调度算子的第一运行时延记录和第二运行时延记录,确定每个待调度算子的候选调度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算资源调度方法,其特征在于,所述方法包括:获取多个待调度算子中每个待调度算子的第一调度策略;所述第一调度策略用于表示所述每个待调度算子的调度参数集合的多组取值,所述调度参数集合的每组取值包括所述调度参数集合中每个调度参数的一个取值;将所述每个待调度算子的第一调度策略中的部分调度策略,确定为所述每个待调度算子的第二调度策略;确定所述每个待调度算子的第一运行时延记录;所述第一运行时延记录为根据所述每个待调度算子的第二调度策略,得到的所述每个待调度算子的实际运行时延记录;根据所述每个待调度算子的第一运行时延记录,预估所述每个待调度算子的第二运行时延记录;所述第二运行时延记录为根据所述每个待调度算子的第三调度策略,得到的所述每个待调度算子的运行时延记录;所述第三调度策略为所述第一调度策略中除所述第二调度策略外的其它调度策略;根据所述每个待调度算子的第一运行时延记录和第二运行时延记录,确定所述每个待调度算子的目标调度策略;所述目标运行调度策略为所述第一调度策略中的一个调度策略。2.根据权利要求1所述的方法,其特征在于,所述每个待调度算子的调度参数包括:输入通道参数;所述将所述每个待调度算子的第一调度策略中的部分调度策略,确定为所述每个待调度算子的第二调度策略,包括:确定所述每个待调度算子的输入通道参数的第一取值;根据所述每个待调度算子的输入通道参数的第一取值,确定所述每个待调度算子的第一调度策略中第一类型的调度策略;所述第一类型的调度策略表示所述每个待调度算子的输入通道参数的取值为所述第一取值的第一调度策略;将所述每个待调度算子的第一调度策略中第一类型的调度策略,确定为所述每个待调度算子的第二调度策略。3.根据权利要求2所述的方法,其特征在于,所述每个待调度算子的调度参数还包括:输出通道参数;所述在确定所述每个待调度算子的输入通道参数的第一取值之前,所述方法还包括:根据所述多个待调度算子之间的依赖关系,确定所述每个待调度算子的依赖的算子;确定所述每个待调度算子的依赖的算子的输出通道参数的第二取值;所述确定所述每个待调度算子的输入通道参数的第一取值,包括:将所述每个待调度算子的依赖的算子的输出通道参数的第二取值,确定为所述每个待调度算子的输入通道参数的第一取值。4.根据权利要求1所述的方法,其特征在于,所述每个待调度算子的调度参数包括:输出通道参数;所述确定所述每个待调度算子的第一运行时延记录,包括:确定所述每个待调度算子的运行时延,所述每个待调度算子的运行时延表示根据所述每个待调度算子的第二调度策略,实际运行所述每个待调度算子所需的时间;确定所述每个待调度算子的第二调度策略的类型;所述第二调度策略的类型是根据所
述每个待调度算子的输出通道参数的取值确定的;根据所述每个待调度算子的第二调度策略的类型,以及所述每个待调度算子的运行时延,确定所述每个待调度算子在各个类型的第二调度策略下的目标运行时延;所述目标运行时延表示所述每个待调度算子在每个类型的调度策略下满足第一预设条件的运行时延,所述第一预设条件包括:所述每个待调度算子在每个类型的调度策略下的运行时延小于第一阈值;根据所述每个待调度算子在各个类型的第二调度策略下的目标运行时延,确定所述每个待调度算子的第一运行时延记录。5.根据权利要求1所述的方法,其特征在于,所述每个待调度算子的调度参数包括:输入通道参数和输出通道参数;所述根据所述每个待调度算子的第一运行时...

【专利技术属性】
技术研发人员:刘兴祥赵振阳李晓伟刘磊周志德江贺
申请(专利权)人:深信服科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1