一种基于图神经网络的异构计算平台任务调度方法技术

技术编号：40903926 阅读：3 留言：0更新日期：2024-04-18 14:35

本发明专利技术属于任务调度技术领域，本发明专利技术公开了一种基于图神经网络的异构计算平台任务调度方法，所述任务调度方法包括步骤：基于资源信息和任务属性进行抽象建模；以任务平均执行时间最小化为目标；任务调度模型框架设计；利于图神经网络处理任务状态编码，把任务状态信息写入到向量中；任务调度决策模型训练；任务调度模型训练完成后，把任务特征和资源特征作为参数输入到任务决策网络,确定任务调度的最优解。通过改进异构环境下任务调度算法，提出了对任务和资源的属性来对任务执行抽象建模，结合神经网络对任务和资源计算可伸缩状态的信息编码，任务的整体完成时间与用户体验感明显提高。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及任务调度，更具体地说，本专利技术涉及一种基于图神经网络的异构计算平台任务调度方法。

技术介绍

1、随着云计算业务的发展，原先的通用计算服务器资源明显已不能满足目前超强计算类应用的需求。故云计算由之前的通用计算资源的设计发展成目前拥有异构计算(gpu/fpga/tpu等)资源池能力的资源，以满足目前高性能计算应用的需求。由不同计算资源组成的异构计算环境有很多优点，如计算资源丰富、系统架构灵活多变、处理并行任务能力强等优点，在云计算、物联网与数据平台得到广泛的应用。

2、异构计算平台下由于存在多种类型或规格的计算资源，这些资源具有不同的计算能力、处理速度、存储容量等特性。在面对计算任务时，如何有效地利用这些异构计算资源是一个重要的挑战。在异构环境下设计高效节能的任务调度方法，最大限度利用异构资源和提高算法寻找全局最优解的效率成了主要解决方案。

3、在异构计算平台下，任务调度还面临一个挑战，即缺乏全局信息，这意味着调度器无法完全了解整个计算平台上的所有任务和资源情况，因为异构计算平台由多个独立的子系统组成，每个子系统可能有自己的调度策略和资源管理，由于缺乏全局信息，异构计算平台的任务调度器往往需要依赖局部信息和启发式算法进行决策，主要有遗传算法、蚁群算法、粒子群算法和模拟退火算法，每个算法各有利弊，能针对性解决某一目标的问题，遗传算法优点是具有强力的全局搜索和并行能力强，但在任务调度的算法效率和算法解的多样性上还有很多不足；蚁群算法和粒子群算法类似，具有搜索速度快的优点，同时容易陷入极值造成局部最

技术实现思路

1、为了克服现有技术的上述缺陷，本专利技术提供一种基于图神经网络的异构计算平台任务调度方法，所述任务调度方法包括步骤：

2、步骤一，基于资源信息和任务属性进行抽象建模，确定调度系统使用的算法模型，以及任务调度的优化目标；

3、步骤二，任务调度的目标优化，以任务平均执行时间最小化为目标；

4、步骤三，任务调度模型框架设计，设计异构环境中任务调度框架和任务状态编码，先进行任务调度模型框架的设计，根据图神经网络和ddpg结合设计异构环境的任务调度框架；

5、步骤四，利于图神经网络处理任务状态编码，把任务状态信息写入到向量中；

6、步骤五，任务调度决策模型训练，利用步骤三的异构资源任务调度框架和步骤四任务状态信息编码的输入，在智能体接收并进行处理，不断更新迭代状态信息，状态主要是任务状态和异构资源状态信息；

7、步骤六，任务调度模型训练完成后，把任务特征和资源特征作为参数输入到任务决策网络，利用任务编码计算出调度优先级排序最高的子任务和任务需要的资源，从而确定任务调度的最优解。

8、优选地，步骤一中抽象建模具体包括：

9、定义异构环境中服务器数量集合是m，m＝{m1，m2，…，m|m|}其中，|m|表示服务器的最大数量；

10、定义任务的集合是d，ptask＝{d1，d2，…，d|d|}，其中，ptask是初始化任务堆栈时，要传递任务代码的起始指针，|d|表示任务的最大数量；

11、把任意一个任务分割成个子任务，其中任意一个任务标记为dt，集合是其中，nt是子任务最大数量，是任务dt排第i的子任务；

12、子任务的任务规模标记为定义ktype＝{kgpu，kcpu，kdsp，kfpga}，其中，kgpu，kcpu，kdsp，kfpga分别是gpu、cpu、dsp与fpga；

13、定义是服务器mm的第o个用于计算的资源，该资源单位时间中处理任务能力是是子任务所需的资源，子任务在资源中完成所需的时间是计算公式是：

14、

15、把子任务和子任务的传输时间标记为

16、优选地，所述的计算公式是：

17、

18、公式中，是子任务执行结束的中间结果的大小，和分别表示子任务和运行时服务器的网络的带宽大小，则是标识子任务和是否在同一个服务器上执行，是同一服务器，则不是同一服务器；

19、两个相邻的子任务被分配到同一服务器运行时，根据得出传输开销是可以忽略不计的；

20、否则，服务器的网络带宽决定资源间传输的开销大小。

21、优选地，步骤二中，将所述子任务在资源里的开始运行的时间定为在子任务开始执行时，资源已经完成子任务的前面相邻子任务是空闲状态。

22、优选地，假设所述资源最早的空间状态的时间是所述子任务的最终完成时间是tfinish，t，j，所述子任务的实际开始执行时间计算公式为：

23、

24、所述tfinish，t，i的计算公式为：

25、

26、优选地，所述单任务dt的最终完成时间是所有子任务完成时间的最大值：

27、

28、每个所述单任务dt完成所需的总时间是tsys：

29、

30、以所述子任务平均执行时间最小化为目标，优化目标的模型公式是：

31、

32、优选地，步骤四中，设定所述任务dt中包含的子任务的特征向量是任意子任务进行编码的构建方法是

33、根据传递信息的方式，所述子任务是集合前面所有节点的信息，所述子任务的嵌入向量的计算公式是：

34、

35、其中，嵌入向量主要是利用两个神经网络的非线性函数来实现，分别是a(.)和b(.)，所述子任务的前面节点用非线性聚合得到的嵌入信息和向量相加，计算出子任务的嵌入向量值，ω∈a(i)表示前面节点的集合a(i)的嵌入向量的加权和，表示一个神经网络模型，任务的嵌入向量聚合包含的所有子任务的嵌入，计算方式相同。

36、优选地，步骤五中任务类型和资源类型存在多样化，任务集合为泛化动态多任务集合。

37、优选地，把准备调度的子任务状态信息设置为其中，是任务dt在时刻γ的所有准备调度子任务的信息集合。

38、优选地，设计任务调度的算法具有单步更新参数值的特点，即每步都更新生成即时参数值，目标是缩短任务平均执行完的时间，计算公式是：

39、

40、公式中是任务dt中排在第i位的子任务规模，α是智能参数，是服务器mm的资源o的处理能力，是子任务在资源上运行之前要等待的待调度时间，用于调节调度环节的等待和执行的时间进而控制智能模块的计算收敛方向。

41、本专利技术一种基于图神经网络的异构计算平台任务调度方法的技术效果和优点：

42、1.通过改进异构环境下任务调度算法，提出了对任务和资源的属性来对任务执行抽象建模，结合神经网络对任务和资源计算可伸缩状态的信息编码，与原有的dd本文档来自技高网...

【技术保护点】

1.一种基于图神经网络的异构计算平台任务调度方法，其特征在于，所述任务调度方法包括步骤：

2.根据权利要求1所述的一种基于图神经网络的异构计算平台任务调度方法，其特征在于，步骤一中抽象建模具体包括：

3.根据权利要求2所述的一种基于图神经网络的异构计算平台任务调度方法，其特征在于，所述的计算公式是：

4.根据权利要求3所述的一种基于图神经网络的异构计算平台任务调度方法，其特征在于，步骤二中，将所述子任务在资源里的开始运行的时间定为在子任务开始执行时，资源已经完成子任务的前面相邻子任务是空闲状态。

5.根据权利要求4所述的一种基于图神经网络的异构计算平台任务调度方法，其特征在于，假设所述资源最早的空间状态的时间是所述子任务的最终完成时间是Tfinish,t,j，所述子任务的实际开始执行时间计算公式为：

6.根据权利要求5所述的一种基于图神经网络的异构计算平台任务调度方法，其特征在于，所述单任务Dt的最终完成时间是所有子任务完成时间的最大值Tfinish,t：

7.根据权利要求6所述的一种基于图神经网络的异构计算

8.根据权利要求1所述的一种基于图神经网络的异构计算平台任务调度方法，其特征在于，步骤五中任务类型和资源类型存在多样化，任务集合为泛化动态多任务集合。

9.根据权利要求8所述的一种基于图神经网络的异构计算平台任务调度方法，其特征在于，把准备调度的子任务状态信息设置为其中，是任务Dt在时刻γ的所有准备调度子任务的信息集合。

10.根据权利要求9所述的一种基于图神经网络的异构计算平台任务调度方法，其特征在于，设计任务调度的算法具有单步更新参数值的特点，即每步都更新生成即时参数值，目标是缩短任务平均执行完的时间r，计算公式是：

...

【技术特征摘要】

1.一种基于图神经网络的异构计算平台任务调度方法，其特征在于，所述任务调度方法包括步骤：

2.根据权利要求1所述的一种基于图神经网络的异构计算平台任务调度方法，其特征在于，步骤一中抽象建模具体包括：

3.根据权利要求2所述的一种基于图神经网络的异构计算平台任务调度方法，其特征在于，所述的计算公式是：

5.根据权利要求4所述的一种基于图神经网络的异构计算平台任务调度方法，其特征在于，假设所述资源最早的空间状态的时间是所述子任务的最终完成时间是tfinish,t,j，所述子任务的实际开始执行时间计算公式为：

6.根据权利要求5所述的一种基于图神经网络的异构计算平台任务调度方...

【专利技术属性】
技术研发人员：杨亚珍，董明高，潘晓东，吴晓清，李伟泽，
申请(专利权)人：天翼云科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人