一种基于GPU空间资源共享的任务调度方法技术

技术编号：25834552 阅读：30 留言：0更新日期：2020-10-02 14:15

本公开提供了一种基于GPU空间资源共享的任务调度方法，涉及GPU任务调度的技术领域，启动一个新的任务，如果没有正在运行的任务，新任务将以独占模式启动；如果当前正在执行第一任务，根据性能模型和截止时间动态调整第一任务和新任务的资源使用；根据输出的每个时钟周期执行的指令数分派新任务，实现了高GPU资源利用率下的软实时调度，本公开解决了现有的并行GPU任务执行和资源共享的工作无法支持抢占式实时调度的问题，确保在GPU资源能够在并发任务之间以最大限度共享的同时，能够满足高优先级任务的截止时间；并发任务可以在单个SM上并行执行，以实现更好的GPU资源利用率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于GPU空间资源共享的任务调度方法
本公开涉及GPU任务调度的
，涉及一种基于GPU空间资源共享的任务调度方法。
技术介绍
本部分的陈述仅仅是提供了与本公开相关的
技术介绍
，并不必然构成现有技术。AI(ArtificialIntelligence，人工智能)和大数据时代，对于高端嵌入式系统和大规模并行数据密集型工作负载，GPU(GraphicsProcessingUnit，图形处理单元)已经成为一种很有前途的架构选择。然而，现有的嵌入式GPU不支持基于优先级的抢占，这对于GPU实时嵌入式系统来说是一个非常大的障碍。同时，为了满足严格的功率限制，高效的GPU资源管理也是至关重要的。新兴智能嵌入式和边缘计算系统往往需要高计算能力和实时任务处理能力。GPU体系结构已成为越来越受欢迎的选择，它使得数据密集型应用程序大规模并行执行。有许多现成的嵌入式GPU平台包括NVIDIAJetson系列和PX系列被用来建立人工智能机器人系统、自动车辆和无人驾驶飞机。然而普通GPU不支持基于优先级的抢占式调度。许多文献研究了实时GPU的调度问题，以使基于GPU的嵌入式系统在设计层面上能够满足实时要求。有研究通过嵌入式GPU设备的时间共享机制，在NVIDIAGPU驱动程序中提出了一种抢占式的EDF调度器原型。日前，基于软件的抢占机制已被提出，使其能在普通GPU上支持灵活的任务抢占和调度，其中GPU的任务代码转换支持运行时中断和抢占。本公开专利技术人发现，上述工作关注的重点是并行GPU任务的抢占机制和调...

【技术保护点】
1.一种基于GPU空间资源共享的评估方法，其特征在于，包括以下步骤：/n获取GPU的当前工作状态，预处理后得到支持GPU任务抢占和空间资源共享的GPU工作模式；/n采用马尔可夫链计算当前流处理器的状态，得到马尔可夫链的稳定状态向量；/n根据稳定状态向量，得到任务在运行期间处于计算状态的概率；/n在资源共享模式下，根据任务在运行期间处于计算状态的概率，得到在每个流处理器上分配预设个数的线程块时，每个时钟周期执行的指令数；/n将所有可能的资源分配方案下并行执行任务时，每个时钟周期执行的指令数作为评估结果输出并存储，用于运行时做出资源分配决策。/n

【技术特征摘要】
1.一种基于GPU空间资源共享的评估方法，其特征在于，包括以下步骤：
获取GPU的当前工作状态，预处理后得到支持GPU任务抢占和空间资源共享的GPU工作模式；
采用马尔可夫链计算当前流处理器的状态，得到马尔可夫链的稳定状态向量；
根据稳定状态向量，得到任务在运行期间处于计算状态的概率；
在资源共享模式下，根据任务在运行期间处于计算状态的概率，得到在每个流处理器上分配预设个数的线程块时，每个时钟周期执行的指令数；
将所有可能的资源分配方案下并行执行任务时，每个时钟周期执行的指令数作为评估结果输出并存储，用于运行时做出资源分配决策。

2.如权利要求1所述的基于GPU空间资源共享的评估方法，其特征在于，对GPU的运行状态进行预处理，在不访问GPU驱动程序代码的情况下，采用持久线程编程模式，在源代码或汇编代码级别支持GPU任务抢占和空间资源共享，具体为：
每个任务对象在一个流处理器上同时执行一个线程块，当一个任务对象完成了它的线程块，通过预设函数得到下一个要执行的线程块，直到任务的所有线程块都正常完成，通过预设的任务对象的数量来控制每个GPU任务的流处理器资源使用。

3.如权利要求2所述的基于GPU空间资源共享的评估方法，其特征在于，当一个高优先级的任务需要更多的资源来满足它的截止时间时，通过减少任务对象的数量的方式实现；
或者，当需要在任务执行完成之前停止此任务时，接收停止信号，在当前线程块结束执行后，所有的任务对象停止时，调用回调函数返回到CPU端；
或者，
如果需要增加分配给当前正在运行的任务的资源，首先通过设置停止信号来停止这个任务，然后为任务增加任务对象的数量并重新启动此任务。

4.如权利要求1所述的基于GPU空间资源共享的评估方法，其特征在于，每个流处理器上分配wk个线程块时任务k的每个时钟周期执行的指令数，具体为：

其中，表示两个任务处于不同状态的概率，是测量得到的每个任务在wk线程块单独...

【专利技术属性】
技术研发人员：鞠雷，于淼，薛鹏飞，郭山清，胡程瑜，
申请(专利权)人：山东大学，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人