一种面向GPU数据重用的存储计算协同调度方法及系统技术方案

技术编号：30017953 阅读：18 留言：0更新日期：2021-09-11 06:30

本发明专利技术公开了一种面向GPU数据重用的存储计算协同调度方法及系统，本发明专利技术方法包括有内核程序启动则将该内核程序的倒转标志翻转；在GPU的线程块调度器中，针对该内核程序的线程块调度，根据该内核程序的倒转标志在正向线程块派发策略和反向线程块派发策略中轮流选择一种线程块派发策略来从线程块待发射队列中选择线程块发射；在GPU驱动中，针对该内核程序的数据页替换，根据该内核程序的倒转标志在正向数据页替换策略和反向数据页替换策略中轮流选择其中一种来从GPU端数据页队列中选择GPU端数据页进行替换。本发明专利技术实现了线程块和数据页协同调度，通过重用共享数据来降低内存超额配置对系统性能的影响，能够有效提高系统的性能。的性能。的性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向GPU数据重用的存储计算协同调度方法及系统

[0001]本专利技术涉及计算机的计算调度技术，具体涉及一种面向GPU数据重用的存储计算协同调度方法及系统。

技术介绍

[0002]由于GPU具有很高的计算吞吐量和很好的可编程性，其已经被广泛用于包括机器学习、目标检测以及图像去噪等高性能领域。然而由于GPU上有限的内存空间已经无法容纳应用程序不断扩大的工作集(单位时间的GPU数据访问量)。统一虚拟内存和按需取页技术的引入为内存超额配置提供了很好的支持，但是由于CPU内存与GPU内存间存在额外的数据页传输，引起了系统性能的损失。因此如何减少这些多余的数据迁移对于性能的改善是至关重要的。在研究了大量的被测程序集后，我们发现有很多的应用程序中存在内核程序(Kernel)间数据共享的情况。而且对于大多数这样的程序，其中的每一个内核程序都按照相似的数据访问顺序去访问同一片数据区域。当GPU的内存无法容纳整个内核程序的工作集时，旧的数据页会被换出到CPU的内存中而需要的数据页会被取到GPU的内存中。当一个内核程序结束时只有最新访问的数据页会保留在GPU的内存中，而后续的内核程序启动后还会再去访问那些已经被换入到CPU内存中的数据页。我们发现虽然这些应用程序中的内核程序间存在大量的共享数据，但是当发生内存超额配置时这样的数据共享特性就会消失，进而引发系统性能的急剧下降。
[0003]有效地去使用GPU内存中现有的数据，是避免由页失效引起长时延开销的关键，在内存超额配置的情形下更是如此。图1展示了内核程序间存在数据共享的应...

【技术保护点】

【技术特征摘要】
1.一种面向GPU数据重用的存储计算协同调度方法，其特征在于，包括：1)在当前程序出现GPU内存容量超额、且内核程序间存在数据共享的条件下，检测是否有内核程序启动，若有内核程序启动则将该内核程序的倒转标志翻转；2)在GPU驱动中，针对该内核程序的数据页替换，根据该内核程序的倒转标志在正向数据页替换策略和反向数据页替换策略两种预设的数据页替换策略中来轮流选择其中一种数据页替换策略来从GPU端数据页队列中选择GPU端数据页进行替换，所述正向数据页替换策略和反向数据页替换策略选择GPU端数据页的方向不同；在GPU的线程块调度器中，针对该内核程序的线程块调度，根据该内核程序的倒转标志在正向线程块派发策略和反向线程块派发策略两种预设的线程块派发策略中来轮流选择其中一种线程块派发策略来从线程块待发射队列中选择线程块发射，所述正向线程块派发策略和反向线程块派发策略选择线程块的方向不同。2.根据权利要求1所述的面向GPU数据重用的存储计算协同调度方法，其特征在于，步骤1)中将该内核程序的倒转标志翻转包括：首先检测该内核程序的倒转标志是否已经存在，若该内核程序的倒转标志不存在，则为该内核程序初始化倒转标志，若该内核程序的倒转标志存在，则将该内核程序的倒转标志翻转。3.根据权利要求2所述的面向GPU数据重用的存储计算协同调度方法，其特征在于，所述初始化倒转标志时，倒转标志的初始化值为0或1。4.根据权利要求2所述的面向GPU数据重用的存储计算协同调度方法，其特征在于，所述将该内核程序的倒转标志翻转是指：若内核程序的倒转标志的原值为0，则将该内核程序的倒转标志从0变为1，若内核程序的倒转标志的原值为1，则将该内核程序的倒转标志从1变为0。5.根据权利要求1所述的面向GPU数据重用的存储计算协同调度方法，其特征在于，步骤2)中根据该内核程序的倒转标志在正向数据页替换策略和反向数据页替换策略两种预设的数据页替换策略中来轮流选择其中一种数据...

【专利技术属性】
技术研发人员：李晨，李宣佚，郭阳，鲁建壮，陈小文，刘胜，张洋，刘畅，曹壮，
申请(专利权)人：中国人民解放军国防科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人