System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种单系统同时支持多GPU工作的方法及系统技术方案_技高网

一种单系统同时支持多GPU工作的方法及系统技术方案

技术编号:41202947 阅读:2 留言:0更新日期:2024-05-07 22:28
本发明专利技术提供了单系统同时支持多GPU工作的方法及系统,方法在单系统机器上运行,获取多个GPU单元的运行信息;接收待计算任务以及调度信息;根据调度信息获取对应的GPU单元;如果获取到的GPU单元满足待计算任务的计算要求,将待计算任务分发给GPU单元处理;如果获取到的GPU单元不能满足待计算任务的计算要求,根据各个GPU单元的运行信息获取最优的GPU单元,将待计算任务分发给最优的GPU单元处理。该方法支持多GPU单元同时计算,克服了单GPU资源存在计算资源紧张的缺陷,提高了整个机器的计算速率。

【技术实现步骤摘要】

本专利技术属于计算机,具体涉及一种单系统同时支持多gpu工作的方法及系统。


技术介绍

1、图形处理器(graphics processing unit,缩写gpu),又称显示核心、视觉处理器、显示芯片,专门在个人电脑、工作站、游戏机等移动设备上进行图像图形相关运算。

2、目前一些单系统机器上只使用一个gpu单元,而随着图计算需求的增大,单个gpu单元的机器已经不能满足大部分的图计算需求,经常会出现计算资源紧张,导致计算速度慢的情况。


技术实现思路

1、针对现有技术中的缺陷,本专利技术提供一种单系统同时支持多gpu工作的方法及系统,克服了单gpu资源存在计算资源紧张的缺陷,提高了整个机器的计算速率。

2、第一方面,一种单系统同时支持多gpu工作的方法,在单系统机器上运行;方法包括:

3、获取多个gpu单元的运行信息;gpu单元部署在云端和/或本地;

4、接收待计算任务以及调度信息;

5、根据调度信息获取对应的gpu单元;

6、如果获取到的gpu单元满足待计算任务的计算要求,将待计算任务分发给gpu单元处理;

7、如果获取到的gpu单元不能满足待计算任务的计算要求,根据各个gpu单元的运行信息获取最优的gpu单元,将待计算任务分发给最优的gpu单元处理。

8、进一步地,运行信息包括gpu单元的内存空闲大小、内存占用比例、正在处理的计算任务数量、处理等待时间;

9、调度信息包括与待计算任务关联的gpu单元id。

10、进一步地,判断gpu单元是否满足待计算任务的计算要求具体包括:

11、解析待计算任务,以得到任务主体和任务信息;任务信息包括处理任务主体需要的内存和时间;

12、当gpu单元的内存占用比例小于内存占用最大值、且内存空闲大小大于处理任务主体需要的内存时,判断gpu单元满足待计算任务的计算要求;

13、当gpu单元的内存占用比例大于内存占用最大值,gpu单元的处理等待时间大于等待时间阈值,正在处理的计算任务数量大于执行任务阈值,或gpu单元的内存占用比例小于内存占用最大值、但内存空闲大小小于处理任务主体需要的内存时,判断gpu单元不满足待计算任务的计算要求。

14、进一步地,gpu单元中设有先进先出队列;gpu单元正在处理的计算任务按照接收顺序依次排列在先进先出队列中;定义先进先出队列的长度为正在处理的计算任务数量。

15、进一步地,在将计算任务分发给gpu单元处理之后,还包括:

16、在gpu单元的处理等待时间中累加该计算任务处理任务主体需要的时间;

17、当gpu单元中一计算任务处理完后,在gpu单元的处理等待时间中减去该计算任务处理任务主体需要的时间。

18、第二方面,一种单系统同时支持多gpu工作的系统,部署在单系统机器上;系统包括:

19、采集单元:用于获取多个gpu单元的运行信息;gpu单元部署在云端和/或本地;接收待计算任务以及调度信息;

20、调度单元:用于根据调度信息获取对应的gpu单元;如果获取到的gpu单元满足待计算任务的计算要求,将待计算任务分发给gpu单元处理;如果获取到的gpu单元不能满足待计算任务的计算要求,根据各个gpu单元的运行信息获取最优的gpu单元,将待计算任务分发给最优的gpu单元处理。

21、进一步地,运行信息包括gpu单元的内存空闲大小、内存占用比例、正在处理的计算任务数量、处理等待时间;

22、调度信息包括与待计算任务关联的gpu单元id。

23、进一步地,调度单元具体用于:

24、解析待计算任务,以得到任务主体和任务信息;任务信息包括处理任务主体需要的内存和时间;

25、当gpu单元的内存占用比例小于内存占用最大值、且内存空闲大小大于处理任务主体需要的内存时,判断gpu单元满足待计算任务的计算要求;

26、当gpu单元的内存占用比例大于内存占用最大值,gpu单元的处理等待时间大于等待时间阈值,正在处理的计算任务数量大于执行任务阈值,或gpu单元的内存占用比例小于内存占用最大值、但内存空闲大小小于处理任务主体需要的内存时,判断gpu单元不满足待计算任务的计算要求。

27、进一步地,gpu单元中设有先进先出队列;gpu单元正在处理的计算任务按照接收顺序依次排列在先进先出队列中;定义先进先出队列的长度为正在处理的计算任务数量。

28、进一步地,调度单元还用于:

29、在将计算任务分发给gpu单元处理之后,在gpu单元的处理等待时间中累加该计算任务处理任务主体需要的时间;

30、当gpu单元中一计算任务处理完后,在gpu单元的处理等待时间中减去该计算任务处理任务主体需要的时间。

31、由上述技术方案可知,本专利技术提供的单系统同时支持多gpu工作的方法及系统,支持多gpu单元同时计算,克服了单gpu资源存在计算资源紧张的缺陷。在为计算任务分配gpu单元时,优先选择计算任务指定的gpu单元,如果指定的gpu单元不能满足计算要求时,及时将计算任务分配给其他gpu单元,提高了整个机器的计算速率。

本文档来自技高网...

【技术保护点】

1.一种单系统同时支持多GPU工作的方法,其特征在于,在单系统机器上运行;所述方法包括:

2.根据权利要求1所述单系统同时支持多GPU工作的方法,其特征在于,

3.根据权利要求2所述单系统同时支持多GPU工作的方法,其特征在于,判断GPU单元是否满足所述待计算任务的计算要求具体包括:

4.根据权利要求3所述单系统同时支持多GPU工作的方法,其特征在于,

5.根据权利要求3所述单系统同时支持多GPU工作的方法,其特征在于,在将所述计算任务分发给GPU单元处理之后,还包括:

6.一种单系统同时支持多GPU工作的系统,其特征在于,部署在单系统机器上;所述系统包括:

7.根据权利要求6所述单系统同时支持多GPU工作的系统,其特征在于,

8.根据权利要求7所述单系统同时支持多GPU工作的系统,其特征在于,所述调度单元具体用于:

9.根据权利要求8所述单系统同时支持多GPU工作的系统,其特征在于,

10.根据权利要求8所述单系统同时支持多GPU工作的系统,其特征在于,所述调度单元还用于

...

【技术特征摘要】

1.一种单系统同时支持多gpu工作的方法,其特征在于,在单系统机器上运行;所述方法包括:

2.根据权利要求1所述单系统同时支持多gpu工作的方法,其特征在于,

3.根据权利要求2所述单系统同时支持多gpu工作的方法,其特征在于,判断gpu单元是否满足所述待计算任务的计算要求具体包括:

4.根据权利要求3所述单系统同时支持多gpu工作的方法,其特征在于,

5.根据权利要求3所述单系统同时支持多gpu工作的方法,其特征在于,在将所述计算任务分发给gp...

【专利技术属性】
技术研发人员:洪继进
申请(专利权)人:深圳市腾进达信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1