System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种GPU调度方法及相关设备技术_技高网

一种GPU调度方法及相关设备技术

技术编号:40838647 阅读:5 留言:0更新日期:2024-04-01 15:04
本申请涉及资源分配技术领域,尤其涉及一种GPU调度方法及相关设备。AIGC绘图平台分配有N个图形处理器GPU处理绘图请求,方法包括:按照预置时间间隔获取服务请求队列中当前的未处理绘图请求的数量;根据N,确定实时扩容阈值和实时缩容阈值;实时扩容阈值大于实时缩容阈值;分别判断未处理绘图请求的数量与实时扩容阈值以及与实时缩容阈值之间的大小;若未处理绘图请求的数量大于实时扩容阈值,为AIGC绘图平台服务请求队列增加第一数量的GPU;若未处理绘图请求的数量小于实时缩容阈值,为AIGC绘图平台服务请求队列减少第二数量的GPU。本申请能够解决AIGC绘图平台现有的GPU调度方法严重滞后的问题。

【技术实现步骤摘要】

本申请涉及资源分配,尤其涉及一种gpu调度方法及相关设备。


技术介绍

1、在现有技术中,aigc(artificial intelligence generated content,生成式人工智能)绘图平台在接收到用户发送的绘图请求后,可通过从ai(artificialintelligence,人工智能)云平台调用的gpu(graphics processing unit,图形处理器)为用户提供aigc绘图服务。

2、在实际操作中,由于向aigc绘图平台发送绘图请求的用户数量是动态变化的,因此,当用户数量较多时,经常出现由于调用的gpu不足,导致aigc绘图平台出现请求排队的现象,致使无法为一些用户及时地提供aigc绘图服务;此外,当用户数量较少时,会导致出现gpu闲置的情况,造成资源浪费;

3、为了解决上述问题,需要及时调整从ai云平台调用的gpu的数量,但是由于从出现排队或者出现资源浪费的问题出现,再到通过人工从ai云平台调用到gpu解决相关问题,通常会消耗较久的时长,此外由于客观情况限制,人工也无法对aigc绘图平台所接收的绘图请求的数量进行时时刻刻的监督,因此可知,aigc绘图平台现有的调整gpu数量的方式具有严重的滞后问题,最终导致严重影响用户的使用体验。


技术实现思路

1、有鉴于此,本申请的目的在于提供一种gpu调度方法及相关设备,用于解决aigc绘图平台现有的gpu调度方法严重滞后的问题。

2、第一方面,本申请提供了一种gpu调度方法,所述方法应用于生成式人工智能aigc绘图平台,所述aigc绘图平台分配有n个图形处理器gpu处理绘图请求,所述方法包括:

3、按照预置时间间隔获取服务请求队列中当前的未处理绘图请求的数量;

4、根据所述n,确定实时扩容阈值和实时缩容阈值;所述实时扩容阈值大于所述实时缩容阈值;

5、分别判断所述未处理绘图请求的数量与所述实时扩容阈值以及与所述实时缩容阈值之间的大小;

6、若所述未处理绘图请求的数量大于所述实时扩容阈值,为所述aigc绘图平台服务请求队列增加第一数量的所述gpu;

7、若所述未处理绘图请求的数量小于所述实时缩容阈值,为所述aigc绘图平台服务请求队列减少第二数量的所述gpu。

8、优选地,所述根据所述n,确定实时扩容阈值和实时缩容阈值gpu数量,包括:

9、通过下述公式计算所述实时扩容阈值:

10、s1=n×a×t;

11、式中,s1为所述实时扩容阈值;a为所述aigc绘图平台服务请求队列在单位时间内能够处理的绘图请求的数量;t为预置时间间隔。

12、优选地,所述为所述aigc绘图平台增加第一数量的所述gpu,包括:

13、通过下述公式计算所述第一数量:

14、

15、式中,δn1为第一数量;a为所述服务请求队列中当前的未处理绘图请求的数量;q1为预设第一系数;k1为预设第一调整值。

16、优选地,所述根据所述n,确定实时缩容阈值,包括:

17、通过下述公式计算所述实时缩容阈值:

18、s2=(n-1)×a×t×p;

19、式中,s2为所述实时缩容阈值服务请求队列gpu;a为所述aigc绘图平台在单位时间内能够处理的绘图请求的数量;t为预置时间间隔;p为预设缩容计算倍率。

20、优选地,所述为所述aigc绘图平台减少第二数量的所述gpu,包括:

21、通过下述公式计算所述第二数量:

22、

23、式中,δn2为第二数量;a为所述服务请求队列中当前的未处理绘图请求的数量;q2为预设第二系数;k2为预设第二调整值。

24、优选地,还包括:

25、若所述未处理绘图请求的数量小于所述实时扩容阈值并且所述未处理绘图请求的数量大于所述实时缩容阈值,所述aigc绘图平台基于负载均衡策略处理所述未处理绘图请求。

26、第二方面,本申请提供了一种gpu调度装置,所述装置包括:采集模块、计算模块和数量调整模块;

27、所述采集模块,用于按照预置时间间隔获取服务请求队列中当前的未处理绘图请求的数量;

28、所述计算模块,用于根据所述n,确定实时扩容阈值和实时缩容阈值;所述实时扩容阈值大于所述实时缩容阈值;还用于分别判断所述未处理绘图请求的数量与所述实时扩容阈值以及与所述实时缩容阈值之间的大小;

29、所述数量调整模块,用于若所述未处理绘图请求的数量大于所述实时扩容阈值,为所述aigc绘图平台增加第一数量的所述gpu;还用于若所述未处理绘图请求的数量小于所述实时缩容阈值,为所述aigc绘图平台减少第二数量的所述gpu。

30、优选地,所述计算模块包括:第一阈值计算单元;

31、所述第一阈值计算单元,用于通过下述公式计算所述实时扩容阈值:

32、s1=n×a×t;

33、式中,s1为所述实时扩容阈值;a为所述aigc绘图平台服务请求队列在单位时间内能够处理的绘图请求的数量;t为预置时间间隔。

34、第三方面,本申请提供了一种电子设备,包括:存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述的gpu调度方法。

35、第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令被处理器执行时实现上述的gpu调度方法。

36、有益效果:

37、本申请提供了一种gpu调度方法及相关设备,本申请通过间隔预置时间间隔确定服务请求队列中当前的未处理绘图请求的数量,用于对用户的实时需求量做出量化的确认;再通过计算实时扩容阈值和实时缩容阈值,确定出gpu实时供应量n的调整标准;再通过判断未处理绘图请求的数量与实时扩容阈值以及与实时缩容阈值之间的大小,来确定gpu实时供应量n是否与用户的实时需求量匹配;其中,若未处理绘图请求的数量大于实时扩容阈值,认为gpu实时供应量n小于用户的实时需求量,因此需要增加gpu的数量,若未处理绘图请求的数量小于实时缩容阈值,认为gpu实时供应量n大于用户的实时需求量,因此需要减少gpu的数量。由于本申请可以通过用户的实时需求量来对gpu实时供应量n进行适应性的调整,能够使gpu实时供应量尽量满足用户的实时需求量;由此可知本申请可通过实施上述方法对aigc绘图平台的未处理绘图请求的数量进行周期性的监督和调整,所以能迅速地调整gpu实时供应量n,整个过程可自动实施,避免了人工监督操作的滞后性,因此本申请能够解决aigc绘图平台现有的gpu调度方法严重滞后的问题。

38、本申请的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点在说明书本文档来自技高网...

【技术保护点】

1.一种GPU调度方法,其特征在于,所述方法应用于生成式人工智能AIGC绘图平台,所述AIGC绘图平台分配有N个图形处理器GPU处理绘图请求,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述N,确定实时扩容阈值和实时缩容阈值GPU数量,包括:

3.根据权利要求2所述的方法,其特征在于,所述为所述AIGC绘图平台增加第一数量的所述GPU,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述N,确定实时缩容阈值,包括:

5.根据权利要求4所述的方法,其特征在于,所述为所述AIGC绘图平台减少第二数量的所述GPU,包括:

6.根据权利要求1所述的方法,其特征在于,还包括:

7.一种GPU调度装置,其特征在于,所述装置包括:采集模块、计算模块和数量调整模块;

8.根据权利要求7所述的装置,其特征在于,所述计算模块包括:第一阈值计算单元;

9.一种电子设备,包括:存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1~6任一项所述的GPU调度方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令被处理器执行时实现上述权利要求1~6任一项所述的GPU调度方法。

...

【技术特征摘要】

1.一种gpu调度方法,其特征在于,所述方法应用于生成式人工智能aigc绘图平台,所述aigc绘图平台分配有n个图形处理器gpu处理绘图请求,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述n,确定实时扩容阈值和实时缩容阈值gpu数量,包括:

3.根据权利要求2所述的方法,其特征在于,所述为所述aigc绘图平台增加第一数量的所述gpu,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述n,确定实时缩容阈值,包括:

5.根据权利要求4所述的方法,其特征在于,所述为所述aigc绘图平台减少第二数量的所述gpu,包括:

...

【专利技术属性】
技术研发人员:黄琦敏蔡一平刘江张弛吴勇刚肖智伟谢磊
申请(专利权)人:武汉智启特人工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1