System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 资源分配方法、装置、设备及存储介质制造方法及图纸_技高网

资源分配方法、装置、设备及存储介质制造方法及图纸

技术编号:40298628 阅读:4 留言:0更新日期:2024-02-07 20:46
本申请提供了一种资源分配方法、装置、设备及存储介质,属于存储技术领域。方法包括:在业务的算法代码的运行过程中,响应于对算法代码中业务的资源请求的触发,通过转发接口捕获资源请求,将资源请求发送给资源调度进程,转发接口为处理器的资源管理接口的包裹函数;通过资源调度进程,基于资源池和资源请求,为业务分配存储资源,得到业务所分配资源块的资源地址,资源池用于存储多个资源块的资源地址,多个资源块基于对多个处理器的存储资源进行划分得到;通过转发接口,向业务返回资源地址,业务用于通过处理器的资源管理接口使用所返回的资源地址对应的资源块。该方法提高了存储资源的利用率,减少了存储资源的浪费。

【技术实现步骤摘要】

本申请涉及存储,特别涉及一种资源分配方法、装置、设备及存储介质


技术介绍

1、算法研发人员会根据业务需求开发出对应的算法模型。而在开发过程中的模型训练或线上推理阶段,业务会向算法的服务平台申请可提高业务处理速度的处理器上的存储资源,如申请npu(neural network processing unit,神经网络处理器)上的显存资源,以提高业务处理速度。

2、相关技术中,每个业务申请存储资源时,其资源请求会携带处理器的标识。服务平台调用该处理器的资源管理接口,直接基于所携带的标识,将该处理器上的存储资源排他性的分给该业务,使得该处理器仅能够为该业务服务。但一般业务对处理器的存储资源利用率不到30%,显然降低了对处理器存储资源的利用率。


技术实现思路

1、本申请实施例提供了一种资源分配方法、装置、设备及存储介质,提高了存储资源的利用率,减少了存储资源的浪费。所述技术方案如下。

2、一方面,提供了一种资源分配方法,所述方法包括:

3、在业务的算法代码的运行过程中,响应于对所述算法代码中所述业务的资源请求的触发,通过转发接口捕获所述资源请求,将所述资源请求发送给资源调度进程,所述资源请求用于请求为所述业务分配多个处理器上的存储资源,所述转发接口为所述处理器的资源管理接口的包裹函数;

4、通过所述资源调度进程,基于资源池和所述资源请求,为所述业务分配存储资源,得到所述业务所分配资源块的资源地址,所述资源池用于存储多个资源块的资源地址,所述多个资源块基于对所述多个处理器的存储资源进行划分得到;

5、通过所述转发接口,向所述业务返回资源地址,所述业务用于通过所述处理器的资源管理接口使用所返回的资源地址对应的资源块。

6、另一方面,提供了一种资源分配装置,所述装置包括:

7、捕获模块,用于在业务的算法代码的运行过程中,响应于对所述算法代码中所述业务的资源请求的触发,通过转发接口捕获所述资源请求,将所述资源请求发送给资源调度进程,所述资源请求用于请求为所述业务分配多个处理器上的存储资源,所述转发接口为所述处理器的资源管理接口的包裹函数;

8、分配模块,用于通过所述资源调度进程,基于资源池和所述资源请求,为所述业务分配存储资源,得到所述业务所分配资源块的资源地址,所述资源池用于存储多个资源块的资源地址,所述多个资源块基于对所述多个处理器的存储资源进行划分得到;

9、返回模块,用于通过所述转发接口,向所述业务返回资源地址,所述业务用于通过所述处理器的资源管理接口使用所返回的资源地址对应的资源块。

10、在一些实施例中,所述多个资源块对应多个级别,不同级别的资源块对应不同的资源量;所述资源请求还用于指示资源量;所述分配模块,用于:

11、基于所述资源池和所述资源请求,从所述多个级别的资源块中确定目标资源块,所述目标资源块的资源量与所述资源请求所指示的资源量匹配,将所述目标资源块的资源地址作为所述业务所分配资源块的资源地址。

12、在一些实施例中,所述分配模块还用于:

13、若所述多个级别的资源块中不存在所述目标资源块,为所述业务分配目标级别的资源块,所述目标级别的资源块的资源量大于所述目标资源块的资源量;

14、或者,若所述多个级别的资源块中不存在所述目标资源块,将所述业务的资源请求加入等待队列,所述等待队列中的资源请求用于重新进行资源分配;

15、或者,若所述多个级别的资源块中不存在所述目标资源块,向所述业务返回请求失败。

16、在一些实施例中,所述返回模块还用于:

17、对于所述等待队列中的每个资源请求,若所述资源请求在预设时长内未匹配到目标资源块,向所述资源请求对应的业务返回请求失败。

18、在一些实施例中,所述资源池还用于指示已分配和未分配的资源块;所述分配模块,用于:

19、基于所述资源池和所述资源请求,从未分配的资源块中,为所述业务分配存储资源,得到所述业务所分配资源块的资源地址。

20、在一些实施例中,所述装置还包括:

21、加入模块,用于将所述资源请求加入到消息队列;

22、所述分配模块,用于:

23、在所述消息队列中的资源请求为多个的情况下,基于多个资源请求在所述消息队列中的排序、所述资源池和所述资源请求,依次为所述多个资源请求对应的业务分配存储资源,得到为各个业务所分配资源块的资源地址。

24、在一些实施例中,所述装置还包括:

25、获取模块,用于获取所述多个处理器各自的存储资源的资源信息;

26、汇总模块,用于基于所述多个处理器各自的存储资源的资源信息,对所述多个处理器的存储资源进行汇总,得到总存储资源;

27、划分模块,用于将所述总存储资源划分为多个资源块,且对所述多个资源块分别进行编址,得到所述多个资源块各自的资源地址,将所述多个资源块各自的资源地址存储到资源池,所述资源地址用于指示资源块所在的处理器和在所述处理器上的位置。

28、在一些实施例中,所述业务的算法代码通过算法框架运行;所述捕获模块,用于调用所述算法框架内的所述转发接口,捕获所述资源请求;

29、所述装置还包括嵌入模块,用于在所述算法框架的编译过程中,在所述算法框架内嵌入所述转发接口。

30、在一些实施例中,所述装置还包括:

31、编译模块,用于基于所述资源管理接口进行编译,得到所述转发接口,且将所述转发接口存储到动态链接库;

32、所述捕获模块,用于确定环境变量所标记的转发接口,从所述动态链接库中调用所述环境变量所标记的转发接口,捕获所述资源请求。

33、另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器用于存储至少一段程序,所述至少一段程序由所述处理器加载并执行以实现本申请实施例中的资源分配方法。

34、另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一段程序,所述至少一段程序由处理器加载并执行以实现本申请实施例中的资源分配方法。

35、另一方面,提供了一种计算机程序产品,所述计算机程序产品包括至少一段程序,所述至少一段程序存储在计算机可读存储介质中,计算机设备的处理器从所述计算机可读存储介质读取所述至少一段程序,所述处理器执行所述至少一段程序,使得所述计算机设备执行上述任一实现方式所述的资源分配方法。

36、本申请实施例提供了一种资源分配方法,该方法基于资源管理接口创建了转发接口,通过转发接口来捕获业务的资源请求,且将资源请求发送给资源调度进程来为业务进行存储资源的分配。由于事先将多个处理器的存储资源进行了划分,得到了多个资源块,且通过资源池来管理多个资源块,进而在通过资源池进行资源分配时,由于一个处理器被划分为了多个资源块,使得一个处理器上的存储资源能够分本文档来自技高网...

【技术保护点】

1.一种资源分配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述多个资源块对应多个级别,不同级别的资源块对应不同的资源量;所述资源请求还用于指示资源量;

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述资源池还用于指示已分配和未分配的资源块;所述基于资源池和所述资源请求,为所述业务分配存储资源,得到所述业务所分配资源块的资源地址,包括:

6.根据权利要求1所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述资源池的创建过程包括:

8.根据权利要求1所述的方法,其特征在于,所述业务的算法代码通过算法框架运行;所述通过转发接口捕获所述资源请求,包括:调用所述算法框架内的所述转发接口,捕获所述资源请求;

9.根据权利要求1所述的方法,其特征在于,所述方法还包括:

10.一种资源分配装置,其特征在于,所述装置包括:

11.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器用于存储至少一段程序,所述至少一段程序由所述处理器加载并执行权利要求1至9任一项所述的资源分配方法。

12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储至少一段程序,所述至少一段程序用于执行权利要求1至9任一项所述的资源分配方法。

...

【技术特征摘要】

1.一种资源分配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述多个资源块对应多个级别,不同级别的资源块对应不同的资源量;所述资源请求还用于指示资源量;

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述资源池还用于指示已分配和未分配的资源块;所述基于资源池和所述资源请求,为所述业务分配存储资源,得到所述业务所分配资源块的资源地址,包括:

6.根据权利要求1所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述资源池的创建过程...

【专利技术属性】
技术研发人员:刘强张强陈鹏杨晓峰刘煜宏
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1