System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于业务场景的算力配置方法、装置、设备及介质制造方法及图纸_技高网

基于业务场景的算力配置方法、装置、设备及介质制造方法及图纸

技术编号:41129665 阅读:6 留言:0更新日期:2024-04-30 17:58
本发明专利技术涉及人工智能技术领域,公开了一种基于业务场景的算力配置方法、装置、设备及存储介质。基于业务场景的算力配置方法包括:通过前端输入算力需求的业务场景描述,后端获取到该业务场景描述后,先从业务场景描述中提取对应的算力需求,然后根据提取的算力需求自动生成算力租户所需业务场景对应的算力配置方案。本发明专利技术中,用户在配置算力服务器时,只需输入文字或者语音格式的业务场景描述,系统会自动分析该业务场景,并自动给出对应的算力配置建议,不仅降低了算力配置服务的实施成本,同时也提升了客户服务效率。

【技术实现步骤摘要】

本专利技术涉及人工智能领域,尤其涉及一种基于业务场景的算力配置方法、装置、设备及存储介质。


技术介绍

1、算力(computing power)是指计算机或其他计算设备在一定时间内可以处理的数据量或完成的计算任务的数量。算力可以用各种方式来衡量,例如计算速度、计算能耗、计算精度、并行度等。目前主流的算力服务提供商,在向外提供算力时,需要使用者对算力服务器、组网等各方面都非常精通,才能一步步配置、选择到合适的算力服务器。通常算力租赁用户关心的是快速提供与自身算力需求相应的配置建议,而目前的配置方法仍然需要人工配置。这种人工配置模式对配置人员的专业能力要求较高,不仅导致实施成本高,而且也影响了客户服务效率。


技术实现思路

1、本专利技术的主要目的在于解决人工配置算力需求存在实施成本高且影响客户服务效率的技术问题。

2、本专利技术第一方面提供了一种基于业务场景的算力配置方法,所述基于业务场景的算力配置方法包括:

3、获取前端输入的算力需求的业务场景描述;

4、从所述业务场景描述中提取算力需求;

5、基于所述算力需求,生成所述业务场景对应的若干算力配置方案。

6、可选的,在本专利技术第一方面的第一种实施例中,所述业务场景描述包括文字格式和语音格式;

7、所述基于业务场景的算力配置方法还包括:当所述业务场景描述为语音格式时,将语音格式的业务场景描述转换为文字格式的业务场景描述。

8、可选的,在本专利技术第一方面的第二种实施例中,所述从所述业务场景描述中提取算力需求包括:

9、对所述业务场景描述进行语义识别,输出语义识别结果;

10、判断所述语义识别结果中是否包含完整的算力需求;

11、若所述语义识别结果中未包含完整的算力需求,则针对缺少的算力需求向前端发起对话并对前端回复进行语义识别,直至得到完整的算力需求。

12、可选的,在本专利技术第一方面的第三种实施例中,所述算力配置方案包括:gpu配置以及数量、网络带宽大小、存储空间大小、显存大小、并行策略及通信网络拓扑中的多种。

13、可选的,在本专利技术第一方面的第四种实施例中,在所述获取前端输入的算力需求的业务场景描述之前,还包括:

14、基于预置算力分配样本数据与通用大模型,训练算力分配大模型;

15、所述基于所述算力需求,生成所述业务场景对应的若干算力配置方案包括:

16、将所述算力需求输入所述算力分配大模型进行处理,输出所述业务场景对应的若干算力配置方案。

17、可选的,在本专利技术第一方面的第五种实施例中,所述算力分配样本数据包括:常用算力需求的业务场景描述、典型算力服务配置以及业务场景描述与算力服务配置的关联关系。

18、可选的,在本专利技术第一方面的第六种实施例中,所述基于业务场景的算力配置方法还包括:

19、当向前端发起预设次数对话后仍未得到完整的算力需求时,生成预设的算力配置方案返回前端。

20、本专利技术第二方面提供一种基于业务场景的算力配置装置,所述基于业务场景的算力配置装置包括:

21、获取模块,用于获取前端输入的算力需求的业务场景描述;

22、提取模块,用于从所述业务场景描述中提取算力需求;

23、生成模块,用于基于所述算力需求,生成所述业务场景对应的若干算力配置方案。

24、可选的,在本专利技术第二方面的第一种实施例中,所述业务场景描述包括文字格式和语音格式;

25、所述基于业务场景的算力配置装置还包括:

26、转换模块,用于当所述业务场景描述为语音格式时,将语音格式的业务场景描述转换为文字格式的业务场景描述。

27、可选的,在本专利技术第二方面的第二种实施例中,所述提取模块具体用于:

28、对所述业务场景描述进行语义识别,输出语义识别结果;

29、判断所述语义识别结果中是否包含完整的算力需求;

30、若所述语义识别结果中未包含完整的算力需求,则针对缺少的算力需求向前端发起对话并对前端回复进行语义识别,直至得到完整的算力需求。

31、可选的,在本专利技术第二方面的第三种实施例中,所述算力配置方案包括:gpu配置以及数量、网络带宽大小、存储空间大小、显存大小、并行策略及通信网络拓扑中的多种。

32、可选的,在本专利技术第二方面的第四种实施例中,所述基于业务场景的算力配置装置还包括:

33、训练模块,用于基于预置算力分配样本数据与通用大模型,训练算力分配大模型;

34、所述生成模块具体用于:将所述算力需求输入所述算力分配大模型进行处理,输出所述业务场景对应的若干算力配置方案。

35、可选的,在本专利技术第二方面的第五种实施例中,所述算力分配样本数据包括:常用算力需求的业务场景描述、典型算力服务配置以及业务场景描述与算力服务配置的关联关系。

36、可选的,在本专利技术第二方面的第六种实施例中,所述生成模块还用于:

37、当向前端发起预设次数对话后仍未得到完整的算力需求时,生成预设的算力配置方案返回前端。

38、本专利技术第三方面提供了一种计算机设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述计算机设备执行上述的基于业务场景的算力配置方法。

39、本专利技术的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于业务场景的算力配置方法。

40、本专利技术提供的技术方案中,为降低用户(算力租户)的配置难度,算力租户可通过前端输入算力需求的业务场景描述,后端获取到该业务场景描述后,先从业务场景描述中提取对应的算力需求,然后输入人工智能模型,模型将根据提取的算力需求自动生成算力租户所需业务场景对应的算力配置方案。本专利技术中,用户在配置算力服务器时,只需输入(文字或者语音)自己的业务场景描述,系统会自动分析该业务场景,并自动给出对应的算力配置建议,不仅降低了算力配置服务的实施成本,同时也提升了客户服务效率。

本文档来自技高网...

【技术保护点】

1.一种基于业务场景的算力配置方法,其特征在于,所述基于业务场景的算力配置方法包括:

2.根据权利要求1所述的基于业务场景的算力配置方法,其特征在于,所述业务场景描述包括文字格式和语音格式;

3.根据权利要求1或2所述的基于业务场景的算力配置方法,其特征在于,所述从所述业务场景描述中提取算力需求包括:

4.根据权利要求3所述的基于业务场景的算力配置方法,其特征在于,所述算力配置方案包括:GPU配置以及数量、网络带宽大小、存储空间大小、显存大小、并行策略及通信网络拓扑中的多种。

5.根据权利要求1所述的基于业务场景的算力配置方法,其特征在于,在所述获取前端输入的算力需求的业务场景描述之前,还包括:

6.根据权利要求5所述的基于业务场景的算力配置方法,其特征在于,所述算力分配样本数据包括:常用算力需求的业务场景描述、典型算力服务配置以及业务场景描述与算力服务配置的关联关系。

7.根据权利要求3所述的基于业务场景的算力配置方法,其特征在于,所述基于业务场景的算力配置方法还包括:

8.一种基于业务场景的算力配置装置,其特征在于,所述基于业务场景的算力配置装置包括:

9.一种计算机设备,其特征在于,所述计算机设备包括:存储器和至少一个处理器,所述存储器中存储有指令;

10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-7中任一项所述的基于业务场景的算力配置方法。

...

【技术特征摘要】

1.一种基于业务场景的算力配置方法,其特征在于,所述基于业务场景的算力配置方法包括:

2.根据权利要求1所述的基于业务场景的算力配置方法,其特征在于,所述业务场景描述包括文字格式和语音格式;

3.根据权利要求1或2所述的基于业务场景的算力配置方法,其特征在于,所述从所述业务场景描述中提取算力需求包括:

4.根据权利要求3所述的基于业务场景的算力配置方法,其特征在于,所述算力配置方案包括:gpu配置以及数量、网络带宽大小、存储空间大小、显存大小、并行策略及通信网络拓扑中的多种。

5.根据权利要求1所述的基于业务场景的算力配置方法,其特征在于,在所述获取前端输入的算力需求的业务场景描述之前,还包括:

6.根据...

【专利技术属性】
技术研发人员:张欢黄军文胡举
申请(专利权)人:深圳华付技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1