System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于生成式AI的智能策略生成系统及方法技术方案_技高网

一种基于生成式AI的智能策略生成系统及方法技术方案

技术编号:41270179 阅读:4 留言:0更新日期:2024-05-11 09:24
本发明专利技术公开了一种基于生成式AI的智能策略生成系统及方法,利用结构化信息编码,将解决问题相关的专业知识和思维过程分类分层后以具有时序、资源依赖顺序的结构组织后用于训练生成式AI,使生成式AI有效生成与专业领域相关的任务规划方案,利用生成式AI语义理解能力使系统面对相近问题具备一定问题泛化能力;利用具有时序、资源依赖顺序的结构组织系统生成的相应命令序列或命令序列信息,从而能整合小型智能模块解决具有时序,资源依赖的较复杂问题,减轻组合爆炸,降低生成式AI的训练难度;利用反思机制与记忆机制,在生成内容基础上通过人工干预的遗传变异筛选,得到更符合人类需求的生成结果,并妥善记忆以提高系统效率。

【技术实现步骤摘要】

本专利技术涉及智能决策的,尤其是指一种基于生成式ai的智能策略生成系统及方法。


技术介绍

1、智能决策技术已经广泛地应用在金融、医疗、物流、机器人任务规划等领域。主要包括以下内容:

2、利用人工智能和机器学习等技术来自动分析数据、识别模式,并基于这些分析结果做出决策。在机器人领域,目前存在大量已封装的机器人指令序列、深度学习模型和示教案例等,其具有解决特定小型问题的能力,但难以直接解决相近问题。小型问题通过恰当组合可以解决更大型的问题,而直接地基于深度学习方法解决较大型问题,模型训练由于问题空间的组合爆炸较为困难,且难以对系统决策逻辑进行干预。

3、专利文献cn116737940a公开了一种基于文本信息的智能决策方法、决策系统,该方法中分类器的实现依赖于神经网络,决策生成依赖于预先编码的任务分类,并不具备良好的任务泛化性,也无法应对存在时序依赖、资源依赖的任务决策中的复杂推理。

4、专利文献cn117215742a公开了一种基于生成式ai的调度方法及系统,基于队伍资源信息和分类直接利用生成式ai生成调度结果,使用合理度指标评估调度结果以得到符合标准的调度结果,该方法与系统不具备记忆过去生成信息的能力,对数据的使用效率较低。

5、专利文献cn114127748a公开了一种含记忆模块的具身智能实现技术,其记忆模块记录多模态原始数据,并用于长短期记忆网络的训练,但缺少对记忆的反思,优化,泛化过程,系统对相近问题的泛化解决能力较弱,解决效率较低。


技术实现思路</b>

1、本专利技术的第一目的在于克服现有技术的不足与缺点,提供一种基于生成式ai的智能策略生成系统,能够整合小型智能模块用于解决存在时间,资源使用顺序约束的复杂问题,系统架构考虑了设备接入的拓展性的需求,组织任务执行结构信息作为记忆内容,进行反思优化,提升未来面对同类任务的决策效果和反应速度。

2、本专利技术的第二目的在于提供一种基于生成式ai的智能策略生成方法。

3、本专利技术的第一目的通过下述技术方案实现:一种基于生成式ai的智能策略生成系统,包括:

4、任务识别模块,用于获取任务信息,根据任务信息提取任务特征,利用任务特征进行初步任务分类,根据初步任务分类检索现有优势策略结果;

5、策略生成模块,用于为尚未形成优势策略结果的特定任务,依据策略模板,根据任务信息实例化参数,生成策略结果;

6、执行序列生成模块,用于将策略生成模块生成的策略结果,根据可执行器件状态信息和可执行命令模板,转换为执行序列;

7、执行环境模块,用于仿真或真实执行所述执行序列,并提供环境信息;

8、反思模块,用于记录上述任务识别模块、策略生成模块、执行序列生成模块和执行环境模块提供的信息,评价任务结果,并对未形成优势策略结果的特定任务,基于此次任务的策略结果进行变异、模拟和评价,存储最终得到的优势策略结果。

9、进一步,所述任务识别模块包括:

10、任务获取器,用于获取任务信息,所述任务信息包括环境信息、任务目标信息、任务优化目标信息和任务执行限制信息,获取方式有:基于人机交互、文件配置或接入其它系统的方式;

11、任务特征提取器,用于从任务信息中提取任务特征,所述任务特征包括环境信息、任务目标信息、任务优化目标信息和任务执行限制信息的特征;

12、特定任务-优势策略结果存储器,用于对任务根据其任务特征进行聚类、分类和管理;

13、任务分类器,根据任务特征在所述特定任务-优势策略结果存储器中,尝试匹配同类型任务,匹配到同类任务时获取对应优势策略结果。

14、进一步,所述策略生成模块包括:

15、策略模板存储器,用于管理指导策略生成过程的策略模板,策略模板包含策略信息,所述策略信息包含所述任务获取器所获取的任务信息、不同任务的处理原则信息以及逐步分解任务以解决任务的信息;

16、策略模板实例化器,用于根据所述任务特征提取器给出的任务特征,从所述策略模板存储器匹配合适的策略模板,并依据需要配置适当参数进行策略模板的初步实例化;

17、生成器,其采用生成式ai技术,包括一种大语言模型,依据任务信息和初步实例化的策略模板生成合理泛化参数,得到完全实例化的策略模板;

18、策略生成管理器,用于管理所述策略模板实例化器利用所述任务特征提取器给出的任务特征获取初步实例化的策略模板,再由所述生成器进一步生成合理泛化参数,使策略模板完全实例化的过程,策略结果是这一过程最终产生的结构化组织的若干完全实例化的策略模板;所述优势策略结果是针对某一任务的一个策略结果。

19、进一步,所述逐步分解任务以解决任务的信息,具体包括:

20、记录树状拆解任务的方法,即将大任务拆解成小任务序列,小任务进一步拆解成更细分任务序列的知识;

21、记录任务不同拆解方式的适用情况信息和使用概率信息。

22、进一步,所述执行序列生成模块包括:

23、可执行器件状态信息管理器,用于管理当前能用于执行可执行命令的可执行器件的状态信息,所述状态信息包括可用资源和工作状态信息,所述可执行命令由若干经验证能用于解决问题的机器人指令序列、深度学习模型或机器人示教案例组成;

24、策略-可执行命令模板管理器,用于将所述策略生成模块给出的策略结果中若干完全实例化的策略模板一一映射到具体的可执行器件提供的可执行命令的可执行命令模板,所述可执行命令模板需要具体填入参数成为实例化的可执行命令模板后才能够被落实到所述可执行器件予以执行,所述可执行命令模板包含可执行命令需要的参数列表信息;

25、策略结果-执行序列转换器,用于管理将所述策略结果中所有内容转换成实例化的可执行命令模板的过程,所述执行序列是被结构化组织的若干实例化的可执行命令模板。

26、进一步,所述策略-可执行命令模板管理器中存储的可执行命令模板编码了所述可执行器件操作的时序依赖和资源依赖信息,支持人工编辑和筛选。

27、进一步,所述执行环境模块执行以下操作:

28、组织所述环境信息提供给所述任务识别模块和反思模块,所述环境信息包含环境状态、环境中存在对象及其状态信息;

29、仿真或在真实环境中执行所述执行序列,提供所述环境信息构成部分执行结果信息。

30、进一步,所述反思模块包括:

31、任务-策略-执行结果存储器,用于根据所述任务识别模块、策略生成模块、执行序列生成模块和执行环境模块实现中提供的信息,按若干维度进行整理,作为一条任务-策略-执行结果信息记录存储,所述维度包含任务信息、初始环境信息、策略结果和执行结果信息;

32、任务-策略-执行结果评价器,用于提供多种对任务执行结果的评价方法,提供评价结果构成部分执行结果信息,所述评价方法包含人工评价方法和奖励函数评价方法,能够给所述执行环境模本文档来自技高网...

【技术保护点】

1.一种基于生成式AI的智能策略生成系统,其特征在于,包括:

2.根据权利要求1所述的一种基于生成式AI的智能策略生成系统,其特征在于,所述任务识别模块包括:

3.根据权利要求2所述的一种基于生成式AI的智能策略生成系统,其特征在于,所述策略生成模块包括:

4.根据权利要求3所述的一种基于生成式AI的智能策略生成系统,其特征在于,所述逐步分解任务以解决任务的信息,具体包括:

5.根据权利要求4所述的一种基于生成式AI的智能策略生成系统,其特征在于,所述执行序列生成模块包括:

6.根据权利要求5所述的一种基于生成式AI的智能策略生成系统,其特征在于,所述策略-可执行命令模板管理器中存储的可执行命令模板编码了所述可执行器件操作的时序依赖和资源依赖信息,支持人工编辑和筛选。

7.根据权利要求6所述的一种基于生成式AI的智能策略生成系统,其特征在于,所述执行环境模块执行以下操作:

8.根据权利要求7所述的一种基于生成式AI的智能策略生成系统,其特征在于,所述反思模块包括:

9.一种基于生成式AI的智能策略生成方法,其特征在于,基于权利要求1~8任意一项所述的智能策略生成系统实现如下步骤:

...

【技术特征摘要】

1.一种基于生成式ai的智能策略生成系统,其特征在于,包括:

2.根据权利要求1所述的一种基于生成式ai的智能策略生成系统,其特征在于,所述任务识别模块包括:

3.根据权利要求2所述的一种基于生成式ai的智能策略生成系统,其特征在于,所述策略生成模块包括:

4.根据权利要求3所述的一种基于生成式ai的智能策略生成系统,其特征在于,所述逐步分解任务以解决任务的信息,具体包括:

5.根据权利要求4所述的一种基于生成式ai的智能策略生成系统,其特征在于,所述执行序列生成模块包括:

6.根...

【专利技术属性】
技术研发人员:真悦汤烁毕盛陈梓锐石海鹏林标伟
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1