System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 智能体行为确定方法、计算机设备及存储介质技术_技高网

智能体行为确定方法、计算机设备及存储介质技术

技术编号:40960269 阅读:2 留言:0更新日期:2024-04-18 20:38
本申请涉及人工智能领域,提供一种智能体行为确定方法、设备及计算机存储介质,该方法包括:获取智能体所处环境的环境状态信息,并根据所述环境状态信息生成状态描述文本;根据所述状态描述文本确定状态向量,基于所述状态向量在预设向量集合中查找与所述状态向量匹配的目标向量;获取所述目标向量的查找结果,并基于所述查找结果确定所述智能体的动作执行策略;基于所述动作执行策略控制所述智能体执行目标动作序列。由于基于向量对包括一系列动作的动作序列进行存储和查找,提高了智能体根据所处环境执行动作的反应速度,降低了大语言模型的调用频率。

【技术实现步骤摘要】

本申请涉及人工智能领域,尤其涉及一种智能体行为确定方法、计算机设备及存储介质


技术介绍

1、在游戏开发中,非玩家角色(non-player character,npc)的决策通常通过硬编码或预定义的脚本来实现。这些方法虽然容易实现和维护,但它们的灵活性和适应性非常有限。为了增加灵活性,开发者经常使用决策树或状态机来处理npc的决策逻辑。然而,这些方法通常需要大量的手动调整和优化。近年来,一些游戏开始采用机器学习和深度学习算法来控制npc。这些方法通常能提供更高的适应性和复杂性,但也需要大量的数据和计算资源。虽然能够提供更富有深度和复杂性的npc行为和交互。但是,相关方法通常需要更多的计算资源和多次与模型的交互,以生成满意的结果。这些因素也增加了商用和部署到现有游戏平台的难度,限制了其实用性和普及范围,并且多次交互生成满意结果也降低了实时性,影响了游戏体验。


技术实现思路

1、本申请的主要目的在于提供一种智能体行为确定方法、设备及计算机存储介质,旨在提高智能体的反应速度以及降低大语言模型的调用频率。

2、第一方面,本申请提供一种智能体行为确定方法,所述智能体行为确定方法包括以下步骤:

3、获取智能体所处环境的环境状态信息,并根据所述环境状态信息生成状态描述文本;

4、根据所述状态描述文本确定状态向量,基于所述状态向量在预设向量集合中查找与所述状态向量匹配的目标向量;

5、获取所述目标向量的查找结果,并基于所述查找结果确定所述智能体的动作执行策略;

6、基于所述动作执行策略控制所述智能体执行目标动作序列;

7、其中,所述执行策略包括第一执行策略和第二执行策略,所述第一执行策略包括:根据所述目标向量的查找结果获取对应的第一动作序列,将所述第一动作序列确定为所述目标动作序列;所述第二执行策略包括:获取预设的大语言模型基于所述状态描述文本输出的第二动作序列,将所述第二动作序列确定为所述目标动作序列,并将所述第二动作序列和所述状态向量对应存储到所述预设向量集合中。

8、第二方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的智能体行为确定方法。

9、第三方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的智能体行为确定方法。

10、本申请提供一种智能体行为确定方法、设备及计算机存储介质,本申请通过获取智能体所处环境的环境状态信息,并根据所述环境状态信息生成状态描述文本;根据所述状态描述文本确定状态向量,基于所述状态向量在预设向量集合中查找与所述状态向量匹配的目标向量;获取所述目标向量的查找结果,并基于所述查找结果确定所述智能体的动作执行策略;基于所述动作执行策略控制所述智能体执行目标动作序列;其中,所述执行策略包括第一执行策略和第二执行策略,所述第一执行策略包括:根据所述目标向量的查找结果获取对应的第一动作序列,将所述第一动作序列确定为所述目标动作序列;所述第二执行策略包括:获取预设的大语言模型基于所述状态描述文本输出的第二动作序列,将所述第二动作序列确定为所述目标动作序列,并将所述第二动作序列和所述状态向量对应存储到所述预设向量集合中。由于基于向量对包括一系列动作的动作序列进行存储和查找,提高了智能体根据所处环境执行动作的反应速度,降低了大语言模型的调用频率。

本文档来自技高网...

【技术保护点】

1.一种智能体行为确定方法,其特征在于,所述方法包括:

2.根据权利要求1所述的智能体行为确定方法,其特征在于,所述方法在所述获取智能体所处环境的环境状态信息,并根据所述环境状态信息生成状态描述文本之后,还包括:

3.根据权利要求1所述的智能体行为确定方法,其特征在于,所述获取预设的大语言模型基于所述状态描述文本输出的第二动作序列,将所述第二动作序列确定为所述目标动作序列,包括:

4.根据权利要求3所述的智能体行为确定方法,其特征在于,所述获取所述大语言模型基于所述状态描述文本输出的所述智能体在至少一段第一预设时长内的目标任务,包括:

5.根据权利要求1所述的智能体行为确定方法,其特征在于,所述基于所述动作执行策略控制所述智能体执行目标动作序列,还包括:

6.根据权利要求1-5任一项所述的智能体行为确定方法,其特征在于,所述获取智能体所处环境的环境状态信息,并根据所述环境状态信息生成状态描述文本,包括:

7.根据权利要求6所述的智能体行为确定方法,其特征在于,所述根据所述环境中发生的事件和以及所述事件的发生时间和执行主体,将所述环境状态信息存储到所述智能体对应的事件记忆库中,包括:

8.根据权利要求6所述的智能体行为确定方法,其特征在于,所述获取智能体所处环境的环境状态信息之后,所述方法还包括:

9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至8中任一项所述的智能体行为确定方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至8中任一项所述智能体行为确定方法的步骤。

...

【技术特征摘要】

1.一种智能体行为确定方法,其特征在于,所述方法包括:

2.根据权利要求1所述的智能体行为确定方法,其特征在于,所述方法在所述获取智能体所处环境的环境状态信息,并根据所述环境状态信息生成状态描述文本之后,还包括:

3.根据权利要求1所述的智能体行为确定方法,其特征在于,所述获取预设的大语言模型基于所述状态描述文本输出的第二动作序列,将所述第二动作序列确定为所述目标动作序列,包括:

4.根据权利要求3所述的智能体行为确定方法,其特征在于,所述获取所述大语言模型基于所述状态描述文本输出的所述智能体在至少一段第一预设时长内的目标任务,包括:

5.根据权利要求1所述的智能体行为确定方法,其特征在于,所述基于所述动作执行策略控制所述智能体执行目标动作序列,还包括:

6.根据权利要求1-5任一项所述的智能体行为确定方法,其特征在于,所述获取智能体所...

【专利技术属性】
技术研发人员:焦宇航吴宇翔张弛石含飞贾小虎郑乃榕郁杰
申请(专利权)人:超参数科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1