智能体的控制方法、终端设备及存储介质技术

技术编号:38989991 阅读:7 留言:0更新日期:2023-10-07 10:20
本申请公开了一种智能体的控制方法、终端设备及存储介质,其中,方法通过获取目标对象的指令语音,并将指令语音转换成指令文本,及根据指令文本确定智能体的目标任务;获取虚拟环境中智能体的第一状态信息、及第一交互信息;根据目标任务、第一状态信息及第一交互信息生成智能体在下一时刻的行动控制策略;根据行动控制策略控制智能体在下一时刻与虚拟环境交互,获取智能体在下一时刻的第二状态信息及智能体在下一时刻与虚拟环境交互的第二交互信息;根据第二状态信息和第二交互信息调整行动控制策略,直至智能体完成目标任务。本申请所提供的方法可以使得智能体在执行目标任务过程中所输出的动作更为合理、更具人性化,提高用户的游戏体验。提高用户的游戏体验。提高用户的游戏体验。

【技术实现步骤摘要】
智能体的控制方法、终端设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种智能体的控制方法、终端设备及存储介质。

技术介绍

[0002]随着人工智能(Artificial Intelligence,AI)技术的快速发展,人工智能技术被广泛应用于3D游戏、虚拟交通、自动驾驶仿真、机器人轨迹规划等各个领域,在3D虚拟空间中进行AI仿真具有非常大的商业价值,如通过人工智能技术可以实现各类游戏中智能体与真人,或者智能体与智能体之间的游戏对局。
[0003]在游戏对局中,如何用户的游戏体验,并实现智能体高度拟人化,一直都是本领域技术人员正在研究的热门课题。

技术实现思路

[0004]本申请实施例提供一种智能体的控制方法、终端设备及存储介质,旨在实现高度拟人化的AI仿真,并提高用户的游戏体验。
[0005]第一方面,本申请实施例提供了一种智能体的控制方法,所述方法包括:
[0006]获取目标对象的指令语音,并将所述指令语音转换成指令文本,及根据所述指令文本和智能体所处虚拟环境的环境信息确定智能体的目标任务;
[0007]获取所述虚拟环境中智能体的当前时刻的第一状态信息、及所述智能体在当前时刻与所述虚拟环境交互的第一交互信息;
[0008]根据所述目标任务、所述第一状态信息及所述第一交互信息生成所述智能体在下一时刻的行动控制策略,所述行动策略用于控制智能体执行对应的动作输出;
[0009]根据所述行动控制策略控制所述智能体在下一时刻与所述虚拟环境交互,并在所述智能体与所述虚拟环境交互过程中获取所述智能体在下一时刻的第二状态信息及所述智能体在下一时刻与所述虚拟环境交互的第二交互信息;
[0010]根据所述第二状态信息和所述第二交互信息调整所述行动控制策略,直至所述智能体完成所述目标任务。
[0011]第二方面,本申请实施例还提供了一种终端设备,所述终端设备包括处理器、存储器;所述存储器存储有可以被所述处理器调用并执行的计算机程序,其中,所述计算机程序被所述处理器执行时,实现前述的智能体的控制方法。
[0012]第三方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被处理器执行时使所述处理器实现前述的智能体的控制方法。
[0013]本申请实施例提供了一种智能体的控制方法、终端设备及存储介质,其中,该方法通过获取目标对象的指令语音,并将所述指令语音转换成指令文本,及根据所述指令文本和智能体所处虚拟环境的环境信息确定智能体的目标任务;获取所述虚拟环境中智能体的
当前时刻的第一状态信息、及所述智能体在当前时刻与所述虚拟环境交互的第一交互信息;根据所述目标任务、所述第一状态信息及所述第一交互信息生成所述智能体在下一时刻的行动控制策略,所述行动策略用于控制智能体执行对应的动作输出;根据所述行动控制策略控制所述智能体在下一时刻与所述虚拟环境交互,并在所述智能体与所述虚拟环境交互过程中获取所述智能体在下一时刻的第二状态信息及所述智能体在下一时刻与所述虚拟环境交互的第二交互信息;根据所述第二状态信息和所述第二交互信息调整所述行动控制策略,直至所述智能体完成所述目标任务。在智能体与虚拟环境交互过程中,基于指令语音确认智能体的目标任务,并基于目标任务和智能体的状态信息及智能体与环境的交互信息生成智能体的行动控制策略,且在智能体根据行动控制策略执行目标任务过程中,根据智能体的状态信息及智能体与环境的交互信息对行动控制策略进行调整,从而使得智能体在执行目标任务过程中所输出的动作更为合理、更具人性化,提高用户的游戏体验。同时,通过语音提供智能体的控制指令,使得智能体的控制方式更为多元化,用户的游戏体验效果更优。
附图说明
[0014]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0015]图1是本申请一实施例提供的一种智能体的控制方法的步骤流程图;
[0016]图2是本申请一实施例提供智能体行动策略生成方法中根据指令语音获得智能体目标任务的场景示意图;
[0017]图3是智能体在执行目标任务过程中,从当前位置移动至目标位置的多种路径示意图;
[0018]图4是本申请实施例提供的一种终端设备的示意性框图。
具体实施方式
[0019]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0020]附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0021]应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0022]还应当进理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0023]下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
[0024]随着人工智能(Artificial Intelligence,AI)技术的快速发展,人工智能技术被广泛应用于3D游戏、虚拟交通、自动驾驶仿真、机器人轨迹规划等各个领域,在3D虚拟空间中进行AI仿真具有非常大的商业价值,如通过人工智能技术可以实现各类游戏中智能体与真人,或者智能体与智能体之间的游戏对局。
[0025]在游戏对局中,如何用户的游戏体验,并实现智能体高度拟人化,一直都是本领域技术人员正在研究的热门课题。
[0026]为了解决上述问题,本申请的实施例提供了一种智能体的控制方法、终端设备及存储介质,旨在实现高度拟人化的AI仿真,并提高用户的游戏体验。其中,该智能体的控制方法可以应用于终端设备中,该终端设备可以为手机、台式机、平板或者服务器,其中,服务器可以为单台的服务器,也可以为由多台服务器组成的服务器集群。
[0027]请参阅图1,图1是本申请一实施例提供的一种智能体的控制方法的流程示意图。
[0028]如图1所示,该智能体的控制方法具体包括步骤S1至步骤S5。
[0029]步骤S1:获取目标对象的指令语音,并将所述指令语音转换成指令文本,及根据所述指令文本和智能体所处虚拟环境的环境信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能体的控制方法,其特征在于,应用于终端设备,所述方法包括:获取目标对象的指令语音,并将所述指令语音转换成指令文本,及根据所述指令文本和智能体所处虚拟环境的环境信息确定智能体的目标任务;获取所述虚拟环境中智能体的当前时刻的第一状态信息、及所述智能体在当前时刻与所述虚拟环境交互的第一交互信息;根据所述目标任务、所述第一状态信息及所述第一交互信息生成所述智能体在下一时刻的行动控制策略,所述行动策略用于控制智能体执行对应的动作输出;根据所述行动控制策略控制所述智能体在下一时刻与所述虚拟环境交互,并在所述智能体与所述虚拟环境交互过程中获取所述智能体在下一时刻的第二状态信息及所述智能体在下一时刻与所述虚拟环境交互的第二交互信息;根据所述第二状态信息和所述第二交互信息调整所述行动控制策略,直至所述智能体完成所述目标任务。2.根据权利要求1所述的方法,其特征在于,所述获取目标对象的指令语音,包括:通过语音采集设备采集目标对象所在环境的环境语音,所述环境语音包括目标对象的指令语音及环境噪音;对所述环境语音进行噪音除杂,得到所述目标对象的指令语音。3.根据权利要求2所述的方法,其特征在于,所述对所述环境语音进行噪音除杂,得到所述目标对象的指令语音,包括:将所述环境语音输入到语音提取模型的特征提取网络进行特征提取,获取所述环境语音对应的特征向量;将预设向量和所述特征向量输入到所述语音提取模型的语音提取网络,以从所述环境语音中提取出所述目标对象的指令语音,其中,所述语音提取模型通过目标对象的语音训练获得,所述预设向量根据所述环境噪音获得,所述语音提取网络以所述预设向量为参考,调整所述指令语音和所述环境噪音在所述环境语音中所占的比例,以得到所述目标对象的指令语音。4.根据权利要求1所述的方法,其特征在于,根据所述指令文本和智能体所处虚拟环境的环境信息确定智能体的目标任务,包括:对所述指令文本进行文本分词处理得到指令词集,并对所述指令词集进行文本校正得到校正指令集;根据所述校正指令集、所述指令文本和智能体所处虚拟环境的环境信息确定智能体的目标任务。5.根据权利要求4所述的方法,其特征在于,所述根据所述校正指令集、所述指令文本和智能体所处虚拟环境的环境信息确定智能体的目标任务,包括:获取...

【专利技术属性】
技术研发人员:马凯黄海峰朱晓龙
申请(专利权)人:深圳海普参数科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1