智能体的控制方法、装置和设备制造方法及图纸

技术编号：41289064 阅读：22 留言：0更新日期：2024-05-11 09:38

本申请实施例提供一种智能体的控制方法、装置和电子设备，涉及数据处理技术领域。该方法包括：在控制智能体执行任务时，先获取智能体执行任务过程中的目标环境动作数据；将目标环境动作数据输入至目标时序网络模型中，通过目标时序网络模型提取目标环境动作数据对应的目标环境动作特征；其中，目标时序网络模型是基于智能体成功执行任务的第一环境动作数据集和未成功执行任务的第二环境动作数据集训练得到的；基于目标环境动作特征，控制智能体执行任务，这样不仅可以有效地提高非优数据的利用率；而且通过目标时序网络模型提取的目标环境动作特征控制智能体执行任务，可以提高智能体控制的准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理，尤其涉及一种智能体的控制方法、装置和设备。

技术介绍

1、在智能体控制场景中，例如智能交通控制、智能制造控制、智能家居控制、智能医疗控制、智慧物流控制、或者智慧零售控制等，通常需要基于智能体执行任务过程中的环境动作特征，控制智能体执行相关的操作任务。

2、因此，如何准确地提取智能体执行任务过程中的环境动作特征，从而提高智能体控制的准确度，是本领域技术人员需要解决的技术问题。

技术实现思路

1、本申请提供一种智能体的控制方法、装置和设备，可以准确地提取智能体执行任务过程中的环境动作特征，从而提高了智能体控制的准确度。

2、本申请提供一种智能体的控制方法，该方法可以包括：

3、获取智能体执行任务过程中的目标环境动作数据；

4、将所述目标环境动作数据输入至目标时序网络模型中，通过所述目标时序网络模型提取所述目标环境动作数据对应的目标环境动作特征；其中，所述目标时序网络模型是基于智能体成功执行任务的第一环境动作数据集和未成功执行任...

【技术保护点】

1.一种智能体的控制方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述时序网络模型基于智能体成功执行任务的第一环境动作数据集和未成功执行任务的第二环境动作数据集训练，包括以下步骤：

3.根据权利要求2所述的方法，其特征在于，所述基于所述第一环境动作数据集和所述第二环境动作数据集，对初始时序网络模型进行预训练，得到时序网络模型，包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述多个环境动作数据、所述多个重建环境动作数据和历史环境动作数据集，对所述初始时序网络模型进行预训练，包括：

5.根据权利要求3所述的方法...

【技术特征摘要】

1.一种智能体的控制方法，其特征在于，包括：

5.根据权利要求3所述的方法，其特征在于，所述基于所述多个环境动作数据和所述历史环境动作数据集，构造第二损失函数，包括：

6.根据权利要求3-5任一项所述的方法，其特征在于，所述基于所述时序网络模型和所述第一环境动作数据集，从所述第二环境动作数据集中确定目标环境动作数据集，包括：

【专利技术属性】
技术研发人员：伍堃，刘宁，赵震，车正平，徐志远，唐剑，
申请(专利权)人：美的集团上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人