确定智能体处理的方法、装置、设备及存储介质制造方法及图纸

技术编号:33468923 阅读:24 留言:0更新日期:2022-05-19 00:47
本申请公开了一种确定智能体处理的方法、装置、设备及存储介质,属于人工智能技术领域。所述方法包括:每当达到决策周期时,确定目标智能体对应的第一环境特征;获取所述目标智能体的邻居智能体对应的第二环境特征,所述邻居智能体为多智能体系统中预设的与所述目标智能体进行通信的智能体;基于所述第一环境特征和所述第二环境特征,生成目标融合环境特征;将所述目标融合环境特征输入到策略网络,得到所述目标智能体在当前决策周期需要执行的目标处理。采用本申请,能够提高智能体在决策周期确定需要执行处理的效率。期确定需要执行处理的效率。期确定需要执行处理的效率。

【技术实现步骤摘要】
确定智能体处理的方法、装置、设备及存储介质


[0001]本申请涉及人工智能
,特别涉及一种确定智能体处理的方法、装置、设备及存储介质。

技术介绍

[0002]多智能体系统由多个智能体构成,各智能体之间可以通过相互协作,共同完成一项复杂的任务。各智能体处于同一环境下,每个智能体可以对其周围的环境进行观测,并对观测到的环境进行特征提取得到对应的环境特征。每个智能体可通过策略网络对得到的环境特征进行计算,以确定在每个决策周期需要执行的处理。其中,智能体可以是在指定的环境中进行独立决策的实体,该实体可以以硬件的形式存在,例如可以是无人机、机器人等。也可以以软件的形式存在,例如可以是电子游戏中的人工智能(Artificial Intelligence,AI)游戏角色等。对应的各智能体所处的环境可以是真实的环境,例如可以是无人机的拍摄装置拍摄的图像。也可以是虚拟的环境,例如可以是AI游戏角色攻击范围内的其他AI游戏角色的信息等。
[0003]由于一个智能体观测到的周围的环境有限,进而得到的环境特征中包括环境的信息量较少。如此只根据较少信息量的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种确定智能体处理的方法,其特征在于,所述方法包括:每当达到决策周期时,确定目标智能体对应的第一环境特征;获取所述目标智能体的邻居智能体对应的第二环境特征,所述邻居智能体为多智能体系统中预设的与所述目标智能体进行通信的智能体;基于所述第一环境特征和所述第二环境特征,生成目标融合环境特征;将所述目标融合环境特征输入到策略网络,得到所述目标智能体在当前决策周期需要执行的目标处理。2.根据权利要求1所述的方法,其特征在于,所述获取所述目标智能体的邻居智能体对应的第二环境特征之前,所述方法还包括:基于预设的目标智能体与邻居智能体的对应关系,确定所述目标智能体的邻居智能体。3.根据权利要求1所述的方法,其特征在于,所述基于所述第一环境特征和所述第二环境特征,生成目标融合环境特征,包括:将所述第一环境特征输入到编码器,得到第一待融合特征;将所述第二环境特征输入到所述编码器,得到第二待融合特征;对所述第一待融合特征和所述第二待融合特征进行融合处理,得到目标融合环境特征。4.根据权利要求1所述的方法,其特征在于,所述基于所述第一环境特征和所述第二环境特征,生成目标融合环境特征,包括:将所述第一环境特征分别输入到多个编码器,得到多个第三待融合特征;将所述第二环境特征分别输入到所述多个编码器,得到多个第四待融合特征;分别对由相同编码器得到的第三待融合特征和第四待融合特征进行融合处理,得到多个待拼接的融合特征;将所述多个待拼接的融合特征进行拼接处理,得到目标融合环境特征。5.根据权利要求1所述的方法,其特征在于,所述基于所述第一环境特征和所述第二环境特征,生成目标融合环境特征,包括:对所述第一环境特征和所述第二环境特征进行融合处理,得到第一次融合处理后的融合环境特征;将n取值为2,获取所述目标智能体的邻居智能体进行第n

1次融合处理后得到的融合环境特征;将目标智能体的邻居智能体进行第n

1次融合处理后得到的融合环境特征,与所述目标智能体进行第n

1次融合处理后的融合环境特征进行融合处理,得到所述第n次融合处理后的融合环境特征;如果n小于N,则将n的取值加1,转至执行所述获取所述目标智能体的邻居智能体进行第n

1次融合处理后得到的融合环境特征,其中,N为预设的进行融合处理的总次数,N大于或等于2;如果n等于N,则将每次融合处理后得到的融合环境特征进行拼接处理,得到目标融合环境特征。6.根据权利要求1所述的方...

【专利技术属性】
技术研发人员:陈淙靓赵沛霖许可
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1