一种基于乐观投影的策略梯度多智能体强化学习方法技术资料下载

当前位置: 首页 > 专利查询>江苏万维艾斯网络智能产业创新中心有限公司 > 一种基于乐观投影的策略梯度多智能体强化学习方法技术 >技术资料下载

下载一种基于乐观投影的策略梯度多智能体强化学习方法的技术资料

文档序号：38003880

温馨提示：您尚未登录，请点登陆后下载，如果您还没有账户请点注册，登陆完成后，请刷新本页查看技术详细信息。

本发明公开了一种基于乐观投影的策略梯度多智能体强化学习方法，属于人工智能领域。本方法包含如下步骤：1、构建智能体初始策略网络；2、构建基于值分解的值函数评估网络；3、基于乐观投影对局部效用函数进行训练更新；4、使用整体Q值对值函数评估网络进...
该专利属于江苏万维艾斯网络智能产业创新中心有限公司所有，仅供学习研究参考，未经过江苏万维艾斯网络智能产业创新中心有限公司授权不得商用。

详细技术文档下载地址

温馨提示：您尚未登录，请点登陆后下载，如果您还没有账户请点注册，登陆完成后，请刷新本页查看技术详细信息。