下载一种软双评估器梯度融合的多智能体强化学习方法的技术资料

文档序号:34637025

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种软双评估器梯度融合的多智能体强化学习方法,属于人工智能领域。本发明提出一种利用个体奖励知识解决合作型多智能体强化学习中团队奖励稀疏的问题的新方法,在该方法中每个智能体使用两个评估器分别学习个体奖励和团队奖励,共同指导智能体策...
该专利属于网易(杭州)网络有限公司江苏万维艾斯网络智能产业创新中心有限公司所有,仅供学习研究参考,未经过网易(杭州)网络有限公司江苏万维艾斯网络智能产业创新中心有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。