下载一种无人系统稳定决策方法、产品、介质及设备的技术资料

文档序号:41848688

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开一种无人系统稳定决策方法、产品、介质及设备,涉及强化学习领域,方法包括:初始化环境、经验池、各网络参数;将无人系统与环境交互产生的数据存储于经验池;计算集成策略价值网络损失并更新其参数;将该网络作为教师网络,计算学生网络综合损失并...
该专利属于上海大学所有,仅供学习研究参考,未经过上海大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。