下载基于评论家和双经验池的深度确定性策略梯度学习方法的技术资料

文档序号:21454879

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明提出的用于智能无人系统的基于评论家和双经验池的深度确定性策略梯度强化学习方法及设备,属于人工智能应用技术领域,主要包括:确定所述智能无人系统的智能体的观测空间和动作空间大小,构建行动者actor模块与评论家critic模块;创建所述c...
该专利属于中国科学院软件研究所所有,仅供学习研究参考,未经过中国科学院软件研究所授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。