下载基于状态序列的无人系统自主行为决策方法及相关装置的技术资料

文档序号:41283952

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开一种基于状态序列的无人系统自主行为决策方法及相关装置,涉及深度强化学习技术领域,方法包括以下步骤:获取专家演示数据集和在线动作状态数据集,训练判别器;基于在线动作状态数据集更新逆动力学模型的参数,以此对专家演示数据集的动作进行补全...
该专利属于上海大学所有,仅供学习研究参考,未经过上海大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。