下载迁移强化学习控制方法、系统、存储介质、设备及应用的技术资料

文档序号:28675696

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明属于机器人控制技术领域,公开了一种迁移强化学习控制方法、系统、存储介质、设备及应用,采用交互渐进网络学习,先对人的评估以反馈网络进行建模预训练,用于在训练策略时预测人的评估;对使用渐进式网络迁移后的策略进行训练时,同时使用人的实时评估...
该专利属于中国海洋大学所有,仅供学习研究参考,未经过中国海洋大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。