下载一种基于图像域的机械臂高效操控归置学习奖励训练方法的技术资料

文档序号:35529884

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种基于图像域的机械臂高效操控归置学习奖励训练方法,实现杂乱场景中机械臂自主归置物体任务。该任务中,由于空间受限、复杂碰撞等约束的存在,导致终止状态是不可预测的,从而对奖励函数的设计带来了困难。本专利对强化学习的奖励是“步骤奖励...
该专利属于北京控制工程研究所所有,仅供学习研究参考,未经过北京控制工程研究所授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。