下载通过逆向强化学习的人类技能学习的技术资料

文档序号:41800870

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

一种用于使用逆向强化学习和强化学习奖励函数基于人类演示来教导机器人执行操作的方法。演示者执行操作,接触力和工件运动数据被记录。演示数据用于训练捕获人类技能的编码器神经网络,从而定义状态和动作的集合的高斯概率分布。编码器和解码器神经网络然后被...
该专利属于发那科株式会社所有,仅供学习研究参考,未经过发那科株式会社授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。