当前位置: 首页 > 专利查询>南通大学专利>正文

基于深度强化学习与动态运动基元的机械臂自主抓取方法技术

技术编号:25508904 阅读:33 留言:0更新日期:2020-09-04 16:57
本发明专利技术公开了基于深度强化学习与动态运动基元的机械臂自主抓取方法,包括如下步骤:步骤1:安装摄像机图组件,确保识别区域不被遮挡,并对抓取目标区域图像进行预处理,并作为状态信息发送给深度强化学习智能体;步骤2:基于所述状态和深度强化学习原理构建局部策略近端优化训练模型;步骤3:融合动态运动基元和模仿学习构建一种新的混合运动基元模型;步骤4:基于所述的模型训练机械臂自主抓取物体。本发明专利技术能够有效解决基于传统深度强化学习的机械臂关节运动不平滑问题,通过结合动态运动基元算法,把元参数的学习问题转化为强化学习问题,可以利用深度强化学习的训练方法使得机械臂完成自主抓取任务。

【技术实现步骤摘要】
基于深度强化学习与动态运动基元的机械臂自主抓取方法
本专利技术涉及机械臂和深度强化学习训练系统
,具体为基于深度强化学习与动态运动基元的机械臂自主抓取方法。
技术介绍
目前机器人技术的研究已经从传统的机械动力学开始向智能化控制方向进行转变,特别是综合吸收了控制理论、人工神经网络和机器学习等领域的研究成果后,机器人技术已经逐渐成为了人工智能领域的核心之一。作为近年来机器学习领域中的研究热点之一,深度强化学习无论是在理论研究上还是在实际应用中都取得了丰富的成果。然而,机器人在解决现实生活中遇到的问题时,只有一个好的深度强化学习算法是远远不够的。这是因为传统的深度强化学习算法的控制策略是逐步生成的,这种策略更倾向于使机器人快速的完成任务,而不是模仿示教运动轨迹平滑的运动。由于机器人关节运动是由电机进行驱动控制的,如果电机的运动轨迹(角度轨迹、角速度轨迹和角加速度轨迹)具有较大的波动性,此时电机的驱动力矩也会产生很大的波动性,甚至是较大的突变值,这容易对机器人关节造成损害。因此,与人类运动一样,机械臂的运动需要平滑的进行编码,没有突然的加速或颠簸本文档来自技高网...

【技术保护点】
1.基于深度强化学习与动态运动基元的机械臂自主抓取方法,其特征在于:包括如下步骤:/n步骤1:安装摄像机图组件,确保识别区域不被遮挡,并对抓取目标区域图像进行预处理,并作为状态信息发送给深度强化学习智能体;/n步骤2:基于所述状态和深度强化学习原理构建局部策略近端优化训练模型;/n步骤3:融合动态运动基元和模仿学习构建一种新的混合运动基元模型;/n步骤4:基于所述的模型训练机械臂自主抓取物体。/n

【技术特征摘要】
1.基于深度强化学习与动态运动基元的机械臂自主抓取方法,其特征在于:包括如下步骤:
步骤1:安装摄像机图组件,确保识别区域不被遮挡,并对抓取目标区域图像进行预处理,并作为状态信息发送给深度强化学习智能体;
步骤2:基于所述状态和深度强化学习原理构建局部策略近端优化训练模型;
步骤3:融合动态运动基元和模仿学习构建一种新的混合运动基元模型;
步骤4:基于所述的模型训练机械臂自主抓取物体。


2.根据权利要求1所述的基于深度强化学习与动态运动基元的机械臂自主抓取方法,其特征在于:在步骤1中,安装摄像机图组件,确保识别区域不被遮挡,并对抓取目标区域图像进行采集处理,作为状态信息发送给深度强化学习智能体,包括:
摄像机,所述摄像机为双目摄像机Bumblee2,所述摄像机安装在机械臂距离底座上方0.8-1米,且在识别区域正前方,确保机械臂开始工作时无遮挡;摄像机拍摄的识别区域的图像信息,经采集预处理后,该信息将作为环境状态被系统接收;
机械臂,所述机械臂为具有5个自由度的UR5机器人,各关节能够灵活运动。


3.根据权利要求1所述的基于深度强化学习与动态运动基元的机械臂自主抓取方法,其特征在于:在步骤2中,基于所述状态和深度强化学习原理构建局部策略近端优化训练模型包括:在系统中通过设计奖赏函数来评判机械臂是否抓取到物体,奖赏函数的设定为稀疏的,当机械臂完成抓取任务的时候获得奖赏为+1,其它时刻为零,从而引导机械臂快速完成抓取任务获得更多的奖赏回报;机械臂从初始状态到完成抓取任务的运动轨迹可以通过一组元参数δ表示,
是机械臂到达目标位置时对应的关节角度和角速度的值,局部策略近端优化训练模型的目的就是训练学习一个从状态s到元参数δ的映射函数δ(s);将元参数自我学习问题建模为强化学习问题,目标函数可以表示为:



其中Kullback-Leibler距离通常被用来约束策略更新的幅度大小,使策略梯度算法具有更强的鲁棒性,超参数KLtarget网络参数的期望变化,依据深度强化学习策略梯度更新规则,依据所述目标函数优化网络参数θ。

【专利技术属性】
技术研发人员:袁银龙华亮李俊红徐一鸣程赟
申请(专利权)人:南通大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1