一种强化学习与模糊避障融合的机械臂路径规划方法技术

技术编号:29606596 阅读:29 留言:0更新日期:2021-08-10 18:09
本发明专利技术属于智能控制领域,具体涉及一种强化学习与模糊避障融合的机械臂路径规划方法,包括以下步骤:在机械臂运动前,采用双目视觉系统的两台相同相机获取环境图片,三维重建构建三维空间立体模型,对空间进行离散化,即将目标转化为点的集合;构建模糊控制避障算法,使用强化学习在先验立体空间模型寻找最优轨迹,在遇到障碍物时启用模糊控制避障算法,躲避障碍物成功后再次进入强化学习算法使机械臂向目标点运动。该方法能够在不同的环境中根据不同的状态规划出可行路径,并且决策时间短、成功率高,能够满足在线规划的实时性要求,克服了传统机械臂路径规划方法实时性差、计算量大的缺点也克服了基于传统强化学习方法难以提高学习效率的缺点。

【技术实现步骤摘要】
一种强化学习与模糊避障融合的机械臂路径规划方法
本专利技术属于智能控制领域,特别涉及一种强化学习与模糊避障融合的机械臂路径规划方法,特别是6轴机械臂轨迹优化方法。
技术介绍
众所周知,通常,在对机械臂进行轨迹规划时,人们需要对外界的环境建立精确的数学模型,然后经过复杂的一系列计算,才能规划出一条轨迹。然而,外部环境是会一直变化的,这时就要求机械臂能够减少对外部环境模型的依赖,即机械臂的控制器能够根据外部环境智能地调整其输出轨迹,躲避障碍物,以此来适应动态多变的外部环境,完成所给的任务。将强化学习算法和模糊避障算法融合应用到机械臂的轨迹规划中,设计了一款用于轨迹规划的控制系统,该控制系统具有一定的泛化能力,它可以应用到不同型号和不同自由度的机械臂上,它也不需要像深度学习算法那样需要大量的标签数据集,只需要与环境交互学习就可以,并且其与传统的轨迹规划算法相比较,具有一定的自学习优势,即机械臂不必对外部环境构建精确的数学模型,也不需要重复的编写控制系统的程序,就可以实时学习到不同的轨迹规划策略。针对目前强化学习的方法,强化学习方法的描本文档来自技高网...

【技术保护点】
1.一种强化学习与模糊避障融合的机械臂路径规划方法,其特征在于,包括步骤如下:/n步骤1:用双目视觉系统两台相机获取机械臂工作场景的图像信息并进行三维重建;/n步骤2:利用基于稀疏奖励的深度强化学习改进算法选择最优轨线策略,以较高的学习效率在可行作业空间中为机械臂规划运动策略,利用模糊避障算法使机械臂以最小的代价避开障碍物,强化学习与模糊避障融合算法使得机械臂以最小代价运动到达目标位置。/n

【技术特征摘要】
1.一种强化学习与模糊避障融合的机械臂路径规划方法,其特征在于,包括步骤如下:
步骤1:用双目视觉系统两台相机获取机械臂工作场景的图像信息并进行三维重建;
步骤2:利用基于稀疏奖励的深度强化学习改进算法选择最优轨线策略,以较高的学习效率在可行作业空间中为机械臂规划运动策略,利用模糊避障算法使机械臂以最小的代价避开障碍物,强化学习与模糊避障融合算法使得机械臂以最小代价运动到达目标位置。


2.根据权利要求1所述的强化学习与模糊避障融合的机械臂路径规划方法,其特征在于,在步骤1中,采用双目视觉系统的两台相同规格的相机获取环境图片。


3.根据权利要求2所述的强化学习与模糊避障融合的机械臂路径规划方法,其特征在于,在步骤1中,对图片做预处理,对于获取的畸变向量,消除它的径向和切线方向上的镜头畸变,获得无畸变图像,同时建立摄像机的成像模型,确定目标点与像素点之间的对应关系;通过线性变换使处理后的无畸变图像中的共轭极线位于同一水平线上,把二维空间的匹配问题化简为一维空间的求解问题;将图片分成等大格栅;采用立体匹配算法得到校准后的图像与原图像的视差值,然后利用这个视差值得到每两幅图像之间的稀疏匹配,再通过优化算法,获得稠密匹配。


4.根据权利要求3所述的强化学习与模糊避障融合的机械臂路径规划方法,其特征在于,在步骤1中,三维重建采用三角测量原理计算获取的立体匹配图像的深度值,得到稠密的三维空间点云,再对获取的三维空间点云进行网格化和差值计算,得到物体的三维结构模型;对空间进行离散化,即将目标转化为点的集合。


5.根据权利要求1所述的强化学习与模糊避障融合的机械臂路径规划方法,其特征在于,所述步骤2中,使用模糊控制方法完成机械臂避障。


6.当机械臂与障碍物之间的距离小于最小避障距离时采用模糊控制,当避障成功之后并且机械臂的所处的状态与避障之前所处的状态不同时再把指挥权交由强化学习的路径规划。


7.根据权利要求1所述的强化学习与模糊避障融合的机械臂路径规划方法,其特征在于,所述步骤2中,定义模糊变量:对机械臂前端的四个超声传感器所测的机械臂到障碍物的距离分别定义为,并把作为模糊控制器的一组输入变量,把距离信息模糊化为两个等级,为{Far,Near}={“远”,“近”},论域定义为(0,),其中为人为设置的数值,这里取1。


8.根据权利要求1所述的强化学习与模糊避障融合的机械臂路径规划方法,其特征在于,所述步骤2中,引入输入变量:为了使在进行避障动...

【专利技术属性】
技术研发人员:谢玮孙宜枫马家辰张乐贡刘茂熠尹剑李永磊
申请(专利权)人:哈尔滨工业大学威海山东爱通工业机器人科技有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1