The present disclosure provides a visual grasping system of a manipulator based on self-supervised learning neural network, including a depth-of-field camera, an instance segmentation module, a pose estimation neural network module, a stereo pose acquisition module and a manipulator control module. The depth-of-field camera outputs a color image to an instance segmentation module, and a depth-of-field image to a stereo pose acquisition module. At least one input pose estimation neural network module of classification, frame or segmented information is used in the instance segmentation module; the pose estimation neural network module outputs the plane pose to the stereo pose acquisition module, and fuses the scene depth image to obtain the stereo pose; the manipulator control module obtains the stereo pose, and realizes the manipulator grasping operation according to the stereo pose. The present disclosure not only identifies the approximate contour position of the object to be grabbed, but also further calculates the precise grabbing position and angle by using the neural network with full connection layer.
【技术实现步骤摘要】
基于自监督学习神经网络的机械臂视觉抓取系统及方法
本公开涉及机械臂
,尤其涉及一种基于自监督学习神经网络的机械臂视觉抓取系统及方法。
技术介绍
机械臂是能模仿人手和臂的某些动作功能,用以按固定程序抓取,搬运物件或者操作工具的自动操作装置。机械臂可以代替人的繁重劳动以实现生产的机械化和自动化,能在有害环境下操作以保护人身安全,因而广泛应用与机械制造,冶金,轻工和原子能等领域。工业上,机械臂抓取操作大多采用传统示教的方式。然而对于一个全新的操作物体或者一个全新的操作环境,就需要对机械臂重新进行人工示教。随着机器视觉的发展与应用,越来越多基于视觉的智能化机械臂抓取位姿计算方法被提出。这些方法大体上可以分为两类,第一类方法基于机器学习,第二类方法则基于模板匹配。基于机器学习的计算方法通过学习的方式处理视觉图像中的特征,对抓取的位姿做出估计。该类方法依赖于被抓取物体的表面纹理信息,对于纹理信息丰富的物体具有较好的抓取位姿计算结果。然而,该方法在遇到表面缺少纹理信息的抓取物体时效果显然不理想。而基于模板匹配的方法则是将被抓取物体的轮廓信息与模板库中的模板轮廓进行匹配,从而根据最佳匹配模板的抓取位姿来估计被抓取物体的位姿。此类方法不再基于物体表面的纹理信息,只需物体的轮廓即可。因此,该类方法能够改善纹理缺失的物体抓取,却对于轮廓部分受遮挡的物体易出现错误估计的情况。此外,现有的方法仅基于机器视觉,却没有考虑到被抓取物体的实际质量分布这一实际抓取中的重要影响因素。
技术实现思路
(一)要解决的技术问题本公开提供了一种基于自监督学习神经网络的机械臂视觉抓取系统及方法,以至 ...
【技术保护点】
1.一种基于自监督学习神经网络的机械臂视觉抓取系统,包括:景深摄像头、实例分割模块、位姿估计神经网络模块、立体位姿获取模块及机械臂控制模块,其中,所述景深摄像头输出色彩图像到实例分割模块,输出景深图像到立体位姿获取模块;所述实例分割模块将分类、框体或分割信息的至少一种输入位姿估计神经网络模块;所述位姿估计神经网络模块再输出平面位姿到立体位姿获取模块,与所述景深图像融合,获取立体位姿;机械臂控制模块获取所述立体位姿,并根据所述立体位姿实现机械臂抓取操作。
【技术特征摘要】
1.一种基于自监督学习神经网络的机械臂视觉抓取系统,包括:景深摄像头、实例分割模块、位姿估计神经网络模块、立体位姿获取模块及机械臂控制模块,其中,所述景深摄像头输出色彩图像到实例分割模块,输出景深图像到立体位姿获取模块;所述实例分割模块将分类、框体或分割信息的至少一种输入位姿估计神经网络模块;所述位姿估计神经网络模块再输出平面位姿到立体位姿获取模块,与所述景深图像融合,获取立体位姿;机械臂控制模块获取所述立体位姿,并根据所述立体位姿实现机械臂抓取操作。2.根据权利要求1所述的机械臂视觉抓取系统,其中,所述实例分割模块主要采用ResNet-101的残差神经网络为骨架来提取视觉图像所对应的特征图,并将建议框生成网络生成的建议框映射到特征图中对应的区域,并对区域特征进行回归,得到该区域特征中物体的位置信息;该区域特征的另一分支则通过特征金字塔网络后实现图像在一预定分辨率上的分割,代表被抓取物体在图像中的具体轮廓信息。3.根据权利要求2所述的机械臂视觉抓取系统,其中,所述位姿估计神经网络模块包括由五层卷积层和两层全连接层组成的位姿估计神经网络,其输入为实例分割模块得到的具体轮廓信息,所述位姿估计神经网络模块将所述具体轮廓内的像素点作为抓取位置进行采样。4.根据权利要求3所述的机械臂视觉抓取系统,其中,所述位姿估计神经网络对以抓取位置为中心的固定尺寸的图像进行特征提取。5.根据权利要求4所述的机械臂视觉抓取系统,其中,所述位姿估计通过得分函数来获得最佳抓取位姿。6.一种基于自监督学习神经网络的机械臂视觉抓取方法,包括...
【专利技术属性】
技术研发人员:舒心,刘昶,李彤,
申请(专利权)人:中国科学院电子学研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。