一种机器人抓取检测方法技术

技术编号:30348585 阅读:23 留言:0更新日期:2021-10-16 16:42
本发明专利技术公开了一种机器人抓取检测方法。针对输入物体图像信息采用区域候选网络对特征进行感兴趣区域提取和归一化操作,采用基于通道注意力机制的多层特征提取网络聚合特征映射的空间信息,通过将先验框与预测框进行重新编码使网络可以进行快速预测,通过设计新的RS损失函数来矫正抓取特征提取网络的学习方向,提升了对各种形状物体抓取框的检测能力。本发明专利技术将机器人抓取物体的检测过程分阶段处理,可以有效地应对机器人抓取单物体或多个物体堆积的场景,且能同时识别待抓取物体的类型,具有较高的机器人抓取检测精度和速度。有较高的机器人抓取检测精度和速度。有较高的机器人抓取检测精度和速度。

【技术实现步骤摘要】
一种机器人抓取检测方法


[0001]本专利技术属于计算机视觉与智能机器人领域,具体涉及一种机器人抓取检测方法。

技术介绍

[0002]在未来智能机器人中,环境感知能力是智能化水平的重要体现,例如在自动驾驶汽车方面,进行实时地图构建和出行避障成为了关键;另一方面就是对环境的认知能力,像人类一样认识各种物体的种类和所处位置,并能完成更多动作,其中机器人智能抓取物体在特殊危险环境、医疗和家庭服务机器人等方面扮演着重要角色。
[0003]目前抓取检测方法主要分为二维平面抓取检测和物体六自由度位姿估计两种方法。首先基于二维平面彩色图像的检测方法将输入图像划分为N个网格单元预测抓取矩形框相对于先验框的偏移量,虽然可以减少了网络模型回归边框的难度,但检测速度较慢且只关注抓取方面的检测能力,并不关心物体的种类信息。基于二维平面深度图的检测方法只考虑物体的外形信息,对输入深度图像的每个像素分别进行抓取质量、抓取角度和抓取宽度的预测。虽然达到了较高的运行速度,但对检测背景内不能有其它物体,这种方法同样也无法关注物体的类别信息。利用物体六自由度估计的方法进行检测主要是对物体的三维信息进行关键点的检测并生成可行的抓取候选者。但这种方法实际要求传感器精度高,抗干扰能力强,最好是多个传感器在不同的角度进行信息的融合。
[0004]基于此,本专利技术提供了一种机器人抓取检测方法。

技术实现思路

[0005]针对现有机器人抓取检测算法的缺陷,本专利技术的目的是提供一种机器人抓取检测方法。具有同时进行物体识别的特点,且能有效地应对多物体环境下的检测,有效地提升了机器人抓取的实用性。
[0006]为了达到上述目的,本专利技术包括以下步骤:
[0007]一种机器人抓取检测方法主要包括以下内容:
[0008]步骤一:利用Kinect相机获取包含机器人抓取物体的图像信息;
[0009]步骤二:利用卷积网络对获取的机器人抓取物体图像进行初步的语义特征提取获得初级特征图;
[0010]步骤三:利用区域候选网络对得到的初级特征图进行检测获得机器人抓取物体在输入图像上的位置信息;
[0011]步骤四:根据机器人抓取物体位置信息得到抓取物体在输入图像中的位置区域,然后对不同大小的区域进行同一池化操作,使输出的机器人抓取物体特征图尺寸相同;
[0012]步骤五:将获取到相同大小的机器人抓取物体特征图送入物体识别支路进行抓取物体识别检测和抓取检测支路进行抓取框检测;
[0013]步骤六:对属于同一区域的两个支路的机器人抓取物体的检测结果进行匹配,得到最终的机器人抓取物体检测结果。
[0014]根据本专利技术的一种机器人抓取检测方法,步骤二具体如下:
[0015]利用ResNet101的前四层网络作为我们的特征提取网络,该网络为全卷积网络,计算量相对于全连接网络大幅减少,通过16倍的下采样将输入机器人抓取物体图像中的物体纹理提取出来。
[0016]根据本专利技术的一种机器人抓取检测方法,步骤三具体如下:
[0017]首先对输入的机器人抓取物体的初级特征图进行3
×
3的卷积操作进行降维,然后利用两个1
×
1的卷积对特征图进行分类和回归计算,将得分较高的区域看作包含目标物体的区域。
[0018]根据本专利技术的一种机器人抓取检测方法,步骤五具体如下:
[0019]将同一尺寸的特征图经过由三个瓶颈层组成的模块进行更深层次语义特征的提取,并在每一个瓶颈层后加入通道注意力机制模块,利用全局池化和平均池化聚合输入机器人抓取物体特征映射的空间信息,提高抓取检测支路对物体抓取检测位置的预测能力。
[0020]对机器人物体抓取检测之路的抓取先验框与抓取真实框进行了匹配,编码公式如下:
[0021][0022]其中,c表示网格单元的宽度,n表示每个网格单元中的先验框数量,(t
x
,t
y
,t
w
,t
h
,t
a
)分别表示物体编码后预测框的中心点横纵坐标、宽高以及旋转角度;(b
x
,b
y
,b
w
,b
h
,b
a
)分别表示物体抓取先验框的中心点横纵坐标、宽高以及旋转角度,(p
x
,p
y
,p
w
,p
h
,p
a
)分别表示物体抓取真实框的中心点横纵坐标、宽高以及旋转角度。
[0023]抓取检测支路预测物体抓取框在图像中的位置,设计了新的旋转框的RS损失函数,公式如下:
[0024][0025]其中,L
gd
表示抓取物体的分类损失和回归损失之和;表示正样本中抓取先验框的概率,表示负样本中抓取物体先验框的概率;t
i
为表示预测抓取矩形框的向量,为与抓取先验框相关的真实框坐标;θ
i
为抓取预测框角度,为和抓取先验框匹配的真实框;N为匹配的抓取先验框数量,α表示损失函数中回归损失占的比重,β表示回归损失中旋转角度差值占的比重。
[0026]对属于同一区域的两个支路的机器人抓取物体的检测结果进行匹配,得到最终的机器人抓取物体检测结果。
附图说明
[0027]图1是系统框架流程图;
[0028]图2是本专利技术的机器人抓取检测方法流程图;
[0029]图3是抓取检测支路流程图;
[0030]图4是物体识别可视化结果图;
[0031]图5是抓取检测可视化结果图;
具体实施方式
[0032]以下结合附图和具体实施例对本专利技术作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本专利技术的保护范围进行任何限制。
[0033]步骤一:训练机器人抓取检测网络获得权重参数
[0034]利用VMRD数据集对两阶段检测网络进行训练和测试;
[0035]加载ResNet101在ImageNet数据集上的预训练模型,对数据集的图片进行数据增强,例如图像翻转、裁剪、光照变化、对比度变化和颜色变化等。
[0036]训练到30代后观察loss变化是否趋于稳定并小于设定值,满足条件后停止训练,保存权重文件;
[0037]步骤二:加载训练好的参数,准备利用机器人抓取物体图像进行检测;
[0038]步骤三:利用Kinect相机拍摄的机器人抓取物体图像作为我们检测模型的输入,输入的抓取物体图像尺寸不要求长宽相等,输入图像尺寸宽为600;
[0039]步骤四:输入机器人抓取物体图像到检测网络中,利用ResNet101的前四层卷积网络作为特征提取网络,将图像中的抓取物体的纹理特征提取出来;
[0040]步骤五:利用区域候选网络对获得的初级特征图进行检测获得物体在输入图像上的位置信息,首先对输入特征进行3
×
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种机器人抓取检测方法,其特征在于,该方法包括以下步骤:步骤一:利用Kinect相机采集机器人抓取物体的图像信息,利用ResNet101网络对待抓取物体图像进行初步的语义特征提取,对初级特征利用区域候选网络进行检测获得物体在输入图像上的位置信息;步骤二:根据步骤一中得到的物体位置信息对不同大小和形状的区域进行同一池化操作使各物体特征尺寸相同,然后将特征送入物体识别支路进行物体识别检测和抓取检测支路进行抓取框检测,对两个支路属于同一区域的检测结果进行匹配,最终得到机器人抓取物体的类别信息和抓取位置信息。2.根据权利要求1所述的一种机器人抓取检测方法,其特征在于:所述步骤一中的区域候选网络包括首先对获取到的初级抓取物体特征图进行3
×
3的卷积操作进行降维,然后利用两个1
×
1的卷积对特征图进行分类和回归计算,选取可能性较大的物体区域用于下一步检测。3.根据权利要求1所述的一种机器人抓取检测方法,其特征在于:所述步骤二中的抓取检测支路首先是由三个瓶颈层组成的模块,并在每一个瓶颈层后加入通道注意力机制模块,该支路输入特征图尺寸与输出特征图尺寸相同。4.根据权利要求1所述的一种机器人抓取检测方法,其特征在于:所述步骤二中的抓取检测支路将输出特征映射到步骤一中的初始特征图上,并在每个网格中设置6个大小与网格相同、角度相差30度的先验框,先验框与预测框的编码公式如下:其中,c表示网格单元的宽度,n表示每个网...

【专利技术属性】
技术研发人员:王洪刚胡标
申请(专利权)人:北京化工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1