基于坐标匹配的目标检测与抓取方法技术

技术编号:39719927 阅读:6 留言:0更新日期:2023-12-17 23:26
本发明专利技术提供的一种基于坐标匹配的目标检测与抓取方法,包括以下步骤:

【技术实现步骤摘要】
基于坐标匹配的目标检测与抓取方法


[0001]本专利技术涉及一种目标检测与抓取方法,尤其涉及一种基于坐标匹配的目标检测与抓取方法


技术介绍

[0002]目前关于服务机器人目标识别与抓取融合的研究报道较少

对于服务机器人来说,完成取水

取药等生命维持任务仍然是一个难题

随着信息时代大数据

人工智能等相关研究的出现,深度学习技术得以发展

在计算机视觉相关领域,各研究人员通过大数据训练不同的深度神经网络模型,以获得良好的图像特征提取与表达能力,并在目标检测

视觉抓取等方向取得了优于传统算法的结果,也使得它们的应用范围更加广泛

[0003]由于当前有关目标检测和抓取估计的研究相对零散,导致机器人高效完成识别抓取任务具有较大的挑战性,此外,由于不同室内场景之间的显著差异以及遮挡等干扰的存在,进一步增加了精确检测和抓取物体的难度

[0004]因此,为解决上述技术问题,亟需提出一种新的技术手段


技术实现思路

[0005]为了增强服务机器人的目标检测和抓取能力,促进其广泛应用,本文提出了一种基于坐标匹配的目标检测与抓取方法,包括以下步骤:
[0006]S1.
构建目标检测模型和目标提取模型;
[0007]S2.
训练目标检测模型和目标提取模型,得到训练完成的目标检测模型和目标提取模型;
[0008]S3.
将目标图像输入至训练完成的目标检测模型中,得到目标图像的类别和检测框坐标信息;将目标图像输入至训练完成的目标提取模型中,得到目标图像的提取框坐标信息和提取框对应的位姿;
[0009]S4.
将目标图像的类别和检测框的坐标信息储存到坐标匹配字典中;
[0010]S5.
将待提取类别输入到坐标匹配字典中,通过坐标匹配方法确定待提取类别的提取框,并根据待提取类别的提取框确定提取位姿;
[0011]确定待提取类别的提取框步骤如下:
[0012]S51.
根据输入的待提取类别遍历匹配字典中所有的类别,当查询到匹配的类别时,获取对应的目标检测框坐标信息;
[0013]S52.
计算步骤
S3
输出的提取框的中心坐标;
[0014]S53.
判断步骤
S3
输出的提取框的中心坐标是否位于检测框内,如是,则保留,如否,则舍弃;
[0015]S54.
将剩下的提取框按照质量分数从高到低进行排列,确定质量分数最高的提取框为待提取类别的提取框;
[0016]S6.
根据提取位姿计算机械臂关节转动量;
[0017]S7.
根据机械臂关节转动量执行抓取任务

[0018]进一步,步骤
S1
中,目标检测模型是改进的
SOLOv2
网络模型,包括主干网络

头部网络和预测层,其中,主干网络的输出端连接头部网络的输入端,头部网络的输出端连接预测层的输入端;
[0019]主干网络包括
Resnet50
网络和
FPN
网络,
Resnet50
网络的输出端连接
FPN
网络的输入端;其中
Resnet50
网络包括五层
ResLayer
和四个
SAM
模块;
[0020]其中,
ResLayer1
的输出端连接
SAM
模块的输入端,
SAM
模块的输出端连接
ResLayer2
的输入端,
ResLayer2
的输出端连接
SAM
模块的输入端,
SAM
模块的输出端连接
ResLayer3
的输入端,
ResLayer3
的输出端连接
SAM
模块的输入端,
SAM
模块的输出端连接
ResLayer4
的输入端,
ResLayer4
的输出端连接
SAM
模块的输入端,
SAM
模块的输出端连接
ResLayer5
的输入端;
ResLayer1、ResLayer2、ResLayer3、ResLayer4

ResLayer5
分别输出特征图
C1、C2、C3、C4

C5

[0021]FPN
网络包括四个1×1卷积核

四个3×3卷积核

三个上采样模块和四个
CAM
模块;其中,特征图
C5
输入第一个1×1卷积核中,第一个1×1卷积核的输出端连接第一个3×3卷积核的输入端,第一个3×3卷积核的输出端连接
CAM
模块的输入端,
CAM
模块输出特征图
P5
,第一个1×1卷积核的输出端还连接第一个上采样模块的输入端,第一个上采样模块的输出端连接第二个1×1卷积核的输出端,特征图
C4
输入第二个1×1卷积核中,第二个1×1卷积核的输出与第一个上采样模块的输出进行特征融合并输出至第二个3×3卷积核中,第二个3×3卷积核的输出端连接
CAM
模块的输入端,
CAM
模块输出特征图
P4
,第二个1×1卷积核的输出端还连接第二个上采样模块的输入端,第二个上采样模块的输出端还连接第三个1×1卷积核的输出端,特征图
C3
输入第三个1×1卷积核中,第三个1×1卷积核的输出与第二个上采样模块的输出进行特征融合并输出至第三个3×3卷积核中,第三个3×3卷积核的输出端与
CAM
模块的输入端连接,
CAM
模块输出特征图
P3
,第三个1×1卷积核的输出端还连接第三个上采样模块的输入端,第三个上采样模块的输出端连接第四个1×1卷积核的输出端,特征图
C2
输入至第四个1×1卷积核中,第四个1×1卷积核的输出与第三个上采样模块的输出进行特征融合并输出至第四个3×3卷积核中,第四个3×3卷积核的输出端连接
CAM
模块的输入端,
CAM
模块输出特征图
P2
;特征图
P1

ResLayer1
输出的特征图
C1

[0022]头部网络包括类别分支和掩码分支,类别分支的输出端连接掩码分支的输入端,掩码分支的输出端连接类别分支的输入端,类别分支的输出端还连接预测层的输入端,掩码分支的输出端还连接预测层的输本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于坐标匹配的目标检测与抓取方法,其特征在于:包括以下步骤:
S1.
构建目标检测模型和目标提取模型;
S2.
训练目标检测模型和目标提取模型,得到训练完成的目标检测模型和目标提取模型;
S3.
将目标图像输入至训练完成的目标检测模型中,得到目标图像的类别和检测框坐标信息;将目标图像输入至训练完成的目标提取模型中,得到目标图像的提取框坐标信息和提取框对应的位姿;
S4.
将目标图像的类别和检测框的坐标信息储存到坐标匹配字典中;
S5.
将待提取类别输入到坐标匹配字典中,通过坐标匹配方法确定待提取类别的提取框,并根据待提取类别的提取框确定提取位姿;确定待提取类别的提取框步骤如下
:S51.
根据输入的待提取类别遍历匹配字典中所有的类别,当查询到匹配的类别时,获取对应的目标检测框坐标信息;
S52.
计算步骤
S3
输出的提取框的中心坐标;
S53.
判断步骤
S3
输出的提取框的中心坐标是否位于检测框内,如是,则保留,如否,则舍弃;
S54.
将剩下的提取框按照质量分数从高到低进行排列,确定质量分数最高的提取框为待提取类别的提取框;
S6.
根据提取位姿计算机械臂关节转动量;
S7.
根据机械臂关节转动量执行抓取任务
。2.
根据权利要求1所述的基于坐标匹配的目标检测与抓取方法,其特征在于:步骤
S1
中,目标检测模型是改进的
SOLOv2
网络模型,包括主干网络

头部网络和预测层,其中,主干网络的输出端连接头部网络的输入端,头部网络的输出端连接预测层的输入端;主干网络包括
Resnet50
网络和
FPN
网络,
Resnet50
网络的输出端连接
FPN
网络的输入端;其中
Resnet50
网络包括五层
ResLayer
和四个
SAM
模块;其中,
ResLayer1
的输出端连接
SAM
模块的输入端,
SAM
模块的输出端连接
ResLayer2
的输入端,
ResLayer2
的输出端连接
SAM
模块的输入端,
SAM
模块的输出端连接
ResLayer3
的输入端,
ResLayer3
的输出端连接
SAM
模块的输入端,
SAM
模块的输出端连接
ResLayer4
的输入端,
ResLayer4
的输出端连接
SAM
模块的输入端,
SAM
模块的输出端连接
ResLayer5
的输入端;
ResLayer1、ResLayer2、ResLayer3、ResLayer4

ResLayer5
分别输出特征图
C1、C2、C3、C4

C5

FPN
网络包括四个1×1卷积核

四个3×3卷积核

三个上采样模块和四个
CAM
模块;其中,特征图
C5
输入第一个1×1卷积核中,第一个1×1卷积核的输出端连接第一个3×3卷积核的输入端,第一个3×3卷积核的输出端连接
CAM
模块的输入端,
CAM
模块输出特征图
P5
,第一个1×1卷积核的输出端还连接第一个上采样模块的输入端,第一个上采样模块的输出端连接第二个1×1卷积核的输出端,特征图
C4
输入第二个1×1卷积核中,第二个1×1卷积核的输出与第一个上采样模块的输出进行特征融合并输出至第二个3×3卷积核中,第二个3×3卷积核的输出端连接
CAM
模块的输入端,
CAM
模块输出特征图
P4
,第二个1×1卷积核的输出端还连接第二个上采样模块的输入端,第二个上采样模块的输出端还连接第三个1×1卷
积核的输出端,特征图
C3
输入第三个1×1卷积核中,第三个1×1卷积核的输出与第二个上采样模块的输出进行特征融合并输出至第三个3×3卷积核中,第三个3×3卷积核的输出端与
CAM
模块的输入端连接,
CAM
模块输出特征图
P3
,第三个1×1卷积核的输出端还连接第三个上采样模块的输入端,第三个上采样模块的输出端连接第四个1×1卷积核的输出端,特征图
C2
输入至第四个1×1卷积核中,第四个1×1卷积核的输出与第三个上采样模块的输出进行特征融合并输出至第四个3×3卷积核中,第四个3×3卷积核的输出端连接
CAM
模块的输入端,
CAM
模块输出特征图
P2
;特征图
P1

ResLayer1
输出的特征图
C1
;头部网络包括类别分支和掩码分支,类别分支的输出端连接掩码分支的输入端,掩码分支的输出端连接类别分支的输入端,类别分支的输出端还连接预测层的输入端,掩码分支的输出端还连接预测层的输入端;掩码分支包括核分支和特征分支,核分支的输出端连接特征分支的输入端
。3.
根据权利要求1所述的基于坐标匹配的目标检测与抓取方法,其特征在于:步骤
S1
中,目标抓取模型是改进的残差卷积神经网络
GRCNN
,目标抓取模型包括
CBR
模块
、ASPP
模块

残差块和
CTBR
模块;其中,
CBR
模块的输出端连接
ASPP
模块的输入端,

【专利技术属性】
技术研发人员:刘宗敏王吉睿黎杰崔龙国蔡亮周泰霖李文钊管浩博
申请(专利权)人:重庆市质量和标准化研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1