一种基于改进YOLOv5算法的机械臂抓取目标物体检测方法技术

技术编号:38587735 阅读:14 留言:0更新日期:2023-08-26 23:29
一种基于改进YOLOv5算法的机械臂抓取目标物体检测方法,属于图像识别技术领域,S1、获取数据集及进行数据预处理:S2、对现有的YOLOv5网络进行改进:S21、搭建空间

【技术实现步骤摘要】
一种基于改进YOLOv5算法的机械臂抓取目标物体检测方法


[0001]本专利技术属于图像识别
,具体涉及一种基于改进YOLOv5算法的机械臂抓取目标物体检测方法。

技术介绍

[0002]YOLOv5目标检测算法检测速度快,检测精度高,在开源数据集上具有比较好的检测性能,但是对自定义数据集样本模型及局部特征准确识别和准确定位方面,性能还有待加强,对整体的输入图像来讲,检测的目标物体在整体图像中占比很小,其余的图像信息均作为背景出现,在经过多次卷积后,背景信息会多次迭代累积,从而出现信息冗余,对目标物体识别以及定位造成干扰,除此之外,在位姿估计算法中,本项目需要用YOLOv5算法网络对标记的局部特征信息定位,利用各部分特征的位置信息进行后续的位姿估计,因此精准的定位对本实验来说非常重要。首先为了得到精确的定位信息,本专利技术将空间注意力机制(SA)和坐标注意力机制(CA)结合,提出了一个空间—坐标注意力机制(SCAA),然后在YOLOv5主干网络中加入SCAA模块,在Neck检测层(目标检测层)中引入BiFPN模块(双向特征金字塔网络),并根据自定义数据集的需要优化锚框参数,提出了一个基于YOLOv5的YOLOv5

ABN目标检测算法(融合了空间注意力机制与坐标注意力机制,且加入了BiFPN模块的新算法),用改进后的YOLOv5

ABN算法对自定义数据集和康奈尔数据集进行训练,对改进模块做了消融实验,并与现有的目标检测算法在性能上进行对比分析。

技术实现思路

[0003]为了解决YOLOv5对目标物体及局部特征定位不准确的问题,本专利技术提出:一种基于改进YOLOv5算法的机械臂抓取目标物体检测方法,包括如下步骤:
[0004]S1、获取数据集及进行数据预处理:
[0005]从网上下载康奈尔数据集,使用通用的标注软件labelimg标注工具对获得的数据图片进行标注,标注完成后,将PASCAL格式的文件转换成YOLO格式的文件,完成数据集制作;
[0006]S2、对现有的YOLOv5网络进行改进;
[0007]S21、搭建空间

坐标注意力机制SCAA,实现对目标物体及局部特征信息的准确定位,受卷积注意力机制CBAM的启发,将空间注意力机制SA和坐标注意力机制CA结合;
[0008]S22、多尺度特征融合网络,YOLOv5的Neck结构采用的是FPN+PANeT相结合的方式,根据BiFPN网络特征融合方式的优越性,借鉴BiFPN结构的特点,对YOLOv5算法模型网络进行改进;
[0009]S23、优化锚框参数,YOLOv5采用自适应锚定框对训练数据自动学习,通过使用Kmeans聚类算法对数据集的目标框gt自动计算;
[0010]S3、训练网络模型。
[0011]本专利技术的有益效果为:本专利技术提出了一种基于改进YOLOv5算法的机械臂抓取目标
物体检测方法,该方法将空间注意力机制(SA)和坐标注意力机制(CA)结合,提出了一个空间—坐标注意力机制(SCAA),然后在YOLOv5主干网络中加入SCAA模块,在Neck检测层中引入BiFPN模块,并根据自定义数据集的需要优化锚框参数,提出了一个基于YOLOv5的YOLOv5

ABN目标检测算法。本专利技术利用改进后的YOLOv5

ABN算法对自定义数据集和康奈尔数据集进行训练,对改进模块做了消融实验,并与现有的目标检测算法在性能上进行对比分析,证明了该方法的有效性,进一步提高了识别物体的精度。
附图说明
[0012]图1为本专利技术的SCAA网络结构流程图;
[0013]图2为本专利技术改进后的特征融合网络结构图;
[0014]图3为本专利技术康奈尔数据集的单个物体部分图片;
[0015]图4为本专利技术自制的多目标抓取物体部分图片;
[0016]图5为本专利技术模型的损失函数曲线图;
[0017]图6为本专利技术改进前P

R曲线图;
[0018]图7为本专利技术改进后P

R曲线图;
[0019]图8为本专利技术目标物体检测结果的图片;
[0020]图9为本专利技术混淆矩阵统计图。
具体实施方式
[0021]一种基于改进YOLOv5算法的机械臂抓取目标物体检测方法,包括如下步骤:
[0022]S1、数据集获取及数据预处理
[0023]从网上下载康奈尔数据集,使用通用的标注软件labelimg标注工具对获得的数据图片进行标注。标注完成后,将PASCAL格式的文件转换成YOLO格式的文件,完成数据集制作。
[0024]S2、对现有的YOLOv5网络进行改进
[0025](1)空间

坐标注意力机制(SCAA)的搭建,为了实现对目标物体及局部特征信息的准确定位,受卷积注意力机制(CBAM)的启发,将空间注意力机制(SA)和坐标注意力机制(CA)结合。
[0026](2)多尺度特征融合网络,YOLOv5的Neck结构采用的是FPN+PANeT相结合的方式,根据BiFPN网络特征融合方式的优越性,本项目将借鉴BiFPN结构的特点,对YOLOv5算法模型网络进行改进。
[0027]FPN(特征金字塔网络),PANeT(路径聚合网络)
[0028](3)锚框参数优化,YOLOv5采用自适应锚定框(AutoLearningBoundingBoxAnchors)对训练数据自动学习,通过使用Kmeans聚类算法对数据集的目标框(groundtruth)自动计算,以便获取合适的锚定框,所以需要对锚框参数进行优化。
[0029]S3、训练网络模型
[0030]本实验所用的处理器为:
[0031]Intel(R)Core(TM)i5

10200HCPU@2.40GHz,16G运行内存,显卡为
NVIDIAGeForceRTX2080TiGPU,操作系统为Windows10,64位所用的实验软件是PyCharm,整个实验基于深度学习框架PyTorch1.9.0,实验环境是Python3.8,GPU加速软件是Cuda11.1和cuDNN8.1.1,实验所用的深度相机是IntelD435i双目相机。
[0032]S21、空间

坐标注意力机制的设计
[0033]对整体的输入图像来讲,检测的目标物体在整体图像中占比很小,其余的图像信息均作为背景出现,在经过多次卷积后,背景信息会多次迭代累积,从而出现信息冗余,对目标物体识别以及定位造成干扰。除此之外,在位姿估计算法中,本项目需要用YOLOv5算法网络对标记的局部特征信息定位,利用各部分特征的位置信息进行后续的位姿估计,因此精准的定位对本实验来说非常重要。
[0034]为了实现对目标物体及局部特征信息的准确定位,本项目受卷积注意力机制(CBAM)的启发,将空间注意力本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5算法的机械臂抓取目标物体检测方法,其特征在于,包括如下步骤:S1、获取数据集及进行数据预处理:从网上下载康奈尔数据集,使用通用的标注软件labelimg标注工具对获得的数据图片进行标注,标注完成后,将PASCAL格式的文件转换成YOLO格式的文件,完成数据集制作;S2、对现有的YOLOv5网络进行改进;S21、搭建空间

坐标注意力机制SCAA,实现对目标物体及局部特征信息的准确定位,受卷积注意力机制CBAM的启发,将空间注意力机制SA和坐标注意力机制CA结合;S22、多尺度特征融合网络,YOLOv5的Neck结构采用的是FPN+PANeT相结合的方式,根据BiFPN网络特征融合方式的优越性,借鉴BiFPN结构的特点,对YOLOv5算法模型网络进行改进;S23、优化锚框参数,YOLOv5采用自适应锚定框对训练数据自动学习,通过使用Kmeans聚类算法对数据集的目标框gt自动计算;S3、训练网络模型。2.如权利要求1所述的基于改进YOLOv5算法的机械臂抓取目标物体检测方法,其特征在于,所述步骤S21中,首先特征信息通过空间注意力机制以后,提取两通道的最大值与平均值并进行加权融合,输出带有空间位置信息的特征信息;然后将带有空间位置信息的特征通过坐标注意力机制分别沿水平方向和垂直方向进行聚合加权,形成两个独立的特征图,最后将带有方向编码信息的特征储存。3.如权利要求2所述的基于改进YOLOv5算法的机械臂抓取目标物体检测方法,其特征在于,SCAA模块工作步骤下:假设输入的特征信息为N,在通道维度层面对输入特征进行压缩,然后对压缩以后的特征进行最大池化和平均池化操作,即分别在两个通道提取最大值和平均值,最后将两个通道的特征图进行融合,经过一个7x7的卷积层,得到权重系数N
s
,输出特征N
f
是输入特征N与N
s
的乘积,如公式(1)和(2)所示:N
f
=NXN
s (2)整个空间范围高为H,宽为w,在(H,1)的垂直范围里,用池化核对垂直方向的坐标信息编码并保存,在(1,w)的水平范围里,用池化核对水平方向的坐标信息进行编码并保存,如公式(3)所示:将具有精确编码信息的特征进行拼接,然后经过1x1卷积变换函数F1和非线性激活函数得到编码空间信息的中间特征f,如公式(4)所示:然后用1x1卷积F
h
和F
w
生成注意力权重m
h
和m
w
,如公式(5)所示:
最终...

【专利技术属性】
技术研发人员:汪语哲曹钢刘飞宇段晓东付猛
申请(专利权)人:大连民族大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1