【技术实现步骤摘要】
一种基于改进YOLOv5算法的机械臂抓取目标物体检测方法
[0001]本专利技术属于图像识别
,具体涉及一种基于改进YOLOv5算法的机械臂抓取目标物体检测方法。
技术介绍
[0002]YOLOv5目标检测算法检测速度快,检测精度高,在开源数据集上具有比较好的检测性能,但是对自定义数据集样本模型及局部特征准确识别和准确定位方面,性能还有待加强,对整体的输入图像来讲,检测的目标物体在整体图像中占比很小,其余的图像信息均作为背景出现,在经过多次卷积后,背景信息会多次迭代累积,从而出现信息冗余,对目标物体识别以及定位造成干扰,除此之外,在位姿估计算法中,本项目需要用YOLOv5算法网络对标记的局部特征信息定位,利用各部分特征的位置信息进行后续的位姿估计,因此精准的定位对本实验来说非常重要。首先为了得到精确的定位信息,本专利技术将空间注意力机制(SA)和坐标注意力机制(CA)结合,提出了一个空间—坐标注意力机制(SCAA),然后在YOLOv5主干网络中加入SCAA模块,在Neck检测层(目标检测层)中引入BiFPN模块(双向特征金字塔网络),并根据自定义数据集的需要优化锚框参数,提出了一个基于YOLOv5的YOLOv5
‑
ABN目标检测算法(融合了空间注意力机制与坐标注意力机制,且加入了BiFPN模块的新算法),用改进后的YOLOv5
‑
ABN算法对自定义数据集和康奈尔数据集进行训练,对改进模块做了消融实验,并与现有的目标检测算法在性能上进行对比分析。
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.一种基于改进YOLOv5算法的机械臂抓取目标物体检测方法,其特征在于,包括如下步骤:S1、获取数据集及进行数据预处理:从网上下载康奈尔数据集,使用通用的标注软件labelimg标注工具对获得的数据图片进行标注,标注完成后,将PASCAL格式的文件转换成YOLO格式的文件,完成数据集制作;S2、对现有的YOLOv5网络进行改进;S21、搭建空间
‑
坐标注意力机制SCAA,实现对目标物体及局部特征信息的准确定位,受卷积注意力机制CBAM的启发,将空间注意力机制SA和坐标注意力机制CA结合;S22、多尺度特征融合网络,YOLOv5的Neck结构采用的是FPN+PANeT相结合的方式,根据BiFPN网络特征融合方式的优越性,借鉴BiFPN结构的特点,对YOLOv5算法模型网络进行改进;S23、优化锚框参数,YOLOv5采用自适应锚定框对训练数据自动学习,通过使用Kmeans聚类算法对数据集的目标框gt自动计算;S3、训练网络模型。2.如权利要求1所述的基于改进YOLOv5算法的机械臂抓取目标物体检测方法,其特征在于,所述步骤S21中,首先特征信息通过空间注意力机制以后,提取两通道的最大值与平均值并进行加权融合,输出带有空间位置信息的特征信息;然后将带有空间位置信息的特征通过坐标注意力机制分别沿水平方向和垂直方向进行聚合加权,形成两个独立的特征图,最后将带有方向编码信息的特征储存。3.如权利要求2所述的基于改进YOLOv5算法的机械臂抓取目标物体检测方法,其特征在于,SCAA模块工作步骤下:假设输入的特征信息为N,在通道维度层面对输入特征进行压缩,然后对压缩以后的特征进行最大池化和平均池化操作,即分别在两个通道提取最大值和平均值,最后将两个通道的特征图进行融合,经过一个7x7的卷积层,得到权重系数N
s
,输出特征N
f
是输入特征N与N
s
的乘积,如公式(1)和(2)所示:N
f
=NXN
s (2)整个空间范围高为H,宽为w,在(H,1)的垂直范围里,用池化核对垂直方向的坐标信息编码并保存,在(1,w)的水平范围里,用池化核对水平方向的坐标信息进行编码并保存,如公式(3)所示:将具有精确编码信息的特征进行拼接,然后经过1x1卷积变换函数F1和非线性激活函数得到编码空间信息的中间特征f,如公式(4)所示:然后用1x1卷积F
h
和F
w
生成注意力权重m
h
和m
w
,如公式(5)所示:
最终...
【专利技术属性】
技术研发人员:汪语哲,曹钢,刘飞宇,段晓东,付猛,
申请(专利权)人:大连民族大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。