一种改进CA注意力机制的YOLOv5织物疵点检测方法技术

技术编号:38134087 阅读:8 留言:0更新日期:2023-07-08 09:44
本发明专利技术为一种改进CA注意力机制的YOLOv5织物疵点检测方法,具体涉及在深度学习网络结构中更换融入CA注意力机制C3模块的织物疵点检测方法。发明专利技术目的旨在解决传统疵点检测过度依赖人工,而基于深度学习的疵点检测方法存在检测精度低、模型泛化性能差的问题。解决方案为在YOLOv5算法模型的躯干网络中用融入CA注意力机制的C3模块替换原有的C3模块来实现,具体操作流程如附图可以有效提升模型对疵点区域的关注程度,增强模型检测精度提升模型鲁棒性。主要用途为提高模型对疵点的识别能力以及检测的精确度。检测的精确度。检测的精确度。

【技术实现步骤摘要】
一种改进CA注意力机制的YOLOv5织物疵点检测方法


[0001]本专利技术设计了一种针对织物的疵点检测方法,具体涉及一种在深度学习网络结构中更换融入CA注意力机制C3模块的织物疵点检测方法。

技术介绍

[0002]纺织制造业是我国的重要产业支柱,我国的纺织品出口量在世界上居于首位(纺织学报, 2020, 41(05): 72

78)。在纺织品生产过程中,因机器故障、人工操作等因素会造成织物出现疵点或破损(江南大学, 2017),因此织物疵点检测是提高织物质量的重要环节。目前我国大多数企业仍然以人工目测为主,但受限于人眼易疲劳、手工操作复杂等因素,高质量织物的生产步与国际水平相比仍然落后(IEEE. T. IND. APPL. 2000, 36(5): 1267

1276)。
[0003]如今随着纺织行业不断向去人工化、织造一体化发展,物质量的智能化检测环节在生产过程中起着决定性作用,提高织物疵点检测精度与效率、降低人工成本已然成为纺织行业质量检测的研究重点。目前织物检测方法一般采用传统算法,如基于模型的方法、基于结构的方法、基于统计学的方法、基于谱分析的方法等(Optik. 2016, 127(24): 11960

11973),但由于疵点种类数目庞大以及生产工艺的不同,这些方法存在检测精度低、模型泛化性能差等问题。而基于深度学习的检测方法可以通过数据集有效获得疵点的特征信息,从而准确检测不同种类疵点,但检测中存在对微小疵点检测存在检测效果差、误检率高的问题(光学精密工程, 2022, 30(08): 998

1010)。
[0004]本专利技术通过在深度学习网络模型种加入CAC3注意力机制,可以有效提升模型对疵点所在区域的关注程度,从而增强模型检测精度并有效提升模型鲁棒性。

技术实现思路

[0005]本专利技术的目的是为了解决疵点检测精确度低的问题,为实现上述目的提供了一种加入CAC3注意力机制的深度学习模型检测方法,以有效提高织物疵点检测的精确度和召回率,具体流程可见图2。
[0006]本专利技术织物疵点检测方法包括如下步骤:
[0007]步骤1:采集若干织物图像,建立织物图像数据集,通过对不同疵点类别的织物图像进行标注,获得带有标签的织物图像数据集。
[0008]步骤2:将带有标签的织物图像数据集按照给定比例划分为训练集、验证集、测试集,训练集、验证集以及测试集的比例为8:1:1。
[0009]步骤3:通过将CA注意力机制加入网络结构,构建YOLOv5_CAC3模型
[0010]步骤4:将训练集和验证集的路径、初始训练权重文件路径输入网络模型训练所需参数中进行训练,获得训练完成的YOLOv5_CAC3模型。
[0011]步骤5:将测试集的织物图像路径、训练完成的模型路径输入检测代码中,每张待检测织物图像都在YOLOv5_CAC3模型中被标注疵点预测框后输出,再通过不同的预测框显
示出测试集中每张织物的疵点类别、置信度以及位置信息,从而完成织物疵点的检测。
[0012]所述的步骤1中,使用LabelImg对构建的织物图像数据集进行疵点数据标注处理,通过软件对疵点区域进行标注后可获得疵点的真实标注框,获得的数据包括疵点的种类以及经过归一化后每个真实标注框的中心坐标以及相对宽和高。
[0013]所述的步骤1中,织物疵点包括四种类别:断氨纶、结头、破洞和纬缩。
[0014]所述的步骤3中,建立的YOLOv5_CAC3模型依次包括Input、Backbone、Neck、Head。
[0015]结构具体如下:
[0016]a) Input
[0017]在图片输入后对其采取Mosaic数据增强操作,将训练所用图片抽取四张进行随机的缩放、剪裁、排布后拼接在一起,因处理后的图片疵点信息丰富,因此可以有效提升训练后模型鲁棒性和检测精度等性能。
[0018]YOLO系列算法在初始设定的九个锚点框的基础上输出对应的预测框,通过与已有GT框位置信息的比对计算误差,通过不断修正参数进行网络框架的不断更新并增强模型识别精度。
[0019]b) backbone
[0020]模型主干网络为Darknet53骨干网络,主要结构包括Conv模块、CAC3模块、SPPF模块。CAC3模块包括Conv模块和CA注意力模块,SPPF模块由池化、连接、全连接三个步骤组成。
[0021]CA 注意力模块操作原理如下:
[0022]CA注意力机制依照准确的位置信息分成两个阶段来给通道关系编码。
[0023]第 1 阶段为特征图的信息嵌入操作。在对通道注意编码时,采用将全局池化分解为一对一维特征编码操作,避免将全局空间信息压缩到通道描述符中造成位置信息丢失的后果。
[0024][0025]输入X,先以尺寸为(H,1)的池化核沿着水平方向或(1,W)的池化核沿着垂直方向编码每个通道。因而,高度为h和宽度为w的第c通道的输出分别可以表示为
[0026][0027][0028]该变换方式沿着两个不同的空间方向来聚合特征,从而生成一对方向感知的特征图,能够得到全局感受野并对位置信息进行精确编码。
[0029]第 2 阶段为CA注意力生成操作。先将第1阶段的变换结果进行concat操作,之后利用1
×
1卷积变换函数S1对其进行变换操作:
[0030][0031]α表示非线性激活函数;e是分别在水平和垂直方向对空间信息 进行编码的中间特征映射。r 表示缩减率,可用来控制 SEblock 大小 ,即可以通过控制r来减少f的通道
数,使得模型更加精简并减少算力。随后,分别沿空间方向将e分解为两个独立的张量和。用其他两个 1
×
1卷积变换 和分别将 和变换为通道数相同的张量到输入X,得到输出和:
[0032][0033][0034]式中:λ为Sigmoid激活函数。接着分别对和进行扩展并作为注意力权重。最后的输出Y可以表示为:
[0035][0036]加入CA模块的方法:在代码中定义CAC3模块,将网络结构backbone中的C3模块替换为为CAC3后进行模型训练即可。
[0037]c) Neck:
[0038]包括CBS、Upsample、Concat和C3组成,其中C3模块包括三个卷积模块。Neck 部分采用 FPN+PAN的网络结构。FPN 层自顶向下传达语义特征,PAN层自底向上传达定位特征。最后两个特征进行融合,使不同尺寸的特征图都包含语义信息和位置信息。
[0039]在Neck部分,YOLOv5提取多特征层进行目标检测,一共提取三个特征层。
[0040]三个特征层位于主干部分CSPdarknet的不同位置,分别位于中间层,中下层,底层,当输入为(640,640,3)的时候,三个特征层的尺寸分别为shape1(80,80,256)、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种改进CA注意力机制的YOLOv5织物疵点检测方法,其特征在于,包括:步骤一:建立织物疵点图像数据集:通过相机采集若干织物图像,使用标注软件对不同疵点类别的织物图像进行标注,获得带有标签的织物图像数据集。2.步骤二:划分数据集:将带有标签的织物图像数据集按照给定比例划分为训练集、验证集,测试集,其比例为8:1:1。3.步骤三:通过将CA注意力机制加入...

【专利技术属性】
技术研发人员:郭丹李娜娜张效栋朱琳琳李新格任江陶罗欣攀
申请(专利权)人:沧州市天津工业大学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1