【技术实现步骤摘要】
一种基于改进YOLOv5的纸病检测方法
[0001]本专利技术属于纸病检测
,具体涉及一种基于改进YOLOv5的纸病检测方法。
技术介绍
[0002]在造纸过程中,受造纸工艺流程、纤维原料、人工操作、设备状态等因素的影响,纸张会出现褶皱、孔洞、划痕等表面缺陷问题,这些缺陷不仅影响纸张外观,还会降低印刷的成品率和经济效益。因此,纸张缺陷检测是造纸过程尤为重要的一个环节。
[0003]传统的纸张缺陷检测是依靠人工完成,但是人工检测与生俱来就伴随着检测效率低下、漏检率高、人力成本昂贵等问题。随着计算机技术的不断提高,人工检测已经逐渐被基于机器视觉的检测方法所替代。
[0004]目前,已有针对纸张缺陷图像检测任务的相关研究,但大多都是基于分类算法,且存在特征提取困难、检测时间长等问题。
[0005]专利号为CN202220234393.2设计了一种机器视觉纸病检测系统的照明装置,该专利当中强调了照明装置对于纸病检测系统的重要性,本专利技术专利模型泛化性好、检测精度高、检测速度快,对于光源的依赖度更低,在 ...
【技术保护点】
【技术特征摘要】
1.一种基于改进YOLOv5的纸病检测方法,其特征在于,包括以下步骤;步骤1:获取纸张图像,对纸张缺陷图像进行分类和标注;步骤2:对获取的纸张图像进行裁剪、数据增强;步骤3:基于YOLOv5模型进一步提高网络的特征提取能力,建立适合纸张缺陷图像检测的PaperNet;步骤4:图像训练;利用所构建的训练样本集和验证样本集,对PaperNet进行训练并验证模型性能;步骤5:图像测试;使用改进后的PaperNet权重文件对测试集纸张图像进行检测,分析检测结果。2.根据权利要求1所述的一种基于改进YOLOv5的纸病检测方法,其特征在于,所述步骤1具体包括:步骤1.1:在纸机车间配备高清线阵相机,当待测纸张通过触发传感器,启动成像设备后对纸张图像进行拍摄,获取高清线阵图像,后经过人工挑选,挑选出含有缺陷的纸张图像,对纸张缺陷图像剥离背景;步骤1.2:在步骤1.1中对整理好的缺陷图像,利用LalbelImg工具,对数据集当中的图片标定真实框与对应治病种类并生成xml格式的标签文件。3.根据权利要求1所述的一种基于改进YOLOv5的纸病检测方法,其特征在于,所述步骤2具体包括:步骤2.1:将含有缺陷的纸张图像裁剪成640
×
640的大小;步骤2.2:对裁剪后的纸张图像采用改变亮度、翻转、随机裁剪、位移和添加高斯噪声的方式进行数据增强,以9:1的比例把数据增强后的纸病数据集分为训练集和验证集。4.根据权利要求1所述的一种基于改进YOLOv5的纸病检测方法,其特征在于,所述步骤3具体包括:纸张缺陷实时检测模型PaperNet包括:待检测图像先经过输入端进行预处理,再经由骨干网络提取特征信息,Neck部分连接负责进行特征信息的拼接、Head部分输出检测效果;其中,骨干网络为CSPDarknet53,主要包括切片结构(Focus)、卷积模块(CBL)、坐标注意力机制(Coordinate Attention,CA)、瓶颈层(CSP1
‑
x)以及SPP;Neck部分采用了FPN+PAN的网络结构;为进一步提高YOLOv5的特征提取能力并形成更稳定的特征分布,通过在批量归一化模块(Batch Normalization,BN)的首尾部分添加居中和缩放校准以增强纸张缺陷的有效特征,并在主干网络中引入坐标注意力机制(Coordinate Attention,CA)提升模型的特征提取能力。5.根据权利要求1所述的一种基于改进YOLOv5的纸病检测方法,其特征在于,所述步骤4具体包括:步骤4.1:纸张缺陷图片从输入部分输入,输入部分采用了Mosaic:数据增强、自适应锚框计算和图片尺寸处理的预处理方式;骨干网络Focus模块将纸张缺陷特征图的输入进行复制与切片操作;再经过一个大小为3
×
3卷积核来改变网络的通道数;通过Batch_Norm层,将梯度集中在原点附近,实现结果归一化;最后用LeakyRelu激活函数输入结果到下一层卷积BottleNeckCSP;
BottleNeckCSP残差结构能优化梯度信息,同时降低PaperNet纸张缺陷网络的计算量,首先输入会被分成两部分,一部分先进行n次BottleNeck操作,再进行卷积操作,另一部分直接进行卷积操作,然后两部分再经过Concat拼接后输出至空间金字塔池化SPP;在空间金字塔池化SPP中,先进行Conv提取特征输出,再经过四种不同尺度的最大池化进行多尺度融合;步骤4.2:在骨干特征提取网络当中引入了坐标注意力机制来进一步提高模型对于纸病特征的提取能力,给定任意中间张量X=[x1,x2,
…
,x
n
]∈R
C
×
H
×
W
作为输入都能输出一个增强表示能力的有相同尺寸的输出Y=[y1,y2,
…
,y
n
]。其中C为通道数,H和W分别为输入图像的高和宽;首先通过全局平均池化沿水平方向和垂直方向对每个通道c进行编码,得到两个一维特征编码向量:征编码向量:再使用Concat级联之前生成的特征图z
w
、z
h
,然后使用卷积核大小为1的卷积变换函数F1进行变换操作:f=δ(F1([z
h
,z
w
]))(3);其中δ为非线性激活函数,f为在水平方向和垂直方向的的空间信息进行编码时的中间特征映射,沿空间维度将f分解为f
h
∈R
C/r
×
H
和f
w
∈R...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。