一种基于改进YOLOv5模型的丝饼缺陷检测方法技术

技术编号:36648148 阅读:23 留言:0更新日期:2023-02-18 13:09
本发明专利技术涉及一种基于YOLOv5神经网络的丝饼缺陷检测方法。包括:获取丝饼图像缺陷数据集,并对丝饼图像缺陷数据集进行数据处理得到样本集;基于YOLOv5算法构建改进型YOLOv5神经网络结构,得到改进YOLOv5算法;利用样本集对改进YOLOv5算法进行训练,将训练后最佳的权重文件加载至改进YOLOv5算法得到目标检测模型;针对获取的待分类图像,采用所述目标检测模型输出对应的丝饼缺陷定位及分类。本发明专利技术的方法相较于原YOLOv5算法具有较高的检测速度和小目标检测精度,从而有效提高生产效率,降低了丝饼缺陷检测的错误率。丝饼缺陷检测的错误率。丝饼缺陷检测的错误率。

【技术实现步骤摘要】
一种基于改进YOLOv5模型的丝饼缺陷检测方法


[0001]本专利技术涉及深度学习、计算机视觉领域,具体的说是一种基于改进YOLOv5模型的丝饼缺陷检测方法。

技术介绍

[0002]我国作为最大的氨纶生产国,随着制造业的不断发展,智能装配系统被广泛应用到自动化生产线上。在生产丝饼的生产流水线上,丝饼要经过卷丝、落筒、输送、储存、检测分类、包装等多个流程,因此,丝饼不可避免的会出现一些缺陷。目前,对丝饼缺陷的检测主要采用人工方式,人为因素影响较大,且工作劳动强度大,生产效率和精确度十分低下,无法满足大规模自动化生产的需求,氨纶丝饼的产量和质量受到严重制约。因此,为了提高生产效率,降低人力成本投入,研发出能够适应工厂环境中光线等不稳定因素,同时确保精度和速度的智能丝饼检缺陷测方法势在必行。
[0003]随着深度学习的飞速发展,计算机视觉技术取得了令人瞩目的成果,尤其是物体检测这一基础又核心的需求,诞生了众多经典算法,在自动驾驶、智能安防以及智能装配等多个领域都得到了广泛应用。其中,YOLO因为其较快的检测速度,在工业界应用极为广泛,尤其是在不追求预测框高精度的场景下,与其他检测算法精度相同时,可以达到3到4倍的前向速度,是一个十分适合实际应用的检测框架。YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。
[0004]以上算法虽然自动化程度较高,但是对于丝饼缺陷中目标较小时仍然会很大程度上影响算法的检测精度。因此,需要有一种能准确识别和定位丝饼缺陷的检测方法,以适用于各种复杂条件下的缺陷检测。

技术实现思路

[0005]针对上述技术不足,对丝饼检测的研究需要提高目标检测精度,同时,保证较高的检测速度。本专利技术解决其技术问题所采用的技术方案是:
[0006]一种基于改进YOLOv5算法的目标检测方法,建立基于YOLOv5算法构建改进型YOLOv5神经网络结构并训练优化模型,用于丝饼缺陷的实时检测,所述该方法包括:
[0007]步骤1、获取包含缺陷的丝饼检测图像数据,并进行数据预处理得到缺陷图像数据样本集;
[0008]步骤2、基于YOLOv5算法构建改进型YOLOv5神经网络结构,得到改进YOLOv5算法;
[0009]步骤3、利用所述样本集数据对所述改进YOLOv5算法进行训练,将训练后最佳的权重参数加载至改进YOLOv5算法得到优化的丝饼缺陷目标检测模型;
[0010]步骤4、现场采集待检测图像并进行图像预处理,然后输入优化的丝饼缺陷目标检测模型,自动输出对应的缺陷目标检测结果;所述目标检测结果包括待检测图像中缺陷目标区域的位置以及每个目标区域对应的类别,其中目标区域的缺陷类别为绊丝、油污、成型
不良。
[0011]所述改进型YOLOv5网络结构包括特征提取骨干网络Backbone模块、用于预测分类和目标边界框Head模块;所述特征提取骨干网络Backbone模块输出3个不同尺度的特征图;其中所述Backbone模块包括Focus子模块、Conv子模块、C3SE子模块、SPP子模块,所述Head模块包括BiFPN子模块、Detect子模块;
[0012]所述Focus模块对输入的图像进行切片操作,用于特征提取;
[0013]所述C3SE结构是在通道维度引入注意力机制,用于提取不同尺度的特征图;
[0014]所述SPP模块用于融合多尺度的特征;
[0015]所述BiFPN模块,在FPN模块基础上进一步上采样C3SE的输出特征进行融合,用于加强网络特征融合能力;
[0016]所述Detect子模块,包括3个分类器,用于将融合特征图输入多分类器进行丝饼缺陷定位及分类,给出缺陷目标预测框。
[0017]所述步骤1的数据预处理包括:将大小为640
×
640的4张丝饼缺陷的图片采用Mosaic数据增强方法进行随机缩放、随机裁剪、随机排布,用于丰富缺陷样本数据集;所述丝饼缺陷包括绊丝、油污、成型不良的图片。
[0018]所述对图片进行切片操作,是将W、H信息进行分割,用于扩充通道空间,将原先的RGB三通道模式变成了12个通道,然后将得到的新图片再经过3
×
3卷积操作提取特征;W、H分别为宽、高。
[0019]所述C3模块包括两个分支:y1和y2,其中分支y1由依次连接的Conv模块、X个添加shortcut分支的Bottleneck模块、conv组成,分支y2由conv组成,最后将2个分支进行concat操作,并依次经过BN层、LeakyRelu激活函数、Conv模块;所述Conv模块由conv、BN、SiLU激活函数三者组成。
[0020]所述C3SE模块包括C3模块并在通道维度引入注意力机制SE模块,通过在Feature Map层上执行全局平均池化,把原本H
×
W
×
C的特征,压缩为1
×1×
C,得到当前Feature Map的全局压缩特征量,每个通道用一个数值表示;通过两个全连接层的Bottleneck结构去建模通道间的相关性,得到Feature Map中每个通道的权值,并将加权后的Feature Map作为下一层网络的输入;将上一步得到的归一化权重加权到每个通道的特征上,与原始特征图相乘,得到最终特征图输出,完成在通道维度上引入注意力机制。
[0021]所述SPP模块采用5
×
5、9
×
9、13
×
13的最大池化尺寸进行多尺度融合,对输入的特征图分别利用三个最大池化层进行处理,并将不同尺度的特征图与输入进行Concat操作,得到池化特征图输出。
[0022]所述Head结构中,在完成特征的初步提取后,增加上采样分支进一步对C3SE输出的特征图进行融合,使特征更加具有高语义信息、增强网络特征融合能力,得到预测的特征图。
[0023]所述Detect模块的多个分类器用于接收所述特征融合模块输出的大小为20
×
20的融合特征、大小为40
×
40的融合特征、大小为80
×
80的融合特征,在特征图上应用初始锚框输出预测框,与真实框进行比对,并生成带有类概率、对象置信度得分和目标缺陷预测框的最终输出向量;是采用非极大值抑制NMS操作对多目标框进行筛选确定最终的目标缺陷预测框。
[0024]所述缺陷图像数据样本集中的图像数据要人工预先进行缺陷标注,再按比例分为训练集和验证集,训练集用于训练网络,采用CIoU_Loss计算Bounding box损失函数并与预设阈值比较,从而回调网络参数;所述验证集用于验证模型的泛化能力,得到最佳的权重参数。
[0025]本专利技术具有以下优点和有益效果:
[0026]本专利技术提供了一种改进YOLOv5模型的丝饼缺陷检测方法,以解决目前对丝饼缺陷的检测主要采用人工方式检测效率低本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5算法的目标检测方法,建立基于YOLOv5算法构建改进型YOLOv5神经网络结构并训练优化模型,用于丝饼缺陷的实时检测,其特征在于,所述该方法包括:步骤1、获取包含缺陷的丝饼检测图像数据,并进行数据预处理得到缺陷图像数据样本集;步骤2、基于YOLOv5算法构建改进型YOLOv5神经网络结构,得到改进YOLOv5算法;步骤3、利用所述样本集数据对所述改进YOLOv5算法进行训练,将训练后最佳的权重参数加载至改进YOLOv5算法得到优化的丝饼缺陷目标检测模型;步骤4、现场采集待检测图像并进行图像预处理,然后输入优化的丝饼缺陷目标检测模型,自动输出对应的缺陷目标检测结果;所述目标检测结果包括待检测图像中缺陷目标区域的位置以及每个目标区域对应的类别,其中目标区域的缺陷类别为绊丝、油污、成型不良。2.如权利要求1所述的基于改进YOLOv5算法的目标检测方法,其特征在于,所述改进型YOLOv5网络结构包括特征提取骨干网络Backbone模块、用于预测分类和目标边界框Head模块;所述特征提取骨干网络Backbone模块输出3个不同尺度的特征图;其中所述Backbone模块包括Focus子模块、Conv子模块、C3SE子模块、SPP子模块,所述Head模块包括BiFPN子模块、Detect子模块;所述Focus模块对输入的图像进行切片操作,用于特征提取;所述C3SE结构是在通道维度引入注意力机制,用于提取不同尺度的特征图;所述SPP模块用于融合多尺度的特征;所述BiFPN模块,在FPN模块基础上进一步上采样C3SE的输出特征进行融合,用于加强网络特征融合能力;所述Detect子模块,包括3个分类器,用于将融合特征图输入多分类器进行丝饼缺陷定位及分类,给出缺陷目标预测框。3.如权利要求1所述的基于改进YOLOv5算法的目标检测方法,其特征在于,所述步骤1的数据预处理包括:将大小为640
×
640的4张丝饼缺陷的图片采用Mosaic数据增强方法进行随机缩放、随机裁剪、随机排布,用于丰富缺陷样本数据集;所述丝饼缺陷包括绊丝、油污、成型不良的图片。4.如权利要求1所述的基于改进YOLOv5算法的目标检测方法,其特征在于,所述对图片进行切片操作,是将W、H信息进行分割,用于扩充通道空间,将原先的RGB三通道模式变成了12个通道,然后将得到的新图片再经过3
×
3卷积操作提取特征;W、H分别为宽、高。5.如权利要求1所述的基于改进YOLOv5算法的目标检测方法,其特征在于,所述C3模块包括两个分支:y1和y2,其中分支y1由依次连接的Conv模块、X个添加shortcut分支的Bottleneck模块、...

【专利技术属性】
技术研发人员:孟祥茹孙咏王嵩于碧辉王美吉
申请(专利权)人:中国科学院沈阳计算技术研究所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1