当前位置: 首页 > 专利查询>南通大学专利>正文

一种基于改进YOLOv5算法的铝型材表面缺陷检测方法技术

技术编号:39240238 阅读:13 留言:0更新日期:2023-10-30 11:52
本发明专利技术公开了一种基于改进YOLOv5算法的铝型材表面缺陷检测方法,针对铝型材表面缺陷种类多样、尺度差异大和小目标容易漏检等问题,基于改进YOLOv5算法构建铝型材表面缺陷检测模型,具体改进为:采用IOU

【技术实现步骤摘要】
一种基于改进YOLOv5算法的铝型材表面缺陷检测方法


[0001]本专利技术属于表面缺陷检测
,具体涉及一种基于改进YOLOv5算法的铝型材表面缺陷检测方法。

技术介绍

[0002]随着全球工业化进程的迅速发展,铝型材因其低密度、高可塑性和耐腐蚀等卓越性能,成为基础建设和工业领域的首选材料,需求不断增长。然而,铝型材表面缺陷问题始终是生产厂家需要解决的难题,加工工艺和生产设备等因素造成的擦花、漆泡、脏点等缺陷需要通过表面质量检测排除,确保产品质量。
[0003]当前国内外工业产品表面缺陷检测可分为人工检测、单一机理识别和机器视觉识别三大类。相比于人工检测和单一机理识别,机器视觉识别具有高效、低成本、无接触等突出优点,并已逐渐成为主流的缺陷检测方法。传统的基于机器视觉的缺陷检测方法采用多种图像处理技术和机器学习算法对缺陷图像进行特征分析和分类,但这种方法过程繁琐,而且鲁棒性差,存在一定的局限性。随着计算机算力的提升和深度学习网络的发展,表面缺陷检测正逐步向基于深度学习的方法转变,这种方法不仅具有更高的准确性和鲁棒性,而且能够更快速地处理大量的图像数据。目前主流的基于深度学习的目标检测算法可分为两类:一类是两阶段算法,如R

CNN、Fast R

CNN等,这类算法需要预先生成候选区域,具有较高的精度;另一类是一阶段算法,如YOLO、SSD等,这类算法直接在网络中提取特征进行检测,速度相对较快。然而,在工业中,铝型材表面缺陷种类多样,尺度差异大,现有的深度学习网络模型已经取得了很好的大目标检测效果,但在小目标检测方面仍有待提高。

技术实现思路

[0004]专利技术目的:为了解决现有技术的不足,本专利技术提供了一种基于改进YOLOv5算法的铝型材表面缺陷检测方法,在保持大目标检测精度小幅度提升的同时,显著提升小目标的检测精度。
[0005]技术方案:一种基于改进YOLOv5算法的铝型材表面缺陷检测方法,包括以下步骤:
[0006]S1:获取铝型材公开数据集,采用广东工业制造大数据创新大赛——铝型材表面瑕疵识别的铝型材数据集;
[0007]S2:采用水平翻转、竖直翻转和平移随机结合的方法对铝型材数据集进行数据增强,每种缺陷类型数据集增强到500张,最终总共含有3500张铝型材数据集;
[0008]S3:运用Labelimg工具对数据增强后的铝型材图像进行缺陷标注,生成yolo格式的数据标签,并对得到的所有数据集按照8:2划分训练集和验证集;
[0009]S4:改进YOLOv5模型,在图像输入部分采用IOU

K

means++算法聚类优化锚框;在Backbone部分引入全局注意力模块C3C2F,增强小目标的语义信息;在Neck部分通过轻量级上采样算子CARAFE进行特征图上采样,充分保留上采样特征图的小目标信息;
[0010]S5:将S2中的训练集和验证集导入S4中改进的YOLOv5模型进行边训练边验证检测
的效果,最终得到一个best.pt和last.pt权重文件;
[0011]S6:最后用S5中得到的best.pt权重文件对工业中的铝型材表面缺陷进行推理检测。
[0012]进一步的:所述的步骤S1中,获取的铝型材数据集共有七种类型的缺陷:不导电、桔皮、起坑、擦花、喷流、漆泡和脏点,图片大小为2560*1920。
[0013]进一步的:所述的步骤S4中,在图像输入部分采用IOU

K

means++算法聚类优化锚框;原始YOLOv5采用K

means算法聚类锚框,该方法依赖初始聚类中心,K

means++可以解决这个问题,K

means++的初始步骤中,仅随机选择一个聚类中心,随后按照距离簇中心远近的概率依序确定其余聚类中心,因其聚类中心的选取具有离散性和全局性,获得的聚类结果更加准确合理;本方法同时通过采用IOU(Intersection over Union)代替欧几里得距离估计两物体的相似度,使聚类出的锚框质量更好;
[0014]具体步骤为:首先将铝型材图像自适应缩放至640*640,然后采用IOU

K

means++算法聚类锚框,获得最贴合铝型材表面缺陷的锚框;
[0015]其中,上述IOU的距离公式可表示为:
[0016]d(box,centroid)=1

IOU(box,centroid)
[0017]式中,IOU表示真实框和聚类中心交集与并集的比例,IOU值越高代表真实框与聚类中心越接近,即两者相关度越高;
[0018]在Backbone部分引入全局注意力模块C3C2F,增强小目标的语义信息,全局注意力模块C3C2F由卷积调制模块ConvMod替换C3模块中的BottleNeck所得;
[0019]在Neck部分通过轻量级上采样算子CARAFE进行特征图上采样,充分保留上采样特征图的小目标信息,分别在第11层和第15层采用了轻量级上采样算子CARAFE替换原YOLOv5中的最近邻插值上采样方式进行特征图的上采样。
[0020]进一步的:所述的卷积调制模块ConvMod具有两个分支和一个残差边,ConvMod的第一个分支用1
×
1卷积来保留原特征图信息,第二分支先用LayerNorm对输入特征归一化以保证数据特征分布的稳定性,然后用1
×
1卷积和激活函数GELU保证特征图尺寸不变的前提下大幅增加非线性特性,最后用一个11
×
11的深度卷积在减少参数量的同时扩大感受野;将第二分支当作权重来调制第一分支以充分利用图像的上下文信息来使模型更集中于待检目标,减少不相关背景的干扰。
[0021]进一步的:所述的全局注意力模块C3C2F的结构为:将C3中的BottleNeck更改为ConvMod,构建全局注意力模块C3C2F,C3C2F模块能对全局上下文信息建模,不仅减少了模型的参数量,而且增强了铝型材表面小目标缺陷的语义信息,抑制了背景和噪声。
[0022]进一步的:所述的轻量级上采样算子CARAFE的结构包括两部分:上采样核预测模块和特征重组模块,首先将第10层和第14层输出的铝型材表面缺陷特征图分别输入到上采样核预测模块和特征重组模块。
[0023]进一步的:在上采样核预测模块,上采样倍率为σ,先将通道数压缩到C
m
,然后通过大小为k
encoder
×
k
encoder
的卷积进行卷积操作实现内容编码,最后在空间维度展开和进行核归一化,使得卷积核权重和为1。
[0024]进一步的:在特征重组模块,取出以特征图的每个位置为中心的k
up
×
k
up
区域和上采样预测模块的重组内核W<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5算法的铝型材表面缺陷检测方法,其特征在于:包括以下步骤:S1:获取铝型材公开数据集,采用广东工业制造大数据创新大赛——铝型材表面瑕疵识别的铝型材数据集;S2:采用水平翻转、竖直翻转和平移随机结合的方法对铝型材数据集进行数据增强,每种缺陷类型数据集增强到500张,最终总共含有3500张铝型材数据集;S3:运用Labelimg工具对数据增强后的铝型材图像进行缺陷标注,生成yolo格式的数据标签,并对得到的所有数据集按照8:2划分训练集和验证集;S4:改进YOLOv5模型,在图像输入部分采用IOU

K

means++算法聚类优化锚框;在Backbone部分引入全局注意力模块C3C2F,增强小目标的语义信息;在Neck部分通过轻量级上采样算子CARAFE进行特征图上采样,充分保留上采样特征图的小目标信息;S5:将S2中的训练集和验证集导入S4中改进的YOLOv5模型进行边训练边验证检测的效果,最终得到一个best.pt和last.pt权重文件;S6:最后用S5中得到的best.pt权重文件对工业中的铝型材表面缺陷进行推理检测。2.根据权利要求1所述的基于改进YOLOv5算法的铝型材表面缺陷检测方法,其特征在于:所述的步骤S1中,获取的铝型材数据集共有七种类型的缺陷:不导电、桔皮、起坑、擦花、喷流、漆泡和脏点,图片大小为2560*1920。3.根据权利要求1所述的基于改进YOLOv5算法的铝型材表面缺陷检测方法,其特征在于:所述的步骤S4中,在图像输入部分采用IOU

K

means++算法聚类优化锚框;原始YOLOv5采用K

means算法聚类锚框,该方法依赖初始聚类中心,K

means++可以解决这个问题,K

means++的初始步骤中,仅随机选择一个聚类中心,随后按照距离簇中心远近的概率依序确定其余聚类中心,因其聚类中心的选取具有离散性和全局性,获得的聚类结果更加准确合理;本方法同时通过采用IOU(Intersection over Union)代替欧几里得距离估计两物体的相似度,使聚类出的锚框质量更好;具体步骤为:首先将铝型材图像自适应缩放至640*640,然后采用IOU

K

means++算法聚类锚框,获得最贴合铝型材表面缺陷的锚框;其中,上述IOU的距离公式可表示为:d(box,centroid)=1

IOU(box,centroid)式中,IOU表示真实框和聚类中心交集与并集的比例,IOU值越高代表真实框与聚类中心越接近,即两者相关度越高;在Backbone部分引入全局注意力模块C3C2F,增强小目标的语义信息,全局注意力模块C3C2F由卷积调制模块ConvMod替换C3模块中的BottleNeck所得;在Neck部分通过轻量级上采样算子CARAFE进行特征图上采样,充分保留上采样特征图的小目标信息,分别在第11层和第15...

【专利技术属性】
技术研发人员:朱志松邓光伟尤红权李颖王天乐
申请(专利权)人:南通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1