基于改进制造技术

技术编号:39676817 阅读:12 留言:0更新日期:2023-12-11 18:43
本发明专利技术公开了一种改进

【技术实现步骤摘要】
基于改进YOLOv8网络的车门表面缺陷检测方法


[0001]本专利技术涉及深度学习和目标检测的
,尤其是指一种基于改进
YOLOv8
网络的车门表面缺陷检测方法


技术介绍

[0002]随着汽车生产行业的快速发展,消费者对于汽车外观的重要性也日益增长

为了满足消费者的需求,汽车制造商开始越来越注重对汽车外观质量的检测

作为汽车的重要组成部分,车门表面缺陷的检测在汽车外观检测中扮演着不可或缺的角色

然而,传统的车门表面缺陷检测方法依赖于人工巡查,这不仅效率低下,而且经过繁重的工作后,人工巡查的准确性和速度会明显下降

[0003]随着深度学习的快速发展,尤其是目标检测网络的进步,基于目标检测网络的方法在车门表面缺陷检测领域引起了广泛关注

许多汽车生产线已经开始采用机械臂和摄像头实现车门表面缺陷的自动检测

然而,由于生产现场通常缺乏高算力设备,目标检测网络在实际生产中的应用受到了限制

此外,目前在汽车生产线上应用的大多数目标检测网络都为了实时检测而牺牲了检测精度,因此只能起到辅助检测的作用

因此,寻找一种能够实现实时检测

高准确性和轻量化三者平衡的方法迫在眉睫,并成为车门表面缺陷检测领域的研究重点


技术实现思路

[0004]本专利技术的目的在于解决当前目标检测网络在车门表面缺陷检测难以实现实时检测

精确检测

轻量化三者平衡的问题,提供了一种基于改进
YOLOv8
网络的车门表面缺陷检测方法,通过改进的残差模块有效地减少了主干网络参数量和运算量,从而降低了其对硬件设备算力的要求,使其更能够适应实际汽车生产环境的要求;同时,通过改进的特征融合方式和改进的
CBAM
注意力模块实现了实时检测与精确检测之间的平衡,从而实现了自动车门表面缺陷检测

[0005]为实现上述目的,本专利技术所提供的技术方案为:基于改进
YOLOv8
网络的车门表面缺陷检测方法,该改进
YOLOv8
网络是对原来
YOLOv8
网络进行两部分改进,第一部分是对主干网络的残差模块进行改进:将原来2个串联的3×3卷积层改为利用1个3×3深度可分离卷积层
、1
个3×
3Ghost

Dilated
卷积层来构建并联特征提取,基于拆分

转换

融合的思想通过并联卷积操作提取不同特征进行拼接操作,从而减少主干网络的参数量和运算量;第二部分是对颈部网络不同特征的融合方式进行改进,将原来相邻两个不同尺度的特征进行融合改为将所有尺度的特征通过缩放变成统一尺度的特征图,然后计算不同尺度特征图的均值,得到均值特征图,将所得均值特征图与不同尺度的特征进行融合,再利用改进的
CBAM
注意力模块将融合后的特征图进行信息聚合,对
CBAM
注意力模块的改进是将原有的空间注意力模块替换为上下文聚合模块,该上下文聚合模块是一种自注意力模块,用于增强融合后特征的全局信息,从而减少车门表面缺陷检测训练过程中的不平衡对于网络精度的影响;
[0006]该车门表面缺陷检测方法的具体实施包括以下步骤:
[0007]1)
采集车门表面缺陷图像,自定义构建车门表面缺陷数据集,并划分训练集

验证集和测试集;
[0008]2)
将训练集分批送入改进
YOLOv8
网络进行训练,训练集中的图像通过主干网络特征提取后,通过颈部网络对不同尺度的特征层进行特征融合并对提取的特征进行特征增强,通过检测头得到网络的损失,基于梯度下降策略和损失计算反向传播对网络参数和权重进行更新,而且规定每经过预设次数的网络训练之后在验证集上验证网络的性能,当验证集上的评价指标达到最佳且网络的损失值不再发生降低时得到训练和验证后性能最佳的网络;
[0009]3)
将测试集送入步骤
2)
得到的性能最佳的网络中,得到网络预测的分类值和预测边界框的坐标,其中不同分类值对应不同的缺陷

[0010]进一步,在步骤
1)
中,在对车门表面进行拍摄之前,先控制机械臂到指定的拍摄区域上,根据不同的模拟生产情况调整好条纹光源中条纹的形状,待上位机所显示图像稳定后,通过上位机控制摄像头拍摄车门表面缺陷图像,然后调整机械臂的位置遍历整个车门,完成车门表面缺陷图像的采集;完成采集之后,对图像进行预处理,预处理操作流程包括:先采用双线性插值缩放采集原图,统一尺寸至分辨率为
640
×
640
,对图像进行饱和度

色调和曝光度的调整,然后对变换后的图像进行高斯滤波的操作,降低图像中噪音对检测精度的影响;利用预处理后的图像构建车门表面缺陷数据集,数据集包括正常车门表面图像

针孔缺陷图像

划痕缺陷图像和钣金缺陷图像,针对针孔缺陷图像和钣金缺陷图像使用
Mosaic
方法进行数据增强,
Mosaic
方法首先随机选取一个位置作为中心图像的位置,该位置在输入图像中的一个区域内随机选取,将选定的中心图像放置在输入图像中心的位置,并将边界图像经过缩放

平移和翻转操作放置在输入图像的四个边界上,最后根据边界图像在输入图像中的位置和缩放比例调整边界图像中的目标边界框;将所构建车门表面缺陷数据集按设定比例划分为训练集

验证集和测试集

[0011]进一步,在步骤
2)
中,改进
YOLOv8
网络包括主干网络

颈部网络和检测头三部分,具体情况如下:
[0012]主干网络的第一层架构为3×3卷积操作,用于调整输入图像的通道数和将输入尺寸进行降采样操作;
[0013]第二层和第五层架构均为一次3×3卷积操作加上重复3次的改进的残差模块操作,第三层和第四层架构均为一次3×3卷积操作加上重复6次的改进的残差模块操作;其中,该改进的残差模块分为五个步骤提取特征,具体情况如下:
[0014]第一步为3×3卷积操作使得原输入特征图的通道维度调整到原来的2倍,得到新的输入特征图
I

[0015]第二步为将输入特征图
I
按照通道维度平均分为两个子特征图
I1和
I2;
[0016]第三步为将子特征图
I1进行3×3深度可分离卷积操作形成新的特征图
I'1,其过程如下公式
(1)

[0017]I'1=
I1*DW3ꢀꢀ
(1)本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
基于改进
YOLOv8
网络的车门表面缺陷检测方法,其特征在于,该改进
YOLOv8
网络是对原来
YOLOv8
网络进行两部分改进,第一部分是对主干网络的残差模块进行改进:将原来2个串联的3×3卷积层改为利用1个3×3深度可分离卷积层
、1
个3×
3Ghost

Dilated
卷积层来构建并联特征提取,基于拆分

转换

融合的思想通过并联卷积操作提取不同特征进行拼接操作,从而减少主干网络的参数量和运算量;第二部分是对颈部网络不同特征的融合方式进行改进,将原来相邻两个不同尺度的特征进行融合改为将所有尺度的特征通过缩放变成统一尺度的特征图,然后计算不同尺度特征图的均值,得到均值特征图,将所得均值特征图与不同尺度的特征进行融合,再利用改进的
CBAM
注意力模块将融合后的特征图进行信息聚合,对
CBAM
注意力模块的改进是将原有的空间注意力模块替换为上下文聚合模块,该上下文聚合模块是一种自注意力模块,用于增强融合后特征的全局信息,从而减少车门表面缺陷检测训练过程中的不平衡对于网络精度的影响;该车门表面缺陷检测方法的具体实施包括以下步骤:
1)
采集车门表面缺陷图像,自定义构建车门表面缺陷数据集,并划分训练集

验证集和测试集;
2)
将训练集分批送入改进
YOLOv8
网络进行训练,训练集中的图像通过主干网络特征提取后,通过颈部网络对不同尺度的特征层进行特征融合并对提取的特征进行特征增强,通过检测头得到网络的损失,基于梯度下降策略和损失计算反向传播对网络参数和权重进行更新,而且规定每经过预设次数的网络训练之后在验证集上验证网络的性能,当验证集上的评价指标达到最佳且网络的损失值不再发生降低时得到训练和验证后性能最佳的网络;
3)
将测试集送入步骤
2)
得到的性能最佳的网络中,得到预测的分类值和预测边界框的坐标,其中不同分类值对应不同的缺陷
。2.
根据权利要求1所述的基于改进
YOLOv8
网络的车门表面缺陷检测方法,其特征在于,在步骤
1)
中,在对车门表面进行拍摄之前,先控制机械臂到指定的拍摄区域上,根据不同的模拟生产情况调整好条纹光源中条纹的形状,待上位机所显示图像稳定后,通过上位机控制摄像头拍摄车门表面缺陷图像,然后调整机械臂的位置遍历整个车门,完成车门表面缺陷图像的采集;完成采集之后,对图像进行预处理,预处理操作流程包括:先采用双线性插值缩放采集原图,统一尺寸至分辨率为
640
×
640
,对图像进行饱和度

色调和曝光度的调整,然后对变换后的图像进行高斯滤波的操作,降低图像中噪音对检测精度的影响;利用预处理后的图像构建车门表面缺陷数据集,数据集包括正常车门表面图像

针孔缺陷图像

划痕缺陷图像和钣金缺陷图像,针对针孔缺陷图像和钣金缺陷图像使用
Mosaic
方法进行数据增强,
Mosaic
方法首先随机选取一个位置作为中心图像的位置,该位置在输入图像中的一个区域内随机选取,将选定的中心图像放置在输入图像中心的位置,并将边界图像经过缩放

平移和翻转操作放置在输入图像的四个边界上,最后根据边界图像在输入图像中的位置和缩放比例调整边界图像中的目标边界框;将所构建车门表面缺陷数据集按设定比例划分为训练集

验证集和测试集
。3.
根据权利要求2所述的基于改进
YOLOv8
网络的车门表面缺陷检测方法,其特征在于,在步骤
2)
中,改进
YOLOv8
网络包括主干网络

颈部网络和检测头三部分,具体情况如下:主干网络的第一层架构为3×3卷积操作,用于调整输入图像的通道数和将输入尺寸进行降采样操作;
第二层和第五层架构均为一次3×3卷积操作加上重复3次的改进的残差模块操作,第三层和第四层架构均为一次3×3卷积操作加上重复6次的改进的残差模块操作;其中,该改进的残差模块分为五个步骤提取特征,具体情况如下:第一步为3×3卷积操作使得原输入特征图的通道维度调整到原来的2倍,得到新的输入特征图
I
;第二步为将输入特征图
I
按照通道维度平均分为两个子特征图
I1和
I2;第三步为将子特征图
I1进行3×3深度可分离卷积操作形成新的特征图
I
′1,其过程如下公式
(1)

I
′1=
I1*DW3ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
式中,
I
′1表示经过3×3深度可分离卷积操作输出的特征图,
DW3表示3×3深度可分离卷积操作,深度可分离卷积操作将标准卷积操作拆分为两个步骤:深度卷积操作和逐点卷积操作,深度卷积操作独立地对输入特征图的每个通道进行卷积操作,逐点卷积操作使用1×1卷积核对深度卷积操作的输出进行卷积操作,过程如下公式
(2)

X
′1=
X1*K3*K1ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
式中,
X
′1表示
I
′1一个通道的特征,
X1表示
I1一个通道的特征,
K3表示3×3卷积操作,
K1表示1×1卷积操作;第四步为对子特征图
I2进行3×
3 Ghost

Dilated
卷积操作形成新的特征图
I
′2,
Ghost

Dilated
卷积操作将卷积操作拆分为三个步骤:主分支卷积操作

伪分支卷积操作和特征融合操作,其中,主分支卷积操作对输入特征图
75
%的通道进行操作,使用3×3卷积操作对输入特征进行处理,伪分支卷积操作对输入特征图
25
%的通道进行操作,使用7×7空洞卷积操作对输入特征进行处理,最后把两个分支的输出结果进行特征拼接操作,其过程如下公式
(3)
:式中,
I
′2表示经过3×
3 Ghost

Dilated
卷积操作输出的特征图,表示
I2的
75
%通道的特征,表示
I2的
25
%通道的特征,表示7×7空洞卷积操作,
C
表示在通道维度上的特征拼接操作;第五步为将特征图
I
′1与特征图
I
′2经过特征拼接操作后得到新的特征图
I3,将特征图
I3与特征图
I
相加形成新的特征图
I4,从而融合了经过不同类型的卷积方式得到的特征图之间的信息,丰富了图像不同语义信息之间的特征,其过程如下公式
(4)、(5)

I3=
C(I
′1,
I
′2)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)I4=
I+I3ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
式中,
I3表示特征图
I
′1与特征图
I
′2经过特征拼接操作后得到的特征图,
I4表示特征图
I
与特征图
I3相加得到的特征图;颈部网络采用了改进的特征融合方式融合主干网络三至五层架构输出的特征
F3、F4、F5,该改进的特征融合方式分为四个步骤融合特征,具体情况如下:第一步为将
F3和
F5缩放到与
F4相同的尺度,其过程如下公式
(6)、(7)

F
′3=
D(F3)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)F
′5=
U(F5)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
式中,
F
′3表示
F3缩放后的输出,
F
′5表示
F5缩放后的输出,
D
表示最大池化操作,
U
表示双线性差值操作;第二步为通过
F
′3、F4、F
′5和预设的超参数
α

β

γ
进行加权平均操作,其过程如下公式
(8)

F
avg

α
F'3+
β
F4+
γ
F'5ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
式中,
F
avg
为加权平均操作输出的平均特征;第三步为将
F
avg

F3、F4、F5进行特征融合,其过程如下公式
(9)、(10)、(11)

P3=
C(F3,
F
avg
*K1)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)P4=
C(F4,
F
avg
*K1)
...

【专利技术属性】
技术研发人员:田联房陈金铭杜启亮
申请(专利权)人:华南理工大学珠海现代产业创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1