一种基于迁移学习的小样本目标识别方法技术

技术编号:33541730 阅读:27 留言:0更新日期:2022-05-21 09:51
本发明专利技术属于图像处理技术领域,具体涉及一种基于迁移学习的小样本目标识别方法,其包括以下步骤,S1、对玻璃缺陷样本分成划痕、崩边以及脏污三个类别进行图像采样,获取样本图像;S2、将样本图像制作成样本数据集;S3、构建玻璃表面缺陷模型,用热轧带钢表面缺陷数据集作为特征输入对玻璃表面缺陷模型进行预训练,获得玻璃表面模型的初始权重;S4、获取热轧带钢表面缺陷数据集,采用迁移学习方法,将样本数据集对玻璃表面缺陷模型进行训练,获得优化后的玻璃表面缺陷模型;S5、将待检测玻璃图像输入玻璃表面缺陷模型,获取待检测玻璃的缺陷类别。本发明专利技术提供的小样本目标识别方法可以有效的解决数据样本量小的问题。的解决数据样本量小的问题。的解决数据样本量小的问题。

【技术实现步骤摘要】
一种基于迁移学习的小样本目标识别方法


[0001]本专利技术属于图像处理
,具体涉及一种基于迁移学习的小样本目标识别方法。

技术介绍

[0002]在工业应用领域复杂的深加工过程中,如原片平板玻璃进深加工一般需要经过切割、磨边、清洗、抛光等工序,有些还需要经过钻孔、印刷和钢化等,由于受技术条件、生产环境或人为因素的影响,均可能出现缺陷。
[0003]深度学习中的目标检测模型可以用于实现缺陷检测、目标定位以及尺寸测量等任务,是缺陷检测领域可以被采用的一种检测手段,通过对图片中待检测目标的位置标注,利用深度卷积神经对缺陷的特征进行提取,训练完成输出目标检测模型,完成对缺陷检测的识别和分类。但深度学习是一种对数据量要求较高的一种技术,其能获得出色的效果主要依赖于大量的带类标签的训练样本,而在现实的工业应用领域中并没有足够的带类标签的样本,或者获得大量带有标签样本的成本非常高昂。因此,需提供一种用于缺陷检测的小样本目标识别方法。

技术实现思路

[0004]本专利技术针对工业应用领域中,用于目标检测的数据样本量小的问题,提供一种基于迁移学习的小样本目标识别方法。
[0005]一种基于迁移学习的小样本目标识别方法,包括以下步骤,
[0006]S1、对玻璃缺陷样本分成划痕、崩边以及脏污三个类别进行图像采样,获取样本图像;
[0007]S2、将样本图像制作成样本数据集;
[0008]S3、构建玻璃表面缺陷模型;
[0009]S4、获取热轧带钢表面缺陷数据集,采用迁移学习方法,将热轧带钢表面缺陷数据集作为特征输入对玻璃表面缺陷模型进行预训练,获得玻璃表面模型的初始权重;用样本数据集对玻璃表面缺陷模型进行训练,获得优化后的玻璃表面缺陷模型。
[0010]S5、将待检测玻璃图像输入玻璃表面缺陷模型,获取待检测玻璃的缺陷类别。
[0011]此方法中,利用迁移学习方法,借助热轧带钢表面缺陷数据集获得特征参数的同时保持与目标对象数据集的相关性,可以有效的解决数据样本量小的问题,并且能加速玻璃表面缺陷模型的训练、改善玻璃表面缺陷检测模型的检测效果。
[0012]进一步的,所述S2包括:
[0013]提取样本图像的高亮部分;对样本图像的连通域进行分割,选取整个玻璃表面区域并显示;
[0014]将样本数据集按照yolo的格式进行标签的制作;
[0015]将样本数据集按比例划分为训练集、测试集和验证集。
[0016]进一步的,所述S3包括:
[0017]以CSPDakeNet网络为作为BackBone主干网络,构建玻璃表面缺陷模型,所述CSPDakeNet网络级联多个残差块。
[0018]进一步的,所述残差块由两个部分组成,其中一部分由卷积块、BN层以及Mish激活函数组成,对图像特征进行抽象提取,缺陷特征信息不可逆,另一部分直接对图像特征进行获取,处理完成后,两部分的特征向量相加融合。
[0019]进一步的,在BackBone主干网络中加入注意力机制模块CBAM;所述注意力机制模块CBAM的输入为F,所述F为中间层的feature map,每个CSPDacknet模块均包括中间层;所述中间层位于CSPDacknet模块中的两个CBM层之间,所述注意力机制模块CBAM依次生成一维通道Mc和二维通道Ms;所述注意力机制模块CBAM的输出特征为最终注意力权重F

;。
[0020]Mc(F)=σ(MLP(avgpool(F))+MLP(maxpool(F)))
[0021]Ms(F)=σ(f7×7([avgpool(F);maxpool(F)]))
[0022]F

=Ms(Mc(F)F)
×
(Mc(F)F)
[0023]式中Mc(F)为在channel维度上做attention提取操作,MLP(avgpool(F))为通过多层感知机模块的平均池化,MLP(maxpool(F))为通过多层感知机模块的最大池化;σ为sigmoid函数
[0024]Ms(F)为在spatial维度上做attention提取操作;f7×7([avgpool(F);maxpool(F)])为滤波器尺寸为7
×
7的卷积运算;avgpool(F)为对F进行平均池化;
[0025]maxpool(F)为对F进行最大池化;
[0026]Ms(Mc(F)F)为权重系数;(Ms(F)F)为输入特征。
[0027]进一步的,所述获取热轧带钢表面缺陷数据集包括收集热轧带钢公开的缺陷图片,将缺陷图片统一缩放到416*416的尺寸,对缺陷图片进行图像增强,获得热轧带钢表面缺陷数据集;所述图像增强包括突出缺陷特征和扩增热轧带钢表面缺陷数据集的样本数量;采用频域增强算法突出缺陷特征;通过旋转、翻转、添加噪声扩增热轧带钢表面缺陷数据集的样本数量。
[0028]进一步的,所述迁移学习方法为载入热轧带钢表面缺陷数据集训练的模型权重作为玻璃表面缺陷模型的初始权重,冻住前部分残差块的网络层,用样本数据集训练后部分残差块的网络层。
[0029]进一步的,所述S4还包括:
[0030]构建损失函数;
[0031]结合损失函数和SGDM动量梯度下降方法对玻璃表面缺陷模型进行优化训练,总训练轮数达到预设值后停止训练,获得优化后的玻璃表面缺陷模型;
[0032]采用验证集作为玻璃表面缺陷模型的评估指标,对优化训练后的迁玻璃表面缺陷模型进行评估;
[0033]采用测试集对优化训练后的玻璃表面缺陷模型进行测试。
[0034]进一步的,所损失函数为
[0035]Loss
total
=Loss
location
+Loss
conf
+Loss
class
[0036]式中:Loss
total
为总损失值;Loss
location
为预测框与真实框的误差损失;Loss
conf
为置信度损失;Loss
class
为类别损失;
[0037]使用二值交叉熵损失函数计算置信度损失Loss
conf
与类别损失Loss
class

[0038]使用CIOU损失计算box的损失,公式如下
[0039][0040][0041][0042]式中:α为权重参数,v为宽高比一致性参数,ω为box的宽,h为box的高,gt为真实框的信息;IoU为交并比,ρ为欧几里得度量,c为对角线长度,A为预测框,B为目标框。
[0043]进一步的,所述SGDM动量梯度下降方法为在随机梯度下降的方法上引入动量Momentum;
[0044]m
t
=β
×
m
t
‑1+(1

β)
...

【技术保护点】

【技术特征摘要】
1.一种基于迁移学习的小样本目标识别方法,其特征在于,包括以下步骤,S1、对玻璃缺陷样本分成划痕、崩边以及脏污三个类别进行图像采样,获取样本图像;S2、将样本图像制作成样本数据集;S3、构建玻璃表面缺陷模型;S4、获取热轧带钢表面缺陷数据集,采用迁移学习方法,将热轧带钢表面缺陷数据集作为特征输入对玻璃表面缺陷模型进行预训练,获得玻璃表面模型的初始权重;用样本数据集对玻璃表面缺陷模型进行训练,获得优化后的玻璃表面缺陷模型;S5、将待检测玻璃图像输入玻璃表面缺陷模型,获取待检测玻璃的缺陷类别。2.根据权利要求1所述的基于迁移学习的小样本目标识别方法,其特征在于,所述S2包括:提取样本图像的高亮部分;对样本图像的连通域进行分割,选取整个玻璃表面区域并显示;将样本数据集按照yolo的格式进行标签的制作;将样本数据集按比例划分为训练集、测试集和验证集。3.根据权利要求2所述的基于迁移学习的小样本目标识别方法,其特征在于,所述S3包括:以CSPDakeNet网络为作为BackBone主干网络,构建玻璃表面缺陷模型,所述CSPDakeNet网络级联多个残差块。4.根据权利要求3所述的基于迁移学习的小样本目标识别方法,其特征在于,所述残差块由两个部分组成,其中一部分由卷积块、BN层以及Mish激活函数组成,对图像特征进行抽象提取,缺陷特征信息不可逆,另一部分直接对图像特征进行获取,处理完成后,两部分的特征向量相加融合。5.根据权利要求4所述的基于迁移学习的小样本目标识别方法,其特征在于,在BackBone主干网络中加入注意力机制模块CBAM;所述注意力机制模块CBAM的输入为F,所述F为中间层的feature map,每个CSPDacknet模块均包括中间层;所述中间层位于CSPDacknet模块中的两个CBM层之间,所述注意力机制模块CBAM依次生成一维通道Mc和二维通道Ms;所述注意力机制模块CBAM的输出特征为最终注意力权重F

;Mc(F)=σ(MLP(avgpool(F))+MLP(maxpool(F)))Ms(F)=σ(f7×7([avgpool(F);maxpool(F)]))F

=Ms(Mc(F)F)
×
(Mc(F)F)式中Mc(F)为在channel维度上做attention提取操作,MLP(avgpool(F))为通过多层感知机模块的平均池化,MLP(maxpool(F))为通过多层感知机模块的最大池化;σ为sigmoid函数;Ms(F)为在spatial维度上做attention提取操作;f7×7([avgpool(F);maxpool(F)])为滤波器尺寸为7
×
7的卷积运算;avgpool(F)为对F进行平均池化;maxpool(F)为对F进行最大池化;Ms(Mc(F)F)为权重系数;(Ms(F)F)为输入特征。6.根据权利要求5所述...

【专利技术属性】
技术研发人员:尹玲叶正伟
申请(专利权)人:东莞理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1