一种基于迁移学习的小样本目标识别方法技术

技术编号：33541730 阅读：27 留言：0更新日期：2022-05-21 09:51

本发明专利技术属于图像处理技术领域，具体涉及一种基于迁移学习的小样本目标识别方法，其包括以下步骤，S1、对玻璃缺陷样本分成划痕、崩边以及脏污三个类别进行图像采样，获取样本图像；S2、将样本图像制作成样本数据集；S3、构建玻璃表面缺陷模型，用热轧带钢表面缺陷数据集作为特征输入对玻璃表面缺陷模型进行预训练，获得玻璃表面模型的初始权重；S4、获取热轧带钢表面缺陷数据集，采用迁移学习方法，将样本数据集对玻璃表面缺陷模型进行训练，获得优化后的玻璃表面缺陷模型；S5、将待检测玻璃图像输入玻璃表面缺陷模型，获取待检测玻璃的缺陷类别。本发明专利技术提供的小样本目标识别方法可以有效的解决数据样本量小的问题。的解决数据样本量小的问题。的解决数据样本量小的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于迁移学习的小样本目标识别方法

[0001]本专利技术属于图像处理
，具体涉及一种基于迁移学习的小样本目标识别方法。

技术介绍

[0002]在工业应用领域复杂的深加工过程中，如原片平板玻璃进深加工一般需要经过切割、磨边、清洗、抛光等工序，有些还需要经过钻孔、印刷和钢化等，由于受技术条件、生产环境或人为因素的影响，均可能出现缺陷。
[0003]深度学习中的目标检测模型可以用于实现缺陷检测、目标定位以及尺寸测量等任务，是缺陷检测领域可以被采用的一种检测手段，通过对图片中待检测目标的位置标注，利用深度卷积神经对缺陷的特征进行提取，训练完成输出目标检测模型，完成对缺陷检测的识别和分类。但深度学习是一种对数据量要求较高的一种技术，其能获得出色的效果主要依赖于大量的带类标签的训练样本，而在现实的工业应用领域中并没有足够的带类标签的样本，或者获得大量带有标签样本的成本非常高昂。因此，需提供一种用于缺陷检测的小样本目标识别方法。

技术实现思路

[0004]本专利技术针对工业应用领域中，用于目标检测的数据样本量小的问题，提供一种基于迁移学习的小样本目标识别方法。
[0005]一种基于迁移学习的小样本目标识别方法，包括以下步骤，
[0006]S1、对玻璃缺陷样本分成划痕、崩边以及脏污三个类别进行图像采样，获取样本图像；
[0007]S2、将样本图像制作成样本数据集；
[0008]S3、构建玻璃表面缺陷模型；
[0009]S4、获取热轧带钢表面缺陷数据集，采用迁移

【技术保护点】

【技术特征摘要】
1.一种基于迁移学习的小样本目标识别方法，其特征在于，包括以下步骤，S1、对玻璃缺陷样本分成划痕、崩边以及脏污三个类别进行图像采样，获取样本图像；S2、将样本图像制作成样本数据集；S3、构建玻璃表面缺陷模型；S4、获取热轧带钢表面缺陷数据集，采用迁移学习方法，将热轧带钢表面缺陷数据集作为特征输入对玻璃表面缺陷模型进行预训练，获得玻璃表面模型的初始权重；用样本数据集对玻璃表面缺陷模型进行训练，获得优化后的玻璃表面缺陷模型；S5、将待检测玻璃图像输入玻璃表面缺陷模型，获取待检测玻璃的缺陷类别。2.根据权利要求1所述的基于迁移学习的小样本目标识别方法，其特征在于，所述S2包括：提取样本图像的高亮部分；对样本图像的连通域进行分割，选取整个玻璃表面区域并显示；将样本数据集按照yolo的格式进行标签的制作；将样本数据集按比例划分为训练集、测试集和验证集。3.根据权利要求2所述的基于迁移学习的小样本目标识别方法，其特征在于，所述S3包括：以CSPDakeNet网络为作为BackBone主干网络，构建玻璃表面缺陷模型，所述CSPDakeNet网络级联多个残差块。4.根据权利要求3所述的基于迁移学习的小样本目标识别方法，其特征在于，所述残差块由两个部分组成，其中一部分由卷积块、BN层以及Mish激活函数组成，对图像特征进行抽象提取，缺陷特征信息不可逆，另一部分直接对图像特征进行获取，处理完成后，两部分的特征向量相加融合。5.根据权利要求4所述的基于迁移学习的小样本目标识别方法，其特征在于，在BackBone主干网络中加入注意力机制模块CBAM；所述注意力机制模块CBAM的输入为F，所述F为中间层的feature map，每个CSPDacknet模块均包括中间层；所述中间层位于CSPDacknet模块中的两个CBM层之间，所述注意力机制模块CBAM依次生成一维通道Mc和二维通道Ms；所述注意力机制模块CBAM的输出特征为最终注意力权重F
′
；Mc(F)＝σ(MLP(avgpool(F))+MLP(maxpool(F)))Ms(F)＝σ(f7×7([avgpool(F)；maxpool(F)]))F
′
＝Ms(Mc(F)F)
×
(Mc(F)F)式中Mc(F)为在channel维度上做attention提取操作，MLP(avgpool(F))为通过多层感知机模块的平均池化，MLP(maxpool(F))为通过多层感知机模块的最大池化；σ为sigmoid函数；Ms(F)为在spatial维度上做attention提取操作；f7×7([avgpool(F)；maxpool(F)])为滤波器尺寸为7
×
7的卷积运算；avgpool(F)为对F进行平均池化；maxpool(F)为对F进行最大池化；Ms(Mc(F)F)为权重系数；(Ms(F)F)为输入特征。6.根据权利要求5所述...

【专利技术属性】
技术研发人员：尹玲，叶正伟，
申请(专利权)人：东莞理工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人