一种联合主动学习和深度学习技术的工业检测方法技术

技术编号:33835192 阅读:11 留言:0更新日期:2022-06-16 11:49
本发明专利技术提供了一种联合主动学习和深度学习技术的工业检测方法,包括以下步骤:S1,构建主动学习模型,建立无标签数据池、有标签数据集;S2,进行样本选择,选择出无标签数据池中不确定性和多样性较高的样本并标注,完成有标签数据集的重构;S3,搭建yolov5目标检测模型;所述yolov5目标检测模型是在yolov5基础模型的骨干网络中嵌入注意力模块SA;S4,采用重构的有标签数据集对yolov5目标检测模型进行模型训练,在验证集上经过模型评估合格后,即获得yolov5网络模型,并实现模型上线部署。本发明专利技术模型训练过程中采用主动学习技术查询无标注数据集,择优挑选“最有价值”的样本,从而降低人工标注数量和成本。人工标注数量和成本。人工标注数量和成本。

【技术实现步骤摘要】
一种联合主动学习和深度学习技术的工业检测方法


[0001]本专利技术属于工业缺陷检测领域,涉及计算机视觉技术在工业缺陷检测领域的应用,涉及图像数据标注选择和目标检测模型改进,尤其是一种联合主动学习和深度学习技术的工业检测方法。

技术介绍

[0002]目前工业自动化缺陷检测产线存在的问题包括两方面:数据问题与模型自身检测性能问题。一方面,数据问题与深度学习技术出现对立现象,具体表现为:监督式的深度学习模型目前仍需要大量的数据样本,而工业自动化流水线的有缺陷数据标注需要专家经验,且标注量大、耗时费力,因此表现出有标注样本获取代价非常昂贵。另一方面,当前工业缺陷检测存在检出性能与节拍的对立,往往性能好的模型二阶段目标检测模型,其推理速度要慢于一阶段的目标检测模型,而一阶段的目标检测模型虽然速度较快,但是其检测精度受限。
[0003]如YOLOV5网络中具备的切图模块Focus、SPP特征金字塔模块、多尺度检测头输出等策略,可以有效地对目标对象高层和底层特征的表达,且网络中多处使用1*1卷积算子因此YOLOV5网络参数量较少,网络表现较为轻量。尽管YOLOV5网络结构在目标检测特征提取上表现良好,但由于其受限于卷积层的局部特征影响,难以有效抽取影像中的空间上下文信息,缺乏全局特征表达能力,因此在工业缺陷检测上仍存在部分精度上限。
[0004]因此目标检测网络在工业视觉检测存在精度和速度难以取舍,深度学习算法在工业缺陷自动检测上落地应用难,工业缺陷数据标注耗时、效率低,数据标注代价昂贵。

技术实现思路
<br/>[0005]本专利技术提供一种联合主动学习和深度学习技术的工业检测方法,以至少解决现有技术中工业缺陷数据标注量大、耗时、效率低,目标检测网络在工业视觉检测存在精度和速度难以取舍的问题。
[0006]本专利技术提供了一种联合主动学习和深度学习技术的工业检测方法,包括以下步骤:
[0007]S1,构建主动学习模型,建立无标签数据池、有标签数据集;
[0008]S2,进行样本选择,选择出无标签数据池中不确定性和多样性较高的样本并标注,完成有标签数据集的重构;
[0009]S3,搭建yolov5目标检测模型;所述yolov5目标检测模型是在yolov5基础模型的骨干网络中嵌入注意力模块;
[0010]S4,采用重构的有标签数据集对yolov5目标检测模型进行模型训练,经过在有标签的验证集上做模型评估后满足要求后,停止迭代训练,即获得yolov5网络模型,最终完成模型上线部署。
[0011]进一步地,所述注意力模块为SA注意力模块,将通道信息分成子模块。
[0012]更进一步地,所述SA注意力模块通过Shuffle Unit同时构建空间注意力和通道注意力。
[0013]更进一步地,所述SA模块放入骨干网络中除第一个残差组件以外的残差组件后面。
[0014]进一步地,所述样本选择,基于不确定性的启发式采样方法,查询出当前学习模型最难以确定其类别标签的样本。
[0015]更进一步地,所述主动学习模型采用熵率作为样本信息含量的依据。
[0016]更进一步地,所述熵率计算公式如下:
[0017][0018]p(y
j
|x
i
)=1/(1+dxp(t
ij
))
[0019]其中,p(y_j|x_i)表示任意一个样本x_i属于第j类的后验概率,m为类别数目,t_ij表示神经网络的分类头输出,熵率E越大表示样本的分类模糊度越大,其信息越丰富,对分类模型的性能提升越大。
[0020]更进一步地,样本选择还基于余弦角距离的样本间相似性度量准则。
[0021]更进一步地,所述余弦角距离度量公式如下:
[0022][0023]式中,X=[x1,x2,......,x
n
‑1,x
n
],Y=[y1,y2,......,y
n
‑1,y
n
]分别为具有n维特征向量的样本,其两个向量间的余弦夹角值cos&lt;X,Y&gt;直接反映两向量间的相似性程度,且cos&lt;X,Y&gt;值的大小与相似程度成负相关关系。
[0024]更进一步地,所述样本选择为等权结合熵值和余弦相似度,按照等权的结果对无标签数据池中所有样本进行从小到大排序,基于排序结果选择前若干个样本进行标注。
[0025]本专利技术相对于现有技术,在模型训练过程中采用主动学习技术查询无标注数据集,择优挑选“最有价值”的样本,从而降低人工标注数量和成本;同时基于YOLOV5模型添加注意力模块,模型改进,提高检测模型的全局上下文语义信息表达能力,有效提升模型的检测性能,实现较低的漏杀和过杀目标。
附图说明
[0026]图1为本专利技术流程图;
[0027]图2为本专利技术改进的主动学习流程图;
[0028]图3为本专利技术中Shuffe Attention模块示意图;
[0029]图4为本专利技术添加SA模块的YOLOV5网络示意图
具体实施方式
[0030]为了使本
的人员更好地理解本专利技术方案,下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不
是全部的实施例。
[0031]本实施例公开的联合主动学习和深度学习技术的工业检测方法,如图1所示,所述方法包括以下步骤:
[0032]S1,构建主动学习模型,建立无标签数据池、有标签数据集;
[0033]S2,进行样本选择,选择出无标签数据池中不确定性和多样性较高的样本并标注,完成有标签数据集的重构;
[0034]S3,搭建yolov5目标检测模型;所述yolov5目标检测模型是在yolov5基础模型的骨干网络中嵌入注意力模块;
[0035]S4,采用重构的有标签数据集对yolov5目标检测模型进行模型训练,获得yolov5网络模型。
[0036]具体的,首先数据粗清洗,在大量无标签数据集合中剔除部分无目标区域的废图、切割划分过大的图像、不同色调的图像间彼此迁移增强;通过粗清洗后的数据,人工划分训练集合和验证集合,可选的训练与验证集合占比约为7:3。|
[0037]本实施例分别从数据标注和模型性能优化两方面出发,在数据标注方面引入主动学习技术,查询策略兼顾样本的不确定性和多样性。优选具有衡量模型性能的强代表性能力,“有价值”的样本,大大降低样本标注数量,降低人工标注成本,迅速提升模型性能。在检测模型优化方面,在yolov5基础模型的骨干网络中嵌入注意力模块,基于改进的YOLOV5模型可有效兼顾检测精度和检测速度。
[0038]优选的,所述样本选择,基于不确定性的启发式采样方法,查询出当前学习模型最难以确定其类别标签的样本。
[0039]其中,所述主动学习模型采用熵率作为样本信息含量的依据。
[004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种联合主动学习和深度学习技术的工业检测方法,其特征在于,所述方法包括以下步骤:S1,构建主动学习模型,建立无标签数据池、有标签数据集;S2,进行样本选择,选择出无标签数据池中不确定性和多样性较高的样本并标注,完成有标签数据集的重构;S3,搭建yolov5目标检测模型;所述yolov5目标检测模型是在yolov5基础模型的骨干网络中嵌入注意力模块;S4,采用重构的有标签数据集对yolov5目标检测模型进行模型训练,获得yolov5网络模型。2.根据权利要求1所述一种联合主动学习和深度学习技术的工业检测方法,其特征在于,所述注意力模块为SA注意力模块,将通道信息分成子模块。3.根据权利要求2所述一种联合主动学习和深度学习技术的工业检测方法,其特征在于,所述SA注意力模块通过Shuffle Unit同时构建空间注意力和通道注意力。4.根据权利要求3所述一种联合主动学习和深度学习技术的工业检测方法,其特征在于,所述SA模块放入骨干网络中除第一个残差组件以外的残差组件后面。5.根据权利要求1所述一种联合主动学习和深度学习技术的工业检测方法,其特征在于,所述样本选择,基于不确定性的启发式采样方法,查询出当前学习模型最难以确定其类别标签的样本。6.根据权利要求5所述一种联合主动学习和深度学习技术的工业检测方法,其特征在于,所述主动学习模型采用熵率作为样本信息含量的依据。7.根据权利要求6所述一种联合主动学习和深度学习技术的工业检测方法,其特征...

【专利技术属性】
技术研发人员:杨进一陈宇
申请(专利权)人:厦门微亚智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1