【技术实现步骤摘要】
一种基于视觉认知计算的工业缺陷检测方法及系统
[0001]本专利技术属于计算机视觉中的目标检测(Object Detection)
,特别涉及一种基于视觉认知计算的工业缺陷检测方法及系统。
技术介绍
[0002]工业缺陷检测是指采用矩形锚框标记工业所拍摄图像中的缺陷位置,并对所属缺陷种类进行识别的技术,是工业生产中产品质量监测和分析仪器故障的关键步骤。
[0003]工业生产场景复杂,存在较多环境干扰(受像素尺寸、拍摄角度、环境脏污、外界光反射因素影响等),所拍摄图像中的缺陷目标和背景部分不易分辨,会影响工业缺陷检测任务的准确性。此外,小尺寸缺陷(示例性的,例如图像缩放到短边小于等于800像素,面积小于32
×
32像素的缺陷)在图像中所占面积更小且数目更多,这决定了它在视觉上不易被关注,位置更难精确标定,所属缺陷种类更难判断,因此工业场景中的小尺寸缺陷检测是一项极具挑战的任务。
[0004]目前,现有的工业缺陷检测方式根据技术流程与发展阶段可分为两类,分别为传统工业缺陷检测和基于深度学习 ...
【技术保护点】
【技术特征摘要】
1.一种基于视觉认知计算的工业缺陷检测方法,其特征在于,包括以下步骤:获取待检测的工业图片;基于所述待检测的工业图片,采用预先训练好的深度目标检测网络进行检测,获得检测结果;其中,所述深度目标检测网络包括:特征提取模块,用于输入工业图片进行特征提取,输出特征图;其中,所述特征提取模块采用视觉注意力机制作为基本的视觉认知计算模块;多尺度特征融合模块,用于输入所述特征提取模块输出的特征图进行特征融合,输出特征融合后的特征图;其中,所述多尺度特征融合模块采用并行双分支结构同时建模特征一致性和差异性;检测模块,用于输入所述多尺度特征融合模块输出的特征融合后的特征图,输出检测结果;其中,所述检测结果包括锚框位置和缺陷种类分类结果。2.根据权利要求1所述的一种基于视觉认知计算的工业缺陷检测方法,其特征在于,所述特征提取模块包括4个特征下采样阶段;每个阶段将图片进行2倍下采样,通过卷积操作进行特征提取,输出一层特征图;每个阶段包含多个基本认知计算模块,每个基本认知计算模块内部均使用视觉注意力机制进行特征认知;其中,视觉注意力机制用于构建图像各部分之间的关联性,执行如下所示的注意力编码:Q(X)~U(
‑
r,r)K(X)=Conv1×1(X),V(X)=Conv1×1(X),式中,X为视觉注意力模块的输入特征图,Conv1×1(
·
)为滤波器尺寸为1
×
1的卷积运算,
·
为矩阵转置操作,softmax(
·
)为指数归一化函数,Q(X)、K(X)、V(X)分别表示注意力编码中和X对应的查询、键、值矩阵,d=h
×
w为嵌入维度,h和w分别为X的高度和宽度,U(
‑
r,r)为参数为r的均匀分布;视觉注意力机制按串行方式执行特征提取,首先经过两层卷积操作,然后执行注意力编码,最后将结果与输入特征求和。3.根据权利要求1所述的一种基于视觉认知计算的工业缺陷检测方法,其特征在于,所述多尺度特征融合模块采用特征金字塔网络结构,输出包括最高层输入特征图下采样结果、最高层输入特征图以及每层子融合结构输出结果;其中,在进行特征融合时,除去最高层特征后,相邻两层特征图通过包含两个并行分支的子融合结构进行融合,两个分支分别用于建模相邻层特征的一致性与差异性;每个子融合结构的输出特征图尺寸均与其低层输入特征图一致;最高层特征使用最大池化操作进行2倍下采样。4.根据权利要求1所述的一种基于视觉认知计算的工业缺陷检测方法,其特征在于,所述检测模块中,设置有RPN网络,用于获取锚框位置;所述检测模块中,设置有RCNN网络,用于基于锚框进行目标匹配、检测获取缺陷种类分
类结果。5.根据权利要求4所述的一种基于视觉认知计算的工业缺陷检测方法,其特征在于,所述预先训练好的深度目标检测网络的获取步骤包括:获取训练样本集;其中,所述训练样本集中的每个样本均包括样本图片和标签;基于获取的训练样本集对所述深度目标检测网络进行训练,参数更新至满足预设收敛条件后获得训练好的深度目标检测网络;其中,RPN网络的损失函数为,式中,CrossEntropy为交叉熵函数,smooth
‑
L1为平滑1范数损失函数,n1和n2分别为匹配锚框的数目,l
i
、分别为锚框i中目标所属类别的真值和预测值,c
j
、分别为锚框j对应物体位置坐标偏移量的真值和预测值;其中,RCNN网络的损失函数为,式中,FocalLoss为焦点损失函数,L1为1范数损失函数,n1'和n'2分别为经过过滤后的匹配锚框数量。6.一种基于视觉认知计算的工...
【专利技术属性】
技术研发人员:刘妹琴,侯修全,魏平,陈霸东,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。