【技术实现步骤摘要】
一种基于自适应锚框的铝材质图像缺陷检测方法
本专利技术属于计算机视觉和缺陷检测领域,主要采用深度学习的思想,具体涉及一种基于自适应锚框的铝材质图像缺陷检测方法。
技术介绍
铝型材是所有工业化国家的支柱产业,具有强度高,重量轻,耐磨,装饰性好,环保和经济等特点,越来越多的建筑师开始使用铝型材作为建筑材料。因此,质量已成为铝型材的关键评估标准。然而在实际生产中,由于生产流程的影响,铝材质表面可能产生不导电,刮擦,粗粒,外露板,起泡,凹坑,突起的颗粒,板角暴露,油漆痕迹和杂色等缺陷。由于恶劣的环境和高成本,非接触式检测是确保产品质量的重要步骤。缺陷检测的困难如下:1)边界不明显,缺陷与背景的边界模糊;2)人工标注时可能不统一;3)传统方法只能统计特定类别的特征;4)缺陷的尺寸和形状不规则,很难准确预测位置。在实际工业生产中,这些缺陷可能会出现在任何地方,使用计算机自动识别并定位这些缺陷是不可缺少的步骤。最初的缺陷检测方法为人工肉眼检测,但是这不足以满足快速生产的需要。后来业界开始采用传统的机器学习方法,比如纹理统计算法,Halcon软件等,但由于铝型材的表面可能包含很难与缺陷区分的图案,使得这些方法也有很大的局限性,缺乏泛化导致效率和准确性降低。最近,铝型材制造商正在尝试应用最新的人工智能(AI)技术来彻底改变现有的质检流程。AI技术使用卷积神经网络(CNN),从图像中提取缺陷特征并抽象为非线性模型。这种方法只需要少量的人工参与,且可以在整个流程中充分掌握产品表面质量的状态。经过调研,我们发现现有的 ...
【技术保护点】
1.基于自适应锚框的铝材质图像缺陷检测方法,其特征在于,包括以下步骤:/n步骤一,采用图片下采样技术,将所有图片下采样至统一尺寸,使输入维度具有一致性;/n步骤二,将步骤一中得到的图片输入到一个使用分组卷积和可形变卷积思想的残差神经网络中,从而得到输入图片的特征图;/n步骤三,把步骤二输出的特征图输入到使用通道注意力和空间注意力机制的特征增强模块中,进行缺陷特征的表达增强;/n步骤四,将步骤三中生成的增强后的特征图,输入到特征金字塔网络中进行多尺度特征融合,进一步完成特征增强;/n步骤五,将步骤四得到的增强后的特征输入到加入了自适应锚框的RPN网络中,进行锚框参数的学习,并生成相应的候选框;/n步骤六,将所有候选框输入到框预测模块中,采用soft-NMS选择得分较高的候选框,并做框的回归,使其更接近真实值,从而得到最终的预测缺陷区域及缺陷识别结果;/n并且包含一个训练过程,使用阿里天池比赛中提供的真实生产线上的缺陷数据集对提出的模型进行训练;/n训练过程采用反向传播机制,根据损失函数的大小不断更新模型参数,直到损失收敛到一个稳定的且较小的值,保存模型参数;/n步骤七,使用训练出的模型和 ...
【技术特征摘要】 【专利技术属性】
1.基于自适应锚框的铝材质图像缺陷检测方法,其特征在于,包括以下步骤:
步骤一,采用图片下采样技术,将所有图片下采样至统一尺寸,使输入维度具有一致性;
步骤二,将步骤一中得到的图片输入到一个使用分组卷积和可形变卷积思想的残差神经网络中,从而得到输入图片的特征图;
步骤三,把步骤二输出的特征图输入到使用通道注意力和空间注意力机制的特征增强模块中,进行缺陷特征的表达增强;
步骤四,将步骤三中生成的增强后的特征图,输入到特征金字塔网络中进行多尺度特征融合,进一步完成特征增强;
步骤五,将步骤四得到的增强后的特征输入到加入了自适应锚框的RPN网络中,进行锚框参数的学习,并生成相应的候选框;
步骤六,将所有候选框输入到框预测模块中,采用soft-NMS选择得分较高的候选框,并做框的回归,使其更接近真实值,从而得到最终的预测缺陷区域及缺陷识别结果;
并且包含一个训练过程,使用阿里天池比赛中提供的真实生产线上的缺陷数据集对提出的模型进行训练;
训练过程采用反向传播机制,根据损失函数的大小不断更新模型参数,直到损失收敛到一个稳定的且较小的值,保存模型参数;
步骤七,使用训练出的模型和参数构成基于自适应锚框和注意力机制的铝材质缺陷检测模型。
2.根据权利要求1所述的基于自适应锚框的铝材质图像缺陷检测方法,其特征在于,步骤一中,对输入图像I(W×H)进行s倍下采样操作,即将原始图像中每(s×s)窗口内的像素进行均值运算,得到(W/s)×(H/s)尺寸的图像,其中W为图像的长度,H为图像的高度。
3.根据权利要求1所述的基于自适应锚框的铝材质图像缺陷检测方法,其特征在于,步骤二中,骨干网络使用基于ResNeXt-101的神经网络,原始输入图像通过一个卷积核为7×7的卷积层和一个批归一化层后,分成64组进入Conv2-Conv5中。基于分组卷积思想的特征提取网络中,Conv1.0-Conv1.2经过3组conv+BN层后采用最大池化的方式进行下采样,conv1-conv3的构成为1×1卷积、3×3卷积组和1×1卷积,特征图经过1×1卷积后,会根据通道的维度分为不同的子特征图,其中第一个子特征图会直接输出,其余会通过3×3卷积后输出,从第三个特征图起,每个子特征图会和前一个进行相加操作再进行3×3的卷积操作,最后将所有的子特征图采用1×1卷积映射融合得到总输出,Conv2.0在conv2采用了可形变卷积,给每个采样点加一个offset,增强学习能力,最后加入了3×3的最大池化层进行下采样。
4.根据权利要求1所述的基于自适应锚框的铝材质图像缺陷检测方法,其特征在于,步骤三中采用具有可形变卷积的通道注意力和空间注意力结合的注意力机制,根据通道和空间的两个独立维度推导注意力映射,然后将其与输入特征相乘。可形变卷积在每个点上学习一个偏移,然后找到一个更合适的位置来提取特征。
5.根据权利要求4所述的基于自适应锚框的铝材质图像缺陷检测方法,其特征在于,具有可形变卷积的通道注意力和空间注意力结合的注意力机制,Ac是尺寸为C×1×1的一维通道注意力特征图,其注意力特征图谱Ac(M(l,w,x))计算如下:
其中,代表通道平均池化操作,代表通道最大池化操作,代表通道中值池化操作,w1和w0是多层感知器(MLP)学习到的权重,该权重可用于所有输入特征,RL代表ReLU激活函数,用于激活逐个元素求和后,合并得到的特征向量;
As是尺寸为1×W×H的二维空间注意力特征图,空间注意力是通道注意力的补充,空间注意力描述为:
其中,代表空间平均池化操作,代表空间最大池化操作,代表空间中值池化操作,基于通道注意力和输入特征,通过具有可形变卷积的平均池化最大池化和中值池化获得空间权重系数,RL代表ReLU激活函数,Γ7×7是具有可变形卷积的7×7卷积核,offset表示偏移量;
最后,两个注意力模块相乘,·表示将每一个元素进行相乘操作,M(l,w,x)表示可形变卷积运算后的特征图,可以定义为:
其中W(ln)和w代表学习到的权重,ln表示实数集R中的任意数字,l是线性插值的参数,x是输入的特征图谱,B(·,·)代表N维的双线性插值算法,其一维形式如下所示:
技术研发人员:田智强,董靓杰,王欢,许博,郑尧月,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。