【技术实现步骤摘要】
基于改进UPerNet与连通域分析的轨面缺陷检测方法
[0001]本专利技术涉及钢轨表面缺陷检测
,具体涉及基于改进UPerNet与连通域分析的轨面缺陷检测方法。
技术介绍
[0002]轮轨系统中,钢轨承受车辆的垂直荷载并起导向功能,轨头会受到纵向力和横向力的作用,整个轨道系统还会产生振动,这些力的作用会引起钢轨表面缺陷。钢轨表面缺陷会加剧钢轨的垂直振动并传送到机车上,增加了各弹性部件与车辆产生共振的风险,同时它增加了钢轨的扭矩削弱了车轮的导向作用,危及车辆的横向稳定性,因此需要及时对轨面缺陷进行检测。
[0003]由于线长,自然环境复杂且发车密度大,人工巡检已难以满足需求,随着机器视觉和深度学习的发展,非接触的图像式缺陷检测方法成为研究热点。传统视觉检测法利用纹理和低级别灰度等特征对无标记钢轨样本中的目标区域进行识别和定位。
[0004]目前,轨面缺陷的图像式检测法仍存在以下问题:1)钢轨图像中可供识别的信息有限,导致基于纹理和灰度特征的方法效率低下;2)由于工务部门维护及时,钢轨缺陷图像难以有效大量 ...
【技术保护点】
【技术特征摘要】
1.基于改进UPerNet与连通域分析的轨面缺陷检测方法,其特征在于,包括如下步骤:步骤一、特征提取网络;使用Swin
‑
T为骨干网络,提取更丰富的全局信息和更具辨别力的特征,通过将注意力的计算限制在非重叠的局部窗口中使计算复杂度与图像尺寸成线性,进而减少计算量;步骤二、跨卡同步批量归一化训练;跨卡同步批量归一化(SyncBN)在前向传播时求得全局的均值μ和方差σ2,在后向传播时计算全局梯度;步骤三、损失函数;Jaccard指数即IoU,使用其评估预测结果时考虑了背景和目标像素间的不平衡,相应的损失函数如式(1)所示,其中为模型的预测向量,
y*
为标签向量,c表示类别;步骤四、缺陷参数计算;对轨面缺陷进行语义分割的基础上计算其实际长度、宽度和面积,有助于铁路工务人员直观了解到缺陷的具体大小,进而做出相应的焊补;步骤五、对步骤四中得到轨面缺陷语义分割图进行连通域分析,主要利用OpenCV
‑
Python中的连通域处理函数cv2.connectedComponentsWithStats()进行连通域标记,该函数可以求得连通域的数量、每个连通域的面积及其外接矩形的长宽。2.根据权利要求1所述的基于改进UPerNet与连通域分析的轨面缺陷检测方法,其特征在于:在步骤一中,整个网络采取层次化设计,首先,通过图块拆分模块将输入的H
×
W
×
3图像拆分为(H/4)
×
(W/4)个互不重叠的图块,每个图块被展平为48维的token向量,线性嵌入层将维度为(H/4)
×
(W/4)
×
48的张量映射到任意维度C,得到维度为(H/4)
×
(W/4)
×
C的线性映射,随后映射过的tokens被送入成对的SwinTransformer模块,其保持输入输出的tokens数为(H/4)
×
(W/4)不变,首个SwinTransformer模块与线性嵌入层被共同指定为第一层;之后,将图块合并层与Swin Transformer模块组合成后续的层来生成不同尺度的特征描述,图块合并层负责下采样操作,降低图块分辨率,逐层扩大感受野,Swin Transformer模块用于特征提取;随着网络的加深,每一层都会改变张量的维度,从而形成一种层次化的表征。3.根据权利要求2所述的基于改进UPerNet与连通域分析的轨面缺陷检测方法,其特征在于:所述Swin Transformer模块由层归一化(Layer Norm,LN)、多头自注意力模块、短路连接(shortcut connection)和含有GELU(Gaussian Error Linear Unit)激活函数的多层感知机(Multilayer Perceptron,MLP)组成。4.根据权利要求3所述的基于改进UPerNet与连通域分析的轨面缺陷检测方法,其特征在于:所述层归一化是单个训练数据对某一层所有神经元之间的归一化;所述多头自注意力模块的设计中将自注意力机制嵌入到了窗口中,包含两种,分别为规则窗口自注意力和滑动窗口自注意力;所述规则窗口自注意力(W
‑
MSA)将图片分为多个窗口,在每个窗口内分别计算自注意力,设图片被分为h
×
w个图块,每个窗口有M
×
M个图块,W
‑
MSA的计算复杂度如式(2)所示,Ω(W
‑
MSA)=4hwC2+2M2hwC
ꢀꢀꢀꢀ
(2)
W
‑
MSA降低了计算复杂度;由于每个窗口所包含的图块数远小于图片中的图块数,所以W
‑
MSA的计算复杂度和图片尺寸成线性关系;所述滑动窗口自注意力(SW
‑
MSA)引入滑动窗口的方法实现跨窗口连接,增加了不同窗口间的信息传递,扩大了感受野,提高了模型的表征能力,两个串联的Swin Transformer中蕴含的计算关系如公式(3)所示,其中和z
l
分别表示两种窗口自注意力所输出的特征和多层感知机输出的特征;所述短路连接通过将神经网络中前层的输入直接连...
【专利技术属性】
技术研发人员:闵永智,李亚兴,李嘉峰,王果,汪子为,刘洋,井庆龙,刘峰,田文杰,
申请(专利权)人:兰州交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。