【技术实现步骤摘要】
基于多尺度交叉注意力的接触网开口销缺陷目标检测方法
[0001]本专利技术涉及图像处理
,特别是涉及一种基于多尺度交叉注意力的接触网开口销缺陷目标检测方法。
技术介绍
[0002]目标检测与图像分类是计算机视觉中一项非常重要的任务,在人脸识别、无人驾视频监控等领域中有着广泛的应用。目标检测的目的是从图像或视频中计算出待检测的目标位置以及识别该目标的类别。
[0003]随着深度卷积神经网络的发展,深度学习的一些问题也显现了出来。例如在文本翻译和图片标注任务中,不同单词的输出都依赖于同一个编码的向量,导致计算某一时刻的输出时使用的信息包含了大量无关的内容;同样的情况出现在基于图像或视频的目标检测任务中,往往图像中背景所占的像素比例远大于目标比例,在对小目标时尤为明显,网络在计算时对目标和背景不加区分地进行特征提取,造成了极大的计算力浪费。小目标异常、弱异常等同样是深度学习图像目标检测中具有挑战性的任务。小目标由于占图像比例小、绝对像素点小、信噪比低等特点,小目标的特征会淹没在背景噪声之中,检测比较困难。经典的基于卷积神经网络的目标检测算法不能较好地检测小目标。
技术实现思路
[0004]本专利技术的目的在于提供一种基于多尺度交叉注意力的接触网开口销缺陷目标检测方法,充分利用卷积神经网络中各个特征图中的特征与注意力信息,设计了多尺度交叉注意力模块来克服目标检测中小目标检测的困难点,得到经过交叉注意力加强后的特征图,最后在该特征图上进行检测,得到最终的检测结果,具有良好的应用前景。
[0 ...
【技术保护点】
【技术特征摘要】
1.一种基于多尺度交叉注意力的接触网开口销缺陷检测方法,其特征在于,包括:步骤S1,从数据中选取图片作为网络的输入,并得到输入网络的图像的特征图;步骤S2,将特征图分别输入多尺度交叉通道注意力特征增强模块中,获取每层特征图的通道注意力,对特征的通道相关性进行建模,得到经过通道注意力增强后的特征图;步骤S3,将经过多尺度交叉通道注意力增强后的特征图分别输入多尺度交叉空间注意力特征增强模块中,获取每层特征图的空间注意力,对特征的空间结构进行建模,得到经过空间注意力增强后的特征图;步骤S4,针对步骤S3所得到的特征图进行特征目标检测,得到特征目标的中心点坐标、特征目标的长与宽以及特征目标是否属于缺陷类别标识。2.根据权利要求1所述的基于多尺度交叉注意力的接触网开口销缺陷检测方法,其特征在于,步骤S1具体包括如下:步骤s1.1,从数据中选取图片进行预处理,将预处理后的图片作为网络的输入图像;步骤s1.2,将网络输入的图片进行多次卷积进行特征提取,选取高中低三层尺度不一的特征图进行注意力生成,设它们从大尺度到小尺度分别为F1、F2和F3。3.根据权利要求2所述的基于多尺度交叉注意力的接触网开口销缺陷检测方法,其特征在于,步骤S2具体包括如下:步骤s2.1,将特征图F1、F2和F3一同输入多尺度交叉通道注意力模块中,利用模块生成每张特征图对应的通道注意力,分别记为k1、k2和k3;步骤s2.2,在多尺度交叉通道注意力模块生成通道注意力后,将高层特征所生成的通道注意力k
n
与较低一层特征图F
n
‑1相互点乘,得到特征加强后的特征图F
′
n
‑1,重复此步骤多次,直到得到所有输入特征图对应加强后的特征图F
′1、F
′2和F
′3。4.根据权利要求3所述的基于多尺度交叉注意力的接触网开口销缺陷检测方法,其特征在于,步骤s2.1中的通道注意力生成公式具体为:注意力生成公式具体为:其中,MLP表示多层多层感知机,它的层与层之间是全连接的,第一层神经元个数为C/r,C为特征图通道数,r为减少率,激活函数为Relu,第二层神经元个数为C;AvqPool表示平均池化层,此层选取规定大小区域内的平均值作为输出,MaxPool表示最大池化层,此层选取规定大小区域内的最大值和作为输出;表示经过平均池化之后的特征图,表示经过最大池化后的特征图。5.根据权利要求4所述的基于多尺度交叉注意力的接触网开口销缺陷检测方法,其特征在于,步骤s2.2中的通道注意力与特征图点乘过程具体公式为:F
′
n
‑1=(k
1 ... k
n
...
【专利技术属性】
技术研发人员:吴泽彬,陈子全,徐伟,刘建新,陈圣堂,徐洋,丁道华,黄永祯,夏雷,
申请(专利权)人:中国铁路上海局集团有限公司南京供电段,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。