用于消防通道占用目标检测的目标检测模型、方法及应用技术

技术编号:33565358 阅读:33 留言:0更新日期:2022-05-26 23:03
本申请提出了一种用于消防通道占用目标检测的目标检测模型、方法及应用,涉及目标检测领域,框架由三部分组成:主干网络,颈部多尺度特征融合网络和神经网络头部;主干网络包含五次降采样通过独立的切片操作、四个转置瓶颈残差模块和一个3*3卷积;颈部多尺度特征融合网络,使用1*1卷积进行特征融合和特征通道统一化,随后是一个跳跃层和交叉层提炼和融合的高层语义信息和低层空间特征的融合,最后是一个上下文感知的注意力网络;神经网络头部,分为分类预测网络和边框预测网络,可很好地检测到多尺度目标,可被应用到消防通道的占有目标检测中。检测中。检测中。

【技术实现步骤摘要】
用于消防通道占用目标检测的目标检测模型、方法及应用


[0001]本申请涉及目标检测领域,特别是涉及用于消防通道占用目标检测的目标检测模型、方法及应用。

技术介绍

[0002]近十年来以深度学习取得了巨大的进步和影响力,主要的驱动力是神经网络的复兴,尤其是卷积神经网络(ConvNets);在过去的十年里,计算机视觉识别领域成功地从设计特征提取器转移到设计神经网络架构,与此同时自然语言处理(NLP)的神经网络设计走了一条非常不同的道路,Transformer模型取代了RNN成为主导的主干架构。
[0003]传统卷积网络通常采用从上到下的单行结构;对于大物体而言,其语义信息将出现在较深的特征图中;而对于小物体,其语义信息出现在较浅的特征图中,随着网络的加深,其细节信息可能会完全消失。而特别是在目标检测的场景中,模型需要对不同尺度的物体都能检测出来,这要求模型对于尺度要具有鲁棒性。在多尺度的物体中,大尺度的物体由于面积大、特征丰富,通常来讲较为容易检测;难度较大的主要是小尺度的物体,而这部分小物体在实际工程中却占据了较大的比例。通常认为绝对尺寸本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种目标检测模型的构建方法,其特征在于,包括:依次连接的主干网络、颈部多尺度特征融合网络以及神经网络头部,其中主干网络包括切片操作、转置瓶颈残差模块和3*3卷积,输入图像在切片操作后经过3*3卷积输入到转置瓶颈残差模块中,经上一级转置瓶颈残差模块输出的图像特征在切片操作后输入到下一级转置瓶颈残差模块,不同级转置瓶颈残差模块分别输出不同尺度的尺度特征;其中颈部多尺度特征融合网络包括数量同于转置瓶颈残差模块的1*1卷积、跳跃交叉融合模块以及上下文感知的注意力网络,不同尺度的尺度特征分别输入对应的1*1卷积中进行特征融合和特征通道统一化得到不同尺度的初始特征,不同尺度的所述初始特征经跳跃交叉融合模块进行高层语义信息和低层空间特征的融合得到不同尺度的跳跃交叉融合特征,不同尺度的跳跃交叉融合特征传入上下文感知的注意力网络得到预测特征;其中神经网络头部分为分类预测网络和边框预测网络。2.根据权利要求1所述的目标检测模型的构建方法,其特征在于,每一切片操作的输出对应一转置瓶颈残差模块,其中位于首位的切片操作的输出经历3*3卷积后输入到对应的转置瓶颈残差模块,其他切片操作的输出直接输入到对应的转置瓶颈残差模块中。3.根据权利要求1所述的目标检测模型的构建方法,其特征在于,所述转置瓶颈残差模块包括至少一组的转置瓶颈残差子模块,不同层级的转置瓶颈残差模块包括不同数量组的转置瓶颈残差子模块。4.根据权利要求3所述的目标检测模型的构建方法,其特征在于,主干网络包括依层级排序的第一级转置瓶颈残差模块、第二级转置瓶颈残差模块、第三级转置瓶颈残差模块和第四级转置瓶颈残差模块,第一级转置瓶颈残差模块内包括三组串联的转置瓶颈残差子模块,第二级转置瓶颈残差模块包括三组串联的转置瓶颈残差子模块,第三级转置瓶颈残差模块包括九组串联的转置瓶颈残差子模块,第四级转置瓶颈残差模块包括三组串联的转置瓶颈残差子模块。5.根据权利要求3所述的目标检测模型的构建方法,其特征在于,每组转置瓶颈残差子模块内包括依次连接的7*7深度可分离卷积,第一1*1卷积、第二1*1卷积以及Drop_path,每组转置瓶颈残差子模块的输入和输出进行元素级相加。6.根据权利要求5所述的目标检测模型的构建方法,其特征在于,7*7深度可分离卷积和第一1*1卷积之间归一处理,第一1*1卷积和第二1*1卷积之间设置使用一层激活层。7.根据权利要求1所述的目标检测模型的构建方法,其特征在于,跳跃交叉融合模块包括对应不同层级的初始特征的多层级特征融合层,同一层级的特征融合层包括依次连接的不同深度的深度层,同一层级的特征融合层的不同深度层之间跳跃连接;不同层级的特征融合层的奇数深度层采用下采样,偶数深度层采用上采样,不同层级的特征融合层之间的同一深度层采用跨尺度连接;最低尺度的特征融合层的深度层和相邻上一尺度的特征融合层的深度层采用下采样的交叉连接;最高尺度的特征融合层的深度层和相邻下一尺度的特征融合层的深度层采用上采样的交叉连接。8.根据权利要求7所述的目标检测模型的构建方法,其特征在于,采用双线性插值作为上采样函数,采用最大池化作为下采样函数,跳跃层连接和跨尺度层连接之间以特征拼接的方式进行堆叠。9.根据权利要求1所述的目标检测模型的构建方法,其特征在于,同一跳跃交叉融合特
征输入到上下文感知的注意力网络中被衍生出不同大小区域的候选区域,每一候选区域采用双线性插值的方式转换为统一大小的特征,不同特征彼此加权处理后得到系列的上下文向量...

【专利技术属性】
技术研发人员:沈瑶张香伟毛云青曹喆梁艺蕾
申请(专利权)人:城云科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1