当前位置: 首页 > 专利查询>南通大学专利>正文

一种面向嵌入式实时视觉目标检测的轻型网络构建方法技术

技术编号:28943379 阅读:27 留言:0更新日期:2021-06-18 21:52
本发明专利技术公开了一种面向嵌入式实时视觉目标检测的轻型网络构建方法,包括如下步骤:步骤1)构建基于通道注意力机制多尺度特征融合的三分支输出骨干网络模块Backbone‑Tiny;步骤2)构建轻型金字塔特征融合网络模块PAN‑Tiny;步骤3)构建轻型检测头网络模块Head‑Tiny;步骤4)按照骨干网络模块Backbone‑Tiny、金字塔特征融合网络模块PAN‑Tiny、检测头网络模块Head‑Tiny的顺序,将步骤1)、步骤2)、步骤3)所描述的三个局部子网络模块依次串联成为目标检测网络整体。本发明专利技术的方法能够大幅度提升骨干网络模块特征提取有效性的同时,显著降低特征金字塔融合网络模块的计算量。

【技术实现步骤摘要】
一种面向嵌入式实时视觉目标检测的轻型网络构建方法
本专利技术涉及图像目标检测与识别技术,计算机视觉技术,尤其涉及一种面向嵌入式移动终端设备环境下的实时图像目标定位与识别(检测)深度学习模型的结构轻量化设计方法。
技术介绍
所谓嵌入式移动终端设备环境下的实时图像目标物体检测模型,是指脱离上位PC机,在移动设备终端环境下,利用嵌入式技术开发能够处理超过每秒40帧以上的图像目标检测任务的卷积神经网络模型。该技术对工业、医学、国防、刑侦等领域的应用提供着重要的技术支持。目前,常见的方法是YOLO系列的目标检测模型。如YOLOv3、YOLOv4、YOLOv4-Tiny等。现有的方法常常受限于特征提取有效性与处理速度不平衡的问题。即,高精度引起处理速度的显著下降、高速度引起检测精度的面明显下降。
技术实现思路
专利技术目的:为了解决上述问题,本专利技术的主要目的在于提供一种面向嵌入式实时视觉目标检测的轻型网络构建方法,其先进性表现为:通过设计通道注意力机制调节的多尺度融合分支特征提取单元SE-SPP-Shuffulenet提高骨本文档来自技高网...

【技术保护点】
1.一种面向嵌入式实时视觉目标检测的轻型网络构建方法,其特征在于:包括如下步骤:/n步骤1)构建基于通道注意力机制多尺度特征融合的三分支输出骨干网络模块Backbone-Tiny;/n步骤2)构建轻型金字塔特征融合网络模块PAN-Tiny;/n步骤3)构建轻型检测头网络模块Head-Tiny;/n步骤4)按照骨干网络模块Backbone-Tiny、金字塔特征融合网络模块PAN-Tiny、检测头网络模块Head-Tiny的顺序,将步骤1)、步骤2)、步骤3)所描述的三个局部子网络模块依次串联成为目标检测网络整体。/n

【技术特征摘要】
1.一种面向嵌入式实时视觉目标检测的轻型网络构建方法,其特征在于:包括如下步骤:
步骤1)构建基于通道注意力机制多尺度特征融合的三分支输出骨干网络模块Backbone-Tiny;
步骤2)构建轻型金字塔特征融合网络模块PAN-Tiny;
步骤3)构建轻型检测头网络模块Head-Tiny;
步骤4)按照骨干网络模块Backbone-Tiny、金字塔特征融合网络模块PAN-Tiny、检测头网络模块Head-Tiny的顺序,将步骤1)、步骤2)、步骤3)所描述的三个局部子网络模块依次串联成为目标检测网络整体。


2.根据权利要求1所述的面向嵌入式实时视觉目标检测的轻型网络构建方法,其特征在于:所述的步骤1)的具体内容为:
三分支输出骨干网络Backbone-Tiny共输出大、中、小三个尺度的图像特征,其网络结构依次由1个卷积层、1个最大池化层、和3个不同尺度的分支特征提取单元SE-SPP-Shufflenet串联组成,每个尺度的SE-SPP-Shufflenet单元均由SE-Shufflenet网络和SPP多尺度池化网络两个部分串联组成,即,SE-Shufflenet的输出作为SPP的输入,而SPP的输出作为SE-Shufflenet网络的最后输出,且大尺度SE-Shufflenet网络的输出,作为中尺度SE-Shufflenet网络的输入;中尺度SE-Shufflenet网络的输出,作为小尺度SE-Shufflenet网络的输入;从而构成3种不同尺度的分支特征提取单元SE-SPP-Shufflenet之间的串联结构,而三个尺度的SE-SPP-Shufflenet网络输出特征图,即为三分支输出骨干网络Backbone-Tiny的三个不同尺度的特征输出;
SE-Shufflenet特征提取网络由Shufflenet网络与通道注意力模型SE串联组成,即,Shufflenet网络的输出作为注意力模型SE网络的输入;而SE输出的特征即为SE-Shufflenet的特征提取网络的最终输出,其中,Shufflenet网络结构依次由1个通道分割层(channelsplit)、1个“并行特征提取网络”、1个特征拼接层(concate)和1个通道乱序层(channelshuffle)串联构成,其中,“并行特征提取网络”由上、下两个特征提取分支网络并联构成,其中,上分支网络共9层,依次由1个输入层、1个卷积层、1个BN层、1个Relu层、1个DW卷积层、1个BN层、1个DW卷积层、1个BN层和1个Relu层串联构成;下分支网络共6层,依次由1个输入层、1个DW卷积层、1个BN层、1个卷积层、1个BN层和1个Relu层串联构成,上、下分支网络的输出特征图经过1个特征拼接层(concate)连接后,再经过1个通道乱序层(channelshuffle)将输出特征图的通道顺序随机打乱,最后,通道乱序后的特征图作为Shufflenet网络的输出;
SE注意力模型由上、下两个分支结构并联构成,上分支直接输出原输入特征图,下分支网络共5层,依次由1个最大池化层、1个全连接层、1个Relu层、1个全连接层、1个Hard-Swich层串联构成;上、下分支的输出特征图由1个元素相乘操作层(multiply)进行融合;最后,将元素相乘后的特征图作为SE注意力模型的输出;
SPP多尺度池化网络结构由四个尺度的最大池化层并联后和1个特征拼接层(concate)串联组成,即,输入特征图分别经过1×1、5×5、9×9、13×13的四最大池化层的输出特征通过concate层拼接融...

【专利技术属性】
技术研发人员:王晗冯文宇朱远璠郑君泰傅怀梁
申请(专利权)人:南通大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1