当前位置: 首页 > 专利查询>福州大学专利>正文

一种通道与空间融合感知的深度学习目标检测方法技术

技术编号:23344897 阅读:58 留言:0更新日期:2020-02-15 04:23
本发明专利技术涉及一种通道与空间融合感知的深度学习目标检测方法,首先构建通道与空间融合感知模块,并将其嵌入深度神经网络架构中,然后利用改造后的深度神经网络架构对目标图片进行目标检测;其中所述通道与空间融合感知模块的构建具体为:首先对原始输入的特征图进行通道感知,接着进行空间感知的级联。本发明专利技术其既不加深网络深度或宽度,也不引入额外空间向量,同时保证了实时性和精度。

A method of deep learning target detection based on channel and space fusion perception

【技术实现步骤摘要】
一种通道与空间融合感知的深度学习目标检测方法
本专利技术涉及图像识别
,特别是一种通道与空间融合感知的深度学习目标检测方法。
技术介绍
目前,基于深度学习的目标检测框架主要分为两类:两阶段检测器和单阶段检测器;两阶段目标检测因其对图片的两阶段处理得名,也被称为基于区域的方法,它是将检测抽象为两个过程,一是基于图片使用随机性选择提出若干个可能包含物体的区域,即图片的局部裁剪,称为候选区域;二是生成区域的特征向量经过深度卷积神经网络编码后,用于预测候选区域的每一类别,从而得到每个区域内物体的类别。两阶段检测器算法都是基于高运算成本的神经网络,用速度来换取精度的提升,因而单阶段目标检测算法应运而生;单阶段的检测器没有中间的区域检出过程,而是直接从图片中获得预测结果;典型例子如YOLO,SSD等,这些直接回归的算法的网络架构相对更简单,但是比较两阶段的目标检测,如Mask-RCNN,它们的速度在提升8倍的同时,精度也降低了大概12%左右;在过去几年,检测器性能的提升主要依赖于增加网络的深度或宽度:VGG-16与AlexNet相比,通过堆叠本文档来自技高网...

【技术保护点】
1.一种通道与空间融合感知的深度学习目标检测方法,其特征在于,包括以下步骤:/n构建通道与空间融合感知模块,并将其嵌入深度神经网络架构中,利用改造后的深度神经网络架构对目标图片进行目标检测;/n所述通道与空间融合感知模块的构建具体为:首先对原始输入的特征图进行通道感知,接着进行空间感知的级联。/n

【技术特征摘要】
1.一种通道与空间融合感知的深度学习目标检测方法,其特征在于,包括以下步骤:
构建通道与空间融合感知模块,并将其嵌入深度神经网络架构中,利用改造后的深度神经网络架构对目标图片进行目标检测;
所述通道与空间融合感知模块的构建具体为:首先对原始输入的特征图进行通道感知,接着进行空间感知的级联。


2.根据权利要求1所述的一种通道与空间融合感知的深度学习目标检测方法,其特征在于,所述对原始输入的特征图进行通道感知具体包括以下步骤:
步骤S11:将输入的特征图FH×W×C基于通道切片,分为C个片区Z={z1,z2,...,zC},其中表示第i个片区;其中,H、W、C分别为特征图的高、宽、通道数;
步骤S12:对C个片区进行全局平均池化操作得到向量U1={u1,u2,...,uC},第k个元素uk的计算公式为:



式中,zk(i,j)为片区zk上坐标(i,j)对应的像素值;
步骤S13:将U1通过一个全连接层操作,再进行ReLu激活,得到其中W1指的是该层全卷积的权重系数,r指的是缩放因子,δ(·)指的是ReLu激活操作,得到的维度为
步骤S14:将通过一个全连接层操作,并使用sigmoid函数激活,得到其中W2指的是该层全卷积的权重系数,σ(·)指的是sigmoid激活操作,得到的维度为
步骤S15:将U2的值与输入原始特征图F的通道片划分向量Z对应相乘,得到经通道感知获得的特征图F1,其公式如下所示:
F1=U2·Z;
式中,·表示将Z中的第k个向量zk的所有值都乘上U2的第k个值U2k。


3.根据权利要求1所述的一种通道与空间融合感知的深度学习目标检测方法,其特征在于,所述进行空间感知的级联具体包括以下步骤:
步骤S21:将通道感知获得的特征图F1基于空间切片,分为H×W个片区,即Z'={z'1,z'2,z'3,...,z'H×M},其中所...

【专利技术属性】
技术研发人员:吴林煌杨绣郡范振嘉陈志峰
申请(专利权)人:福州大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1