一种基于卷积神经网络的注意力目标识别方法技术

技术编号：19904417 阅读：30 留言：0更新日期：2018-12-26 03:12

本发明专利技术的一种基于卷积神经网络的注意力目标识别方法，通过对卷积神经网络的不同层次的特征图进行特征增强以及特征注意力两大处理，从而获得更加具有表征目标物体能力的特征图，然后将所得的特征图分别进行目标检测操作，这样既保留了浅层特征图中的小目标信息，也保留了深层特征中的大目标信息，使得特征图更加具有表征目标物体的能力，作为一种单阶段目标检测器，在保证目标检测效率的同时，大大提升了目标检测的精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积神经网络的注意力目标识别方法
本专利技术涉及一种注意力目标识别方法。特别是涉及一种基于卷积神经网络的注意力目标识别方法。
技术介绍
目标检测是计算机视觉领域中一项具有极大挑战性的任务，近几年，卷积神经网络被应用在目标检测任务上取得了显著的效果，从而引起科研人员对于卷积神经网络的模型的研究兴趣，模型的层数也不断被加深。但是，当模型的层数达到一定数目时，会造成网络在反向传播学习过程中梯度消失的问题，导致网络将不能有效地进行特征学习。深度残差网络被提出后，很好地解决了梯度消失的问题，使得神经网络模型可以向更深层次发展，常见的深度残差网络有Resent50，Resnet101，Resnet152等，在提升目标任务方面也有更好地表现。注意力模型近几年也被广泛应用到包括目标检测在内的不同类型的深度学习任务当中，是一个对神经网络结构的较重要地改进机制。该模型借鉴了人类视觉的注意力机制，视觉注意力机制是人类视觉所特有的大脑信号处理机制。当人类在看一幅图片时，首先获得需要重点关注的目标区域，也就是一般所说的注意力焦点，而后对这一区域投入更多注意力资源，以获取更多所需要关注目标的细节信息，而抑制其他无用信息。人类的视觉注意力机制极大地提高了视觉信息处理地效率与准确性。将注意力模型机制有效地引入到神经网络中，将会提高网络对于图片中目标物体特征学习地准确性与效率，从而会进一步提高对物体检测的性能。
技术实现思路
本专利技术所要解决的技术问题是，提供一种对既含有大目标物体又含有小目标物体的图片有较好检测性能的基于卷积神经网络的注意力目标识别方法。本专利技术所采用的技术方案是...

【技术保护点】
1.一种基于卷积神经网络的注意力目标识别方法，其特征在于，包括如下步骤：1)通过卷积神经网络获取图像的特征，分别得到C3特征图、C4特征图和C5特征图；2)对所得的C3特征图、C4特征图和C5特征图分别采用1*1的卷积核，进行步长为1，卷积核通道数目为256的卷积操作，卷积操作后分别对应得到P3特征图、P4特征图和P5特征图；3)对步骤2)得的P3特征图、P4特征图和P5特征图分别进行特征增强处理；4)对P5特征图采用3*3的卷积核，进行步长为2，卷积核通道数目为256的卷积操作，得到P6特征图，对P6特征图与本身的元素对应相乘，得到特征增强后的P6*特征图；5)对P6特征图采用设定的激活函数对所得特征进行激活操作，然后采用3*3的卷积核，进行步长为2，卷积核通道数目为256的卷积操作，得到P7特征图，将P7特征图与本身对应元素相乘，得到特征增强后的P7*特征图；6)将P5′特征图经过两层卷积层，卷积核是1*1，步长为1，卷积核的通道数目为256，进行卷积操作后，再采用Sigmoid激活函数进行激活操作，得到的结果与P4特征图对应元素进行相乘，即实现了对特征的注意力操作，得到P8特征图...

【技术特征摘要】
1.一种基于卷积神经网络的注意力目标识别方法，其特征在于，包括如下步骤：1)通过卷积神经网络获取图像的特征，分别得到C3特征图、C4特征图和C5特征图；2)对所得的C3特征图、C4特征图和C5特征图分别采用1*1的卷积核，进行步长为1，卷积核通道数目为256的卷积操作，卷积操作后分别对应得到P3特征图、P4特征图和P5特征图；3)对步骤2)得的P3特征图、P4特征图和P5特征图分别进行特征增强处理；4)对P5特征图采用3*3的卷积核，进行步长为2，卷积核通道数目为256的卷积操作，得到P6特征图，对P6特征图与本身的元素对应相乘，得到特征增强后的P6*特征图；5)对P6特征图采用设定的激活函数对所得特征进行激活操作，然后采用3*3的卷积核，进行步长为2，卷积核通道数目为256的卷积操作，得到P7特征图，将P7特征图与本身对应元素相乘，得到特征增强后的P7*特征图；6)将P5′特征图经过两层卷积层，卷积核是1*1，步长为1，卷积核的通道数目为256，进行卷积操作后，再采用Sigmoid激活函数进行激活操作，得到的结果与P4特征图对应元素进行相乘，即实现了对特征的注意力操作，得到P8特征图；7)将P4′特征图经过两层卷积层，卷积核是1*1，步长为1，卷积核的通道数目为256，进行卷积操作后，再采用Sigmoid激活函数进行激活操作，得到的结果与P3特征图对应元素进行相乘，即实现了对特征的注意力操作，得到P9特征图；8)对所得的P3*特征图、P4*特征图、P5*特征图、P8特征图和P9特征图分别采用3*3的卷积核，进行步长为1，卷积核通道数目为256的卷积操作，卷积操作后分别对应得到F3特征图、F4特征图、F5特征图、F8特征图、F9特征图；9)对所得的F3特征图、F4特征图、F5特征图、P6*特征图、P7*特征图、F8特征图和F9特征图，分别进行候...

【专利技术属性】
技术研发人员：冀中，孔乾坤，李晟嘉，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人