融入像素级attention机制的深度神经网络目标检测方法技术

技术编号：22239188 阅读：21 留言：0更新日期：2019-10-09 18:56

本发明专利技术涉及一种融入像素级attention机制的深度神经网络目标检测方法，包括下列步骤：收集训练样本图像；将收集到的图像数据集中的数据通过预处理转为训练深度卷积神经网络所要求的格式，并进行数据增强以提升神经网络的训练效果；设计融入像素级attention机制的深度卷积神经网络结构，该网络结构用于接收输入图像并对图像中的物体输出边界框回归信息和类别信息：网络结构包括两部分，一部分是用来初步提取特征的基础网络；另一部分为在基础网络末端添加的多个级联的卷积层或下采样层，用于提取不同尺度的卷积特征图，将多尺度特征图与像素级attention机制融合；训练。

全部详细技术资料下载

【技术实现步骤摘要】
融入像素级attention机制的深度神经网络目标检测方法
本专利技术涉及一种图像中目标检测方法，特别是涉及一种融入像素级attention机制的神经网络目标检测方法。
技术介绍
随着社会的发展和科技的进步，卷积神经网络在计算机视觉领域逐步克服了传统方法的缺陷，已被证明是解决各种视觉任务的有效模型，被应用于许多实际场景。卷积神经网络建立在卷积运算的基础上，通过融合局部感受野内的空间信息和通道信息来提取信息特征。卷积神经网络通过叠加一系列非线性卷积层和下采样层，能够捕获具有全局感受野的分层特征作为强大的图像描述。为了提高网络的表示能力，许多现有的工作已经显示出增强空间编码的好处。JieHu等人提出了“Squeeze-and-Excitation”模块，通过显式地建模通道之间的相互依赖关系，自适应地重新校准通道式的特征响应，提出了通道注意力机制。通过将这些块堆叠在一起，构建了SENet架构，在具有挑战性的图像分类数据集中以微小的计算成本提升取得了分类准确率的提升。目标检测是计算机视觉领域的重要研究方向之一，目标检测技术在智能医疗、无人驾驶和机器人等实际场景均有重要的应用价值。基于图像输入的目标检测任务要求针对图像中的物体给出边界框坐标信息和物体的类别信息，因此目标检测任务是一个对位置敏感的任务，SENet架构尽管对图像分类有一定的改善，但是“Squeeze-and-Excitation”模块首先对特征平面的每个通道进行全局池化，损失了特征平面的位置信息，直接将SENet架构迁移到目标检测任务中则不能对物体的边界框定位有任何的帮助。GRP-DSOD在目标检测网络...

【技术保护点】
1.一种融入像素级attention机制的深度神经网络目标检测方法，包括下列步骤：1)收集训练样本图像，要求图像为包含RGB三通道的彩色图像，并附有物体检测框标注和每个物体的类别标注信息。2)将收集到的图像数据集中的数据通过预处理转为训练深度卷积神经网络所要求的格式，并进行数据增强以提升神经网络的训练效果；3)图像集划分；将收集到的数据集划分为训练集，验证集和测试集三个部分，训练集用于训练深度卷积神经网络，验证集用于选择最优的训练模型，测试集用于后续测试模型的效果或在实际应用时测试使用；4)设计融入像素级attention机制的深度卷积神经网络结构，该网络结构用于接收输入图像并对图像中的物体输出边界框回归信息和类别信息：网络结构包括两部分，一部分是用来初步提取特征的基础网络，基础网络结构包含卷积层、批量正则化层、激活函数层、下采样层，设计每个层的特征图个数和输入输出的尺寸；另一部分为在基础网络末端添加的多个级联的卷积层或下采样层，用于提取不同尺度的卷积特征图，每个卷积层利用多个卷积核学习局部感受野上的信息，生成特征图，实现特征提取；每个卷积核只能根据上一层的感受野内的局部特征进行计算生...

【技术特征摘要】
1.一种融入像素级attention机制的深度神经网络目标检测方法，包括下列步骤：1)收集训练样本图像，要求图像为包含RGB三通道的彩色图像，并附有物体检测框标注和每个物体的类别标注信息。2)将收集到的图像数据集中的数据通过预处理转为训练深度卷积神经网络所要求的格式，并进行数据增强以提升神经网络的训练效果；3)图像集划分；将收集到的数据集划分为训练集，验证集和测试集三个部分，训练集用于训练深度卷积神经网络，验证集用于选择最优的训练模型，测试集用于后续测试模型的效果或在实际应用时测试使用；4)设计融入像素级attention机制的深度卷积神经网络结构，该网络结构用于接收输入图像并对图像中的物体输出边界框回归信息和类别信息：网络结构包括两部分，一部分是用来初步提取特征的基础网络，基础网络结构包含卷积层、批量正则化层、激活函数层、下采样层，设计每个层的特征图个数和输入输出的尺寸；另一部分为在基础网络末端添加的多个级联的卷积层或下采样层，用于提取不同尺度的卷积特征图，每个卷积层利用多个卷积核学习局部感受野上的信息，生成特征图，实现特征提取；每个卷积核只能根据上一层的感受野内的局部特征进行计算生成该层新的特征，将多尺度特征图与像素级attention机制融合，即在用于检测的每一个尺度的特征图上均置入像素级attention机制模块，学习多尺度特征图中不同位置的特征的关系，自适应的调整每个特征点的权重，然后对原特征图与对应的权重相乘后再输入检测模块，其中，像素级attention机制的具体步骤如下：a)给定一组卷积特征图F∈RH×W×C，长和宽为H和W，通道数为C，首先应...

【专利技术属性】
技术研发人员：宋雅麟，庞彦伟，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人