具有分辨率适应性的深度卷积神经网络构建方法及应用技术

技术编号：22330815 阅读：60 留言：0更新日期：2019-10-19 12:24

本发明专利技术提供一种具有分辨率适应性的深度卷积神经网络构建方法，用于构建能够适配各种分辨率的目标图像的尺度特征的深度卷积神经网络模型，其特征在于，包括如下步骤：步骤S1，根据目标图像设定多个目标尺度形成尺度等级，并根据尺度等级设定目标检索步长；步骤S2，获取训练图像，并根据训练图像的尺寸的阶，将训练图像进行标准化处理从而得到标准化训练图像；步骤S3，设计用于适应多分辨输入和多尺度目标检测的深度卷积神经网络模型，并通过标准化训练图像对深度卷积神经网络模型进行训练从而得到可执行的深度卷积神经网络模型，其中，步骤S3中的深度卷积神经网络模型包括：特征图提取部分、逐级降采样部分、分支卷积运算部分以及预测输出部分。

全部详细技术资料下载

【技术实现步骤摘要】
具有分辨率适应性的深度卷积神经网络构建方法及应用
本专利技术属于数字图像处理及深度学习领域，涉及一种深度卷积神经网络的算法模型设计，具体涉及一种具有分辨率适应性的深度卷积神经网络。
技术介绍
数字图像分析技术在当今社会发挥着重要作用，其中图像目标检测技术是一个重要的组成部分。目前目标检测技术的发展已经逐渐抛弃传统数字图像处理的手工设计算法的方案，转而使用深度学习，以卷积神经网络(ConvolutionalNeuralNetwork,CNN)为代表，以达到高准确率的目标检测结果。深度学习革命爆发在2011～2012年，深度学习革命使得计算机视觉在很多应用领域达到了实用水平，催生了工业界的大量应用。其最重要的原因是深度学习可以做到传统方法无法企及的精度，尤其是基于卷积神经网络CNN的深度学习模型，现在已经成为计算机视觉的主流方法。卷积神经网络是一种常见的深度学习网络架构，受生物自然视觉认知机制启发而来。CNN能够得出原始图像的有效表征，这使得CNN能够直接从原始像素中，经过极少的预处理，捕获到视觉上面的规律。目标检测是当前最热的话题之一，它需要对很多对象进行分类和定位。基于深度学习的目标检测，主要有两类模型：对于单张图像中的目标检测，使用基于regionproposal的检测方法，以fasterrcnn为代表的two-stage方案，能够达到很高的准确率；考虑到two-stage方案的效率不够高，针对实时场景的YOLO、SSD等one-stage算法应运而生，在保持相对不错的准确率的情况下，可以快速对图像进行目标检测。然而，对于现有的CNN模型，普遍使用统一的...

【技术保护点】
1.一种具有分辨率适应性的深度卷积神经网络构建方法，用于构建能够适配各种分辨率的目标图像的尺度特征的深度卷积神经网络模型，其特征在于，包括如下步骤：步骤S1，根据所述目标图像设定多个目标尺度形成尺度等级，并根据所述尺度等级设定目标检索步长；步骤S2，获取训练图像，并根据所述训练图像的尺寸的阶，将所述训练图像进行标准化处理从而得到标准化训练图像；步骤S3，设计用于适应多分辨输入和多尺度目标检测的深度卷积神经网络模型，并通过所述标准化训练图像对所述深度卷积神经网络模型进行训练从而得到可执行的深度卷积神经网络模型，其中，所述步骤S3中的所述深度卷积神经网络模型包括：特征图提取部分，用于对输入所述深度卷积神经网络模型的输入图像执行非降采样的卷积神经网络操作，从而得到分辨率不变的特征图；逐级降采样部分，用于将所述特征图进行逐级降采样并运算出对应所述输入图像的初步预测数据，该初步预测数据包括预置信度、目标分类及目标定位；分支卷积运算部分，用于将所述特征图根据所述尺度等级，做相应的分支卷积运算从而得到对应所述输入图像的注意力预测数据，所述分支卷积运算的卷积核大小及步长与所述尺度等级相适应；预测输出部...

【技术特征摘要】
1.一种具有分辨率适应性的深度卷积神经网络构建方法，用于构建能够适配各种分辨率的目标图像的尺度特征的深度卷积神经网络模型，其特征在于，包括如下步骤：步骤S1，根据所述目标图像设定多个目标尺度形成尺度等级，并根据所述尺度等级设定目标检索步长；步骤S2，获取训练图像，并根据所述训练图像的尺寸的阶，将所述训练图像进行标准化处理从而得到标准化训练图像；步骤S3，设计用于适应多分辨输入和多尺度目标检测的深度卷积神经网络模型，并通过所述标准化训练图像对所述深度卷积神经网络模型进行训练从而得到可执行的深度卷积神经网络模型，其中，所述步骤S3中的所述深度卷积神经网络模型包括：特征图提取部分，用于对输入所述深度卷积神经网络模型的输入图像执行非降采样的卷积神经网络操作，从而得到分辨率不变的特征图；逐级降采样部分，用于将所述特征图进行逐级降采样并运算出对应所述输入图像的初步预测数据，该初步预测数据包括预置信度、目标分类及目标定位；分支卷积运算部分，用于将所述特征图根据所述尺度等级，做相应的分支卷积运算从而得到对应所述输入图像的注意力预测数据，所述分支卷积运算的卷积核大小及步长与所述尺度等级相适应；预测输出部分，用于将所述注意力预测数据与所述预置信度相作用从而得到目标置信度预测数据，进一步将该目标置信度预测数据与所述目标分类、所述目标定位整合作为对应所述输入图像的预测结果并输出，所述特征图提取部分中，在根据所述输入图像提取所述特征图的阶段中使用池化算法时，会交替执行padding操作，从而提取到分辨率不变的所述特征图。2.根据权利要求1所述的具有分辨率适应性的深度卷积神经网络构建方法，其特征在于：其中，在所述步骤S1中，所述尺度等级的设定方法为：根据神经网络的性能估算出可检测的目标图像的最小分辨率并作为最小等级，进一步以所述最小等级为首，将分辨率的高与宽逐级扩大2倍，得到其他的所述尺度等级，直到最大等级的分辨率在下一次扩大时会超过所述目标图像的最大可能分辨率，各个所述尺度等级中，所述目标图像的基本形状为正方形时，所述目标尺度的高和宽必须为2的整数次幂；所述基本形状为其他形状时，所述目标尺度的形状面积与所述基本形状为正方形时的目标尺度的形状面积相同。3.根据权利要求1所述的具有分辨率适应性的深度卷积神经网络构建方法，其特征在于：其中，所述目标检索步长与所述目标尺度相关，在所述步骤S1中，所述目标检索步长的计算方法为：若所述目标图像为正方形，且该目标图像的边长为l，则所述目标检索步长step为：式中，l>N，N＝2n，n为整数，并且所述目标检索步长step的值也为整数。4.根据权利要求1所述的具有分辨率适应性的深度卷积神经网络构建方法，其特征在于：其...

【专利技术属性】
技术研发人员：刘天弼，冯瑞，徐未雨，张春雨，
申请(专利权)人：沈阳亚视深蓝智能科技有限公司，
类型：发明
国别省市：辽宁,21

全部详细技术资料下载我是这个专利的主人