可集成到神经网络架构中的图像多尺度信息提取方法及应用技术

技术编号：21454746 阅读：38 留言：0更新日期：2019-06-26 05:02

可集成到神经网络架构中的图像多尺度信息特征方法及应用。本发明专利技术从更细粒度的层面提升了神经网络的多尺度表达能力。本发明专利技术方法将进入提取器的特征图按照通道数量被分成几个特征图子集；然后将各特征图子集的送入依照层级递进的结构排布连接的卷积核组中，完成不同尺度信息的提取；再经过另一个融合卷积层进行信息融合，实现对不同尺度信息的融合。该方法可集成到现有的绝大多数神经网络结构中，大幅提升原有神经网络的性能。此外，基于该方法的神经网络能为包括但不限于图像分类、物体检测、注意力预测、目标跟踪、动作识别、语义分割、显著物体检测和骨架提取等视觉任务提供高质量的语义特征信息。

全部详细技术资料下载

【技术实现步骤摘要】
可集成到神经网络架构中的图像多尺度信息提取方法及应用
本专利技术属于计算机视觉
，特别涉及到利用神经网络提取视觉数据中多尺度信息的方法及应用。
技术介绍
视觉模式天然呈现多尺度特征。典型的多尺度问题包括多层含义：首先，物体可以在单个图像中以不同尺寸出现；其次，判断物体所需的信息可能比物体本身占用更大的区域；第三，感知来自不同尺度的信息对于理解细节以及诸如细粒度分类和语义分割等任务的对象是必不可少的。因此，感知视觉认知任务的多尺度信息至关重要。几乎所有的视觉检测任务都能受益于强大的多尺度特征表达能力。自深度神经网络诞生起，就因为相对传统方法更强的多尺度信息学习和处理能力而备受关注。许多神经网络架构通过强大的多尺度表达能力在各种视觉任务中取得优越的性能。现有神经网络是由多种滤波器通过特定规则组合而成。由于输入的信息遵循从粗略到精细的特性，因此神经网络具有基本的多尺度特征表示能力。2012年引起人工智能热潮的深度学习框架AlexNet网络线性堆叠卷积层，与传统的视觉识别方法相比实现了显着的性能提升。但是，由于其网络深度和卷积核大小有限，AlexNet只有一个相对较小的感受野。牛津大学的Karen等人提出的VGGNet增加了网络深度，并将有着不同大小的卷积核的滤波器并行组合的方法进一步提升了神经网络的多尺度信息处理能力。更深的结构可以扩展感受野，有助于在更大尺度下提取特征。通过堆叠更多层比使用大内核更容易扩展感受野。因此，VGGNet在减小参数量的同时提供了比AlexNet更强大的多尺度表达模型。然而，AlexNet和VGGNet都采用线性拓扑结构堆叠卷积层...

【技术保护点】
1.一种可集成到神经网络架构中的图像多尺度信息提取方法，其特征在于：a.将进入提取器的特征图按照通道数量被分成几个特征图子集；b.处理上步所划分的各特征图子集的卷积核依照层级递进的结构排布连接；某一个特征图子集经过一个卷积层得到新的特征图与另一个特征图子集结合后继续送入另一个卷积层；重复此过程直至所有特征图子集被处理完成；每一个卷积层的等效感受野逐渐增大，完成不同尺度信息的提取；c.处理完的特征图子集采用拼接方法结合，再经过另一个融合卷集层进行信息融合，实现对所划分的几个特征图子集信息的融合。

【技术特征摘要】
1.一种可集成到神经网络架构中的图像多尺度信息提取方法，其特征在于：a.将进入提取器的特征图按照通道数量被分成几个特征图子集；b.处理上步所划分的各特征图子集的卷积核依照层级递进的结构排布连接；某一个特征图子集经过一个卷积层得到新的特征图与另一个特征图子集结合后继续送入另一个卷积层；重复此过程直至所有特征图子集被处理完成；每一个卷积层的等效感受野逐渐增大，完成不同尺度信息的提取；c.处理完的特征图子集采用拼接方法结合，再经过另一个融合卷集层进行信息融合，实现对所划分的几个特征图子集信息的融合。2.根据权利要求1所述的多尺度信息提取方法，其特征在于：输入的特征图按照通道数量根据需要划分子集，所述子集的划分为平均划...

【专利技术属性】
技术研发人员：程明明，高尚华，赵凯，
申请(专利权)人：南开大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人