【技术实现步骤摘要】
本专利技术涉及一种基于深度卷积神经网络的自然图像中视觉显著性检测的方法,应用于复杂背景下显著目标区域的检测。
技术介绍
人类的视觉可以很快地找到周围环境中的显著目标,忽略掉一些人类不感兴趣的信息,并关注视觉图像中重要的部分,这样可以避免大脑处理繁杂而用处不大的信息。视觉显著性检测就是为了模拟人的快速感知环境行为。随着各种数码设备的普及以及互联网的高速发展,各种图片、视频数据越来越多。与人的视觉类似,计算机可以通过图像或视频的显著性检测来提取图片中显著性信息,快速定位图像中需要处理的区域。通过视觉显著性检测,可以将计算资源优先分配给图像中的主要区域,减少计算开销,在计算机视觉领域意义重大。视觉显著性是很多视觉检测任务的重要步骤,在很多计算机视觉领域都起到了很大的作用,如目标检测与识别、自适应压缩、图像分割、图像检索、基于内容感知的图像编辑等。神经网络提出时与生物学系统紧密相连,模拟了生物神经元的结构和功能。在BP算法提出后,神经网络能解决许多基本的学习问题。在之后的几十年中,发展出了许多新的方法和技术,例如非监督的权重预训练技术、模型的设计和训练方法,也由此引出了深度学习技术。LeCun在1998年提出了LeNet-5,成功应用于手写体识别并被认为是手写体识别领域评判算法识别性能的标准。随后,卷积神经网络在许多模式识别任务上都取得了很好的效果。使用深度学习技术有助于显著性检测算法取得更鲁棒、更优秀的效果。< ...
【技术保护点】
一种基于多级卷积神经网络的全局‑局部优化模型,其特征在于:包括:全局估计模型(GEM)和局部优化模型(RfM);所述全局估计模型包括初始化分支通路和主通路,所述初始化分支通路由A部分和B部分级联组成,所述主通路由A部分和C部分级联组成;其中,A部分由卷积层和池化层组成;B部分由两个级联的全连接层(FC)组成;C部分由多个卷积层和升采样层级联组成;A部分的输入连接原始图像,A部分的输出分别与B部分和C部分的输入连接,C部分的输入为全局估计模型的输出;局部优化模型(RfM)主要由卷积层、池化层、升采样层组成,分为D、E两部分;其中,D部分的输入端与原始图像相连,D部分的输出端与全局估计模型的输出端一起输入到E部分的输入端,E部分的输出端即为全局‑局部优化模型的输出。
【技术特征摘要】
1.一种基于多级卷积神经网络的全局-局部优化模型,其特征在于:包括:全局估计模型
(GEM)和局部优化模型(RfM);
所述全局估计模型包括初始化分支通路和主通路,所述初始化分支通路由A部分和B部分
级联组成,所述主通路由A部分和C部分级联组成;其中,A部分由卷积层和池化层组成;B
部分由两个级联的全连接层(FC)组成;C部分由多个卷积层和升采样层级联组成;A部分的
输入连接原始图像,A部分的输出分别与B部分和C部分的输入连接,C部分的输入为全局估
计模型的输出;
局部优化模型(RfM)主要由卷积层、池化层、升采样层组成,分为D、E两部分;其中,
D部分的输入端与原始图像相连,D部分的输出端与全局估计模型的输出端一起输入到E部分
的输入端,E部分的输出端即为全局-局部优化模型的输出。
2.根据权利要求1所述的一种基于多级卷积神经网络的全局-局部优化模型,其特征在于:
A部分由七个卷积层和三个池化层组成,其连接关系为:
conv1-pool1-conv2-conv3-conv4-pool2-conv5-conv6-pool3-conv7,
其中,conv1为输入端,与原始图像连接,conv7为输出端。
3.根据权利要求2所述的一种基于多级卷积神...
【专利技术属性】
技术研发人员:王飞,汪子钦,姜沛林,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。