【技术实现步骤摘要】
一种结合深度学习的图像显著目标检测方法
本专利技术涉及图像处理
,特别是基于深度学习计算机数学模型的图像检测方法。
技术介绍
在当今网络普及图像信息爆炸的时代,人类仅通过自身视觉感知系统处理外部图像信息变得越发困难,利用计算机进行图像信息处理成为一种有效的方法。研究人员模拟人类能够对图像中感兴趣区域进行迅速关注的视觉感知机制,提出了图像显著目标检测方法。由于能够提取图像场景关键信息,在有限资源下进行后续处理时大幅度减少计算量,在图像索引[1],图像场景理解[2],目标感知[3],图像视频压缩[4]等领域应用日益广泛。随着研究的进一步深入,逐渐成为计算机视觉,神经生物学,心理学等多学科交叉的综合研究课题[5]。1998年Itti等[6]第一次以数学计算模型阐述显著性特征后,新的算法模型便不断被提出,根据数据处理方式现主要分为自顶向下和自底向上两类模型[7]。自底向上模型从专注于视觉注视点的检测[8]逐步发展到主要对图像目标的检测[9,10],由于其基于数据驱动[11],面对复杂语义场景缺陷较为突出。研究人员发现底层颜色对比度等特征主要是在视觉关注的早期起作用, ...
【技术保护点】
1.一种结合深度学习的图像显著目标检测方法,其特征是,包括利用神经网络模型生成高层语义特征初始显著图和结合底层特征优化两个阶段;A.网络模型结构对于数据集合D={(Xn,Gn)},Xn为训练的输入图像,Gn为输入图像对应的真值图像,n=(1,2,……N);基于VGG16模型的循环全卷积算法模型(RFCN)特征传递过程为
【技术特征摘要】
1.一种结合深度学习的图像显著目标检测方法,其特征是,包括利用神经网络模型生成高层语义特征初始显著图和结合底层特征优化两个阶段;A.网络模型结构对于数据集合D={(Xn,Gn)},Xn为训练的输入图像,Gn为输入图像对应的真值图像,n=(1,2,……N);基于VGG16模型的循环全卷积算法模型(RFCN)特征传递过程为式(1)中,和代表输入图像处于第(c-1)(Stage(c-1))和(c)(Stage(c))阶段的特征;代表输出的Stage(c+1)特征,即将前一层特征和当前层特征联合作为下一层卷积计算层的输入;c=1时,前一层特征由底层显著先验特征替代;W为卷积核;b为偏置;*代表卷积运算过程;代表跨层级特征联合时所需的一系列运算过程,包括:逆卷积层、裁剪层和特征联合层等;为避免在联合不同Stage特征信息时造成的网络特征冗余,并在突出高层语义特征时获取一定底层信息,本文在式(1)基础上设定c=6,即在原VGG16模型第5阶段(Stage5)基础上进一步卷积生成第6阶段(Stage6)特征,然后将Stage5特征作为前景先验与Stage6特征进行跨层级的联合,进而计算生成Stage7特征信息,采用深卷积层和浅卷积层的中间层第4阶段(Stage4)的特征信息作为获取底层信息的补充,让整个网络模型在突出高层语义信息的同时共享一定的底层信息;联合Stage4,Stage6,stage7的特征信息作为最终的特征输出;计算过程如下式(2)(3)三个跨Stage特征传递过程,每个阶段都包含三个卷积层,两个线性修正单元层(ReLU);式(4)是输出的最终卷积特征图;设定上述卷积特征传递过程中涉及到的参数集合为θ,则神经卷积网络结构的输出特征图为对卷积特征图进行逆卷积和裁剪等运算获取全分辨率显著图像;式(5)中α为卷积特征图生成初步显著图所设定的参数集合,Hf(;α)为卷积特征图生成显著图的逆卷积和裁剪等运算过程,Sig()为Sigmod激活函数,fn为神经网络模型输出的全分辨率显著图;神经卷积网络模型训练的过程主要是提取特征并迭代求解收敛参数集合θ,迭代优化过程是否收敛,采用交叉熵损失函数(Cross-entropylossfunction)评价,定义如下式(6)中,[Xn]为图像像素个数,βi为真值图像中像素标签为0的数目占比,为像素i的真值标签,为原图像在网络模型参数集合为θ的情况下,输出图像像素i属于标签为1的概率,即为像素i属...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。