一种基于注意力机制的显著物体检测方法技术

技术编号:19693834 阅读:37 留言:0更新日期:2018-12-08 11:41
一种基于注意力机制的显著物体检测方法。涉及计算机视觉与数字图像处理领域,具体涉及一种基于注意力机制的显著物体检测方法。提供了一种基于注意力机制的显著物体检测方法,首先设计自顶向下的注意力网络用于提纯各层卷积特征,然后引入二阶项设计残差特征融合网络以更好地保留残差特征;实现以任意的静态彩色图像为输入,其输出是与输入图像大小一致的显著性图,显著性图中白色表示显著物体区域,黑色表示背景区域。本发明专利技术可以得到高分辨率的显著性图,同时能够较好地检测小显著物体。

【技术实现步骤摘要】
一种基于注意力机制的显著物体检测方法
本专利技术涉及计算机视觉与数字图像处理领域,具体涉及一种基于注意力机制的显著物体检测方法。
技术介绍
显著物体检测是计算机视觉领域的一个热门研究课题,其目的是提取图像中吸引人注意的物体或区域,并为其赋予显著性值。作为一个预处理步骤,它可以应用于其他高层视觉任务,如弱监督语义分割、物体识别等。传统的显著物体检测方法都是基于人工设计的特征,如对比度、背景中心差异等,这些手工设计的低层视觉特征难以捕获语义信息,因而在复杂场景中效果不佳。近年来,得益于深度学习的飞速发展,显著物体检测的性能已经取得了大幅地提升。然而,现有的显著物体检测模型都是基于图像分类模型微调,由于两者任务的差异性,图像分类网络学习得到的特征无法精确定位物体边界,直接将其用于显著物体检测无法得到高分辨率的显著性图,特别是在物体边界处。另外,为了能够检测多尺度的显著物体,通常需要将不同尺度的卷积特征进行融合,然而现有的特征融合方法只是简单地相加或合并,容易弱化残差特征,从而影响小显著物体检测。
技术实现思路
为了克服以上弊端,本专利技术提供了一种基于注意力机制的显著物体检测方法,首先设计自顶本文档来自技高网...

【技术保护点】
1.一种基于注意力机制的显著物体检测方法,其特征在于,包括如下步骤:S1、以VGG‑16作为预训练模型,选取四个侧输出特征分别记为侧输出1~4;侧输出1~4后各增加一个卷积层,卷积层的参数为{1×1×256},卷积层后的输出分别记为F1~F4;S2、在F4后增加四个卷积层,前三个卷积层的参数为{9×9×256},每个卷积层后都附有一个非线性激活层,最后一个卷积层的参数为{1×1×1},得到侧输出4的显著性概率图S4;S3、在F1~F3后分别增加三个注意力模块,用于提纯卷积特征,每个注意力模块的输出作为下一个注意力模块的输入,最后一个注意力模块提纯后的卷积特征分别记为A1~A3;S4、在A1~A...

【技术特征摘要】
1.一种基于注意力机制的显著物体检测方法,其特征在于,包括如下步骤:S1、以VGG-16作为预训练模型,选取四个侧输出特征分别记为侧输出1~4;侧输出1~4后各增加一个卷积层,卷积层的参数为{1×1×256},卷积层后的输出分别记为F1~F4;S2、在F4后增加四个卷积层,前三个卷积层的参数为{9×9×256},每个卷积层后都附有一个非线性激活层,最后一个卷积层的参数为{1×1×1},得到侧输出4的显著性概率图S4;S3、在F1~F3后分别增加三个注意力模块,用于提纯卷积特征,每个注意力模块的输出作为下一个注意力模块的输入,最后一个注意力模块提纯后的卷积特征分别记为A1~A3;S4、在A1~A3后分别增加一个残差特征融合模块,用于融合不同侧输出的卷积特征,融合后的特征分别记为R1~R3;S5、在R1~R3后分别增加一个卷积层,卷积层的参数为{1×1×1},分别得到侧输出1~3的显著性概率图S1~S3;S6、模型训练:将待检测图像输入至构建后的网络模型,得到不同分辨率的显著性概率图S4~S1,将显著性概率图S4~S1上采样至原图像大小得到显著性概率图使用交叉熵损失函数计算各个显著性概率图和真实标注图之间的误差,并将误差进行反向传递以更新整个网络模型参数,具体为:其中,I(z)和G(z)分别表示输入图像和真值标注图在坐标z处的像素值,|I|表示图像总的像素数目,Pr(G(z)=1|I(z))表示预测为显著物体的概率;P...

【专利技术属性】
技术研发人员:周思远周平陈舒涵钱甦阳黄华杰胡学龙
申请(专利权)人:扬州万方电子技术有限责任公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1