基于注意力感知特征的全景图像显著性预测方法及系统技术方案

技术编号：25272019 阅读：25 留言：0更新日期：2020-08-14 23:04

本发明专利技术提供了一种基于注意力感知特征的全景图像显著性预测方法及系统，包括：预测全景图像的前景注意力图和背景注意力图；计算预测的所述前景注意力图、所述背景注意力图中每一部分的逐像素的亮度值，得到可视化分数；提取全景图像的全局特征，将所述全局特征与预测的所述前景注意力图、所述背景注意力图使用逐元素乘的方式进行融合，得到融合后的所述前景注意力图、所述背景注意力图；将融合后的所述前景注意力图、所述背景注意力图与所述可视化分数加权融合，获得最终的预测结果。本发明专利技术在模拟人类视觉注意力机制方面具有较好的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于注意力感知特征的全景图像显著性预测方法及系统
本专利技术涉及图像显著性预测
，具体地，涉及一种基于注意力感知特征的全景图像显著性预测方法及系统，以及对应该方法的终端。
技术介绍
传统图像的显著性预测已是目前研究比较深入的课题，在过去几十年中研究人员们提出了多种显著性预测模型，这些显著性预测模型可以分为两类：基于传统手动特征提取的显著性预测模型和基于深度神经网络的显著性预测模型。其中，对于传统手动特征提取的显著性预测模型是受神经生物学机制启发，利用自下而上的计算模式提取各种低层次特征进行显著性预测，该类模型是由数据驱动的，一般显著性预测准确率较低。比较具有代表性的是Itti等人提出的视觉显著性模型，通过提取多尺度上的低层次特征并利用线性加权融合的方法得到最终的显著图。基于深度神经网络的显著性预测模型是采用目前主流的各种深度神经网络模型提取高层次语义特征进行显著性预测的，该类模型是受数据量的限制，需在大规模数据的条件下进行模型训练的。与第一类显著性预测模型相比，第二类模型往往得到的显著性预测准确率较高，更符合人类视觉注意力机制。然而，在使用基于深度神经网络的显著性预测模型对全景图像进行预测时，存在两个至关重要的问题：1)目前全景图像的数据集都是小规模的，不能支持基于深度神经网络的模型训练；2)在进行显著性预测时，由于全景图像包含有混杂的背景将会影响显著性预测的准确率。对于全景图像的数据集，目前最广泛使用的是Rai等人在2017年《Proceedingsofthe8thACMonMultimedi...

【技术保护点】
1.一种基于注意力感知特征融合的全景图像显著性预测方法，其特征在于，包括：/n预测全景图像的前景注意力图和背景注意力图；/n计算预测的所述前景注意力图、所述背景注意力图中每一部分的逐像素的亮度值，得到可视化分数；/n提取全景图像的全局特征，将所述全局特征与预测的所述前景注意力图、所述背景注意力图使用逐元素乘的方式进行融合，得到融合后的所述前景注意力图、所述背景注意力图；/n将融合后的所述前景注意力图、所述背景注意力图与所述可视化分数加权融合，获得最终的预测结果。/n

【技术特征摘要】
1.一种基于注意力感知特征融合的全景图像显著性预测方法，其特征在于，包括：
预测全景图像的前景注意力图和背景注意力图；
计算预测的所述前景注意力图、所述背景注意力图中每一部分的逐像素的亮度值，得到可视化分数；
提取全景图像的全局特征，将所述全局特征与预测的所述前景注意力图、所述背景注意力图使用逐元素乘的方式进行融合，得到融合后的所述前景注意力图、所述背景注意力图；
将融合后的所述前景注意力图、所述背景注意力图与所述可视化分数加权融合，获得最终的预测结果。

2.根据权利要求1所述的基于注意力感知特征融合的全景图像显著性预测方法，其特征在于，所述预测全景图像的前景注意力图和背景注意力图，是通过基于ResNet50网络的两阶段预测分别得到全景图像的前景注意力图和背景注意力图。

3.根据权利要求2所述的基于注意力感知特征融合的全景图像显著性预测方法，其特征在于，所述通过基于ResNet50网络的两阶段预测分别得到全景图像的前景注意力图和背景注意力图，其中，
在第一阶段进行预测的公式如下：

其中，MPA是通过ResNet50网络预测得到的特征图，和表示两个独立的预测网络，F1和B1分别表示得到的前景注意力图和背景注意力图；
在第二阶段，对第一阶段得到的前景注意力图和背景注意力图进行增强，其具体的计算如下：

通过上式计算得到预测的前景注意力图Fatt和背景注意力图Batt；M是在第二阶段经过ResNet50网络预测得到的特征图；和表示在第二阶段的两个预测网络。

4.根据权利要求1所述的基于注意力感知特征融合的全景图像显著性预测方法，其特征在于，所述计算预测的所述前景注意力图、所述背景注意力图中每一部分的逐像素的亮度值，其中：利用所述前景注意力图、所述背景注意力图中每个像素的亮度值表示可视化分数；
定义全局可视化分数分别表示所述前景注意力图、所述背景注意力图中每一部分的可视化分数，计算公式如下：

其中，(x0,y0)和(x',y')分别表示在所述前景注意力图、所述背景注意力图中的像素点，p和q分别表示前景注意力图和背景注意力图中像素点的集合。

5.根据权利要求1所述的基于注意力感知特征融合的全景图像显著性预测方法，其特征在于，所述提取全景图像的全局特征，是通过改进的带有注意力机制的ResNet50网络执行的，其中，所述带有注意力机制的ResNet50网络：
在ResNet50网络的最后一层添加一个16通道的1×1的卷积核；
将输入全景图像的大小从2...

【专利技术属性】
技术研发人员：杨小康，朱丹丹，闵雄阔，朱文瀚，朱煜程，翟广涛，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人