【技术实现步骤摘要】
一种基于全局上下文信息探索的RGB
‑
D显著性目标检测方法
:
[0001]本专利技术涉及计算机视觉和图像处理领域,提出了一种新的全局上下文探索网络(GCENet)用于RGB
‑
D显著性目标检测(SOD)任务,以细粒度的方式探索多尺度上下文特征的性能增益。
技术介绍
:
[0002]显著目标检测旨在从给定场景中分割出最具视觉吸引力的目标。作为一种预处理工具,SOD已经广泛应用于计算机视觉任务,如图像检索,视觉跟踪等。大多数先前的SOD方法集中于RGB图像,但是它们难以处理具有挑战性的场景,例如低对比度环境、相似的前景和背景以及复杂的背景。随着微软Kinect、iPhone XR、华为Mate30等深度传感器设备的普及,RGB
‑
D图像的采集是可行的,也是可以实现的。由于除了纹理、方向和亮度等2D特征之外,深度线索也影响视觉注意,因此RGB
‑
D SOD逐渐受到关注和研究。多尺度上下文特征的有效利用赋予了特征更丰富的全局上下文信息,有利于更好地理解整个场景,提 ...
【技术保护点】
【技术特征摘要】
1.一种基于全局上下文信息探索的RGB
‑
D显著性目标检测方法,其特征在于,该方法包括一下步骤:1)获取训练和测试该任务的RGB
‑
D数据集,并定义本发明的算法目标,并确定用于训练和测试算法的训练集和测试集;2)基于连续卷积层堆叠用来构建跨模态上下文特征模块提取特征信息;3)定义一叠连续的卷积层和多尺度特征的多尺度特征解码器(MFD)以及空间通道注意力;4)构建多尺度特征解码器,将这些多尺度特征融合到一个自上而下的聚合策略中,并生成显著性结果;5)采用二元交叉熵(BCE)来训练本发明的模型,这也是SOD任务中普遍存在的损失函数。计算出在不同的像素下的预测值和真实值之间的误差。2.根据权利要求1所述的一种基于全局上下文信息探索的RGB
‑
D显著性目标检测方法,其特征在于:所述步骤2具体方法是:2.1)随机选取NLPR数据集的650个样本、NJU2K数据集的1400个样本和DUT数据集的800个样本作为训练集,将前三个数据集剩余样本及RGBD、STERE、和RGBD数据集样本归类为测试集;2.2)NJU2K包含1985对RGB图像和深度图,其中深度图是从立体图像估计的。STERE是第一个提出的数据集,总共包含1000对低质量的深度图。3.根据权利要求1所述的一种基于全局上下文信息探索的RGB
‑
D显著性目标检测方法,其特征在于:所述步骤3具体方法是:3.1)提出了一种融合跨模态特征的多路径融合(MPF)策略,该策略采用多个元素级操作的协作集合,包括元素级加法、元素级乘法和级联。此外,为了减少跨通道整合过程中的冗余信息和非显著特征,本发明利用空间通道注意机制,以过滤掉不需要的信息;3.2)四个RGB特征和深度特征由一叠连续的卷积层提取,描述如下:Conv3表示具有3
×
3内核的卷积运算,α∈{R,D},和表示连续四个卷积层的输出。i∈{1,2,3,4,5},代表主干网的第i层;3.3)定义多尺度特征的多尺度特征解码器(MFD),MPF计算如下:其中,O
ad
、O
ml
和O
ct
分别是元素加法...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。