一种基于全局上下文信息探索的RGB-D显著性目标检测方法技术

技术编号：34011844 阅读：12 留言：0更新日期：2022-07-02 14:47

本发明专利技术属于计算机视觉领域，公开了一种基于全局上下文信息探索的RGB

全部详细技术资料下载

【技术实现步骤摘要】
一种基于全局上下文信息探索的RGB
‑
D显著性目标检测方法

：
[0001]本专利技术涉及计算机视觉和图像处理领域，提出了一种新的全局上下文探索网络(GCENet)用于RGB
‑
D显著性目标检测(SOD)任务，以细粒度的方式探索多尺度上下文特征的性能增益。

技术介绍
：
[0002]显著目标检测旨在从给定场景中分割出最具视觉吸引力的目标。作为一种预处理工具，SOD已经广泛应用于计算机视觉任务，如图像检索，视觉跟踪等。大多数先前的SOD方法集中于RGB图像，但是它们难以处理具有挑战性的场景，例如低对比度环境、相似的前景和背景以及复杂的背景。随着微软Kinect、iPhone XR、华为Mate30等深度传感器设备的普及，RGB
‑
D图像的采集是可行的，也是可以实现的。由于除了纹理、方向和亮度等2D特征之外，深度线索也影响视觉注意，因此RGB
‑
D SOD逐渐受到关注和研究。多尺度上下文特征的有效利用赋予了特征更丰富的全局上下文信息，有利于更好地理解整个场景，提高RGB
‑
D SOD网络的性能。
[0003]受多尺度特征优势的启发，许多RGB
‑
D SOD方法利用多尺度特征的优势来提高性能。然而，它们主要关注分层多尺度表示，不能在单个层中捕获细粒度的全局上下文线索。与这些方法不同的是，本专利技术提出了一个用于RGB
‑
D SOD的全局上下文探索网络(GCENet),以在细粒度级别上探索多尺度上...

【技术保护点】

【技术特征摘要】
1.一种基于全局上下文信息探索的RGB
‑
D显著性目标检测方法，其特征在于，该方法包括一下步骤：1)获取训练和测试该任务的RGB
‑
D数据集，并定义本发明的算法目标，并确定用于训练和测试算法的训练集和测试集；2)基于连续卷积层堆叠用来构建跨模态上下文特征模块提取特征信息；3)定义一叠连续的卷积层和多尺度特征的多尺度特征解码器(MFD)以及空间通道注意力；4)构建多尺度特征解码器，将这些多尺度特征融合到一个自上而下的聚合策略中，并生成显著性结果；5)采用二元交叉熵(BCE)来训练本发明的模型，这也是SOD任务中普遍存在的损失函数。计算出在不同的像素下的预测值和真实值之间的误差。2.根据权利要求1所述的一种基于全局上下文信息探索的RGB
‑
D显著性目标检测方法，其特征在于：所述步骤2具体方法是：2.1)随机选取NLPR数据集的650个样本、NJU2K数据集的1400个样本和DUT数据集的800个样本作为训练集，将前三个数据集剩余样本及RGBD、STERE、和RGBD数据集样本归类为测试集；2.2)NJU2K包含1985对RGB图像和深度图，其中深度图是从立体图像估计的。STERE是第一个提出的数据集，总共包含1000对低质量的深度图。3.根据权利要求1所述的一种基于全局上下文信息探索的RGB
‑
D显著性目标检测方法，其特征在于：所述步骤3具体方法是：3.1)提出了一种融合跨模态特征的多路径融合(MPF)策略，该策略采用多个元素级操作的协作集合，包括元素级加法、元素级乘法和级联。此外，为了减少跨通道整合过程中的冗余信息和非显著特征，本发明利用空间通道注意机制，以过滤掉不需要的信息；3.2)四个RGB特征和深度特征由一叠连续的卷积层提取，描述如下：Conv3表示具有3
×
3内核的卷积运算，α∈{R,D},和表示连续四个卷积层的输出。i∈{1,2,3,4,5}，代表主干网的第i层；3.3)定义多尺度特征的多尺度特征解码器(MFD)，MPF计算如下：其中，O
ad
、O
ml
和O
ct
分别是元素加法...

【专利技术属性】
技术研发人员：黄荣梅，廖涛，段松松，
申请(专利权)人：安徽理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人