一种基于模态特性与分层融合的RGB-D显著性检测方法技术

技术编号：39310422 阅读：15 留言：0更新日期：2023-11-12 15:56

本发明专利技术涉及一种基于模态特性与分层融合的RGB

全部详细技术资料下载

【技术实现步骤摘要】
一种基于模态特性与分层融合的RGB
‑
D显著性检测方法

[0001]本专利技术涉及计算机视觉领域，特别涉及一种基于模态特性与分层融合的RGB
‑
D显著性检测方法。

技术介绍

[0002]显著性检测旨在检测和分割出图片中最能吸引人关注的区域或目标，可以作为图像重定向、图像压缩和AR交互等广泛计算机视觉任务领域的前置任务。目前RGB
‑
D显著性目标检测任务通常采用卷积神经网络技术，通过大规模数据训练端到端模型，相较于传统方法，有着能捕获更多特征，以及在显著性目标检测上有更高精确度的优势。然而目前的大部分基于卷积网络的显著性检测方法无法充分利用跨模态特征信息，在面对一些RGB图与深度图中的复杂场景时，往往无法有效识别显著目标。
[0003]复杂场景下的RGB图片与深度图片分别存在如下问题：1)RGB图：由于背景杂乱，光照条件较差，显著目标检测困难，最终结果可能目标结构不完整；2)深度图：当场景布局较为复杂时，显著目标同深度位置下通常存在其他物体，会导致识别时存在歧义，最终结果可能误识别到其他物体。常规技术方案通常采用针对某个模态注意力增强或者交互融合两个模态，没有充分利用不同模态特征信息差异针对性的对两个模态进行增强，导致识别效果提升有限。此外，在特征融合生成预测图方面，一般的融合方法采用跳连接来不断还原分辨率的方式进行融合，忽略了不同阶段网络特征所含的信息特性不同，融合的兼容性较差，导致目标细节信息丢失。

技术实现思路

[0004]针对常见显著...

【技术保护点】

【技术特征摘要】
1.一种基于模态特性与分层融合的RGB
‑
D显著性检测方法，其特征在于，包括以下步骤：步骤S1：从RGB
‑
D显著性检测任务广泛使用的基准数据集中，选取复杂场景下的图像对，每一个图像对包含一张RGB图以及其对应的深度图；步骤S2：建立RGB
‑
D显著性检测模型的两个特征提取网络；在特征提取网络中，分别由低到高的多个层次提取RGB图与深度图特征，得到五层的RGB特征图与对应的深度特征图；步骤S3：采用基于模态特性的交互方式，使用RGB引导增强模块，对特征提取网络的每一层的深度特征图进行增强，得到增强的深度特征图，并使用Depth引导增强模块对每一层的RGB特征图进行增强，得到增强的RGB特征图；步骤S4：采用分层次的重连接融合方式，先特征图输入语义重连接融合模块，得到语义特征图，接着将特征图输入空间重连接融合模块，得到空间特征图；步骤S5：将空间特征图和语义特征图进行最终融合，得到最终的基于模态特性与分层融合的RGB
‑
D显著性检测模型；步骤S6：输入的复杂场景下的图像对，通过最终的基于模态特性与分层融合的RGB
‑
D显著性检测模型后，输出包含显著对象的预测图像对。2.根据权利要求1所述的基于模态特性与分层融合的RGB
‑
D显著性检测方法，其特征在于，步骤S3中的RGB引导增强模块的具体操作为：连接深度特征图和RGB特征图，将两种模态连接后的特征图进行通道调整后,分别传入一个3
×
3和一个7
×
7的并行卷积层中；3
×
3卷积核提取局部特征信息,7
×
7卷积核提取多尺度的全局显著目标特征,得到拥有多尺度特征信息的融合特征图；然后对输入的深度特征图进行最大池化,得到深度特征图的空间特征掩码；将空间特征掩码与融合特征图进行像素级乘法运算,再与原深度特征图相加,得到增强的深度特征图。3.根据权利要求1所述的基于模态特性与分层融合的RGB
‑
D显著性检测方法，其特征在于，步骤S3中的Depth引导增强模块具体操作为：深度特征图分别通过两个1
×
1卷积层调整通道数,并进行重排生成深度特征描述向量和深度通道描述向量；将深度通道描述向量转置后,与深度特征描述向量进行向量矩阵相乘,得到深度通道特征描述子；将深度通道特征描述子传入多层感知机进行非线性激活，得到增强的完整深度通道特征图，将RGB特征图与增强的完整深度通道特征图进行像素级相加，得到增强的RGB特征图。4.根据权利要求1所述的基于模态特性与分层融合的RGB
‑
D显著性检测方法，其特征在于，步骤S4中的语...

【专利技术属性】
技术研发人员：谢欢，戴蒙，
申请(专利权)人：上海应用技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人