基于多尺度自适应融合的RGB-D显著目标检测方法技术

技术编号：36565099 阅读：7 留言：0更新日期：2023-02-04 17:21

本发明专利技术属于图像检测领域，具体涉及基于多尺度自适应融合的RGB

全部详细技术资料下载

【技术实现步骤摘要】
基于多尺度自适应融合的RGB
‑
D显著目标检测方法

[0001]本专利技术属于图像检测领域，具体涉及基于多尺度自适应融合的RGB
‑
D显著目标检测方法。

技术介绍

[0002]近年来，显著目标检测(Salient Object Detection，SOD)技术以定位和识别场景中最吸引人的区域为目标，受到了广泛的关注。作为一种有效的预处理方法，它已被应用于各种计算机视觉任务，如场景分类、视觉跟踪、图像编辑等。随着Kinect和RealSense等深度相机越来越普及，从RGB
‑
D(“D”指深度)输入中进行显著目标检测正成为一个吸引人的研究方向，研究人员可以从与RGB图像互补的深度图像中学习几何信息和位置信息，这有助于从干扰物中识别出显著的目标，甚至在非常杂乱的环境中也能产生区分性的SOD模型。该任务旨在从RGB和深度信息中检测显著目标。
[0003]考虑到RGB和深度数据的分布之间存在较大差距，现有的RGB
‑
D SOD算法通常侧重于探索有效的融合策略，以建模两者之间的互补信息模式。这些融合策略可分为早期融合、中期融合和晚期融合。尽管这些融合策略提高了显著性模型的性能，但仍存在一些需要考虑的问题。首先，早期融合策略组装RGB
‑
D图像，然后将其输入特征提取器。但是，RGB和深度图像包含异步信息。简单的串联操作将消除两种模式提供的独特功能。此外，特征提取器(如VGG、ResNet等)通常是在基于RGB的基准上预先训练的，它们...

【技术保护点】

【技术特征摘要】
1.基于多尺度自适应融合的RGB
‑
D显著目标检测方法，其特征在于，步骤如下：步骤S1：数据预处理；根据输入的图像组，利用双流网络分别提取两个模态的多尺度特征；图像组包括RGB图像和深度图像；步骤S2：采取尺度自适应融合编码器，根据跨模态的多尺度属性整合其层次特征；步骤S3：融合多尺度特征，生成预测的显著目标图；步骤S4：根据损失函数训练整个算法，使算法预测结果拟合正确结果；步骤S5：利用训练集对RGB
‑
D显著目标检测模型进行训练，并利用验证集对正在训练的模型进行验证，所得的整个算法模型即为RGB
‑
D显著目标检测的工具。2.如权利要求1所述的基于多尺度自适应融合的RGB
‑
D显著目标检测方法，其特征在于，所述步骤S1，具体为：步骤S11：将输入的RGB图像与对应的深度图像，利用VGG
‑
16作为骨干网结合部分解码器，分别独立提取多层次特征；步骤S12：利用整体注意力模块处理来自优化层的特征图和初始显著图，精确边缘信息，均匀地分割整个对象；步骤S13：输出RGB图像与对应的深度图像的初步预测图。3.如权利...

【专利技术属性】
技术研发人员：孔雨秋，王鹤，
申请(专利权)人：大连理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人