当前位置: 首页 > 专利查询>南宁学院专利>正文

一种基于制造技术

技术编号:39779848 阅读:41 留言:0更新日期:2023-12-22 02:24
本发明专利技术公开了一种基于

【技术实现步骤摘要】
一种基于RGB

D图像的视觉显著性目标检测方法


[0001]本专利技术属于计算机视觉和图像处理领域,具体为一种基于
RGB

D
图像的视觉显著性目标检测
(Salient Object Detection

SOD)
算法


技术介绍

[0002]人类的视觉系统可以通过独特的感知单元和神经结构从复杂的场景中快速关注到感兴趣的目标或区域,这被称之为视觉注意力机制

一般来说,人类的视觉注意力包含了自底向上和自顶向下两条通路:自底向上的注意力机制是由数据驱动的
,
是人脑对外界事物的非自主性感知;而自顶向下的注意力机制是由意识驱动的,是人脑主动下发指令去捕获感兴趣目标的过程

受此启发,人们希望计算机也具有这种能力,于是显著性目标检测
(Salient Object Detection

SOD)
任务应运而生,旨在让计算机自动从给定场景中检测出最吸引人注意的区域或本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于
RGB

D
图像的视觉显著性目标检测方法,其特征在于,包括如下步骤:
S1、
收集整理现有的可用于显著性目标检测的
RGB

D
图像数据集;
S2、
分析现有的基于
RGB

D
图像的显著性目标检测算法的优点与仍存在的问题,搭建显著性目标检测网络与各个模块;
S3、
进行多次实验,对不同的模块

网络结构和参数进行调优,并记录每次的实验结果;
S4、
通过计算平均绝对误差来完成量化指标的评估,评估所构建的网络是否有效,并验证所提出的各个模块是否有效;所述
S2
中采用双分支编码器来分别提取
RGB
图像的表征信息和深度信息,通过全局平均池化对多尺度信息完成聚合,采用注意力特征融合模块来对
S3
中所提取到的多层级多尺度特征进行融合,并通过注意力感知对噪声信息进行过滤,并在提取到有效特征之后,使用上下文语义对齐采样来捕获通道间的相互依赖信息
。2.
根据权利要求1所述的一种基于
RGB

D
图像的视觉显著性目标检测方法,其特征在于,所述
S1
中可用于
RGB

D
的显著性目标检测共计5个数据集,分别为
STERE
数据集
、NJU2K
数据集
、DES
数据集
、NL PR
数据集和
SIP
数据集
。3.
根据权利要求2所述的一种基于
RGB

D
图像的视觉显著性目标检测方法,其特征在于,所述
S2
中显著性目标检测网络以
RGB
图像

深度图及
RGB
图像

深度图的超像素映射作为输入源实现对
RGB
图像与深度图图像多模态信息的整合利用
。4.
根据权利要求3所述的一种基于
RGB

D
图像的视觉显著性目标检测方法,其特征在于,所述
S2
中设计的网络为基于双分支编码器与特征金字塔的多层级神经网络,在特征金字塔网络中嵌入有通道信息提取策略,来保证模型对于相关特征的感知能力,在设计网络过程中的特征提取阶段对显著目标的边界建模,完成边缘信息的特征提取,以显著目标与背景边界的精准划分
。5.
根据权利要求4所述的一种基于
RGB

D
图像的视觉显著性目标检测方法,其特征在于,还包括原型采样网络模块和依赖选择模块,将特征金字塔的输出和
SLIC
算法生成的
RGB
图像与深度图像的超像素映射作为原型生成模块...

【专利技术属性】
技术研发人员:杨晓哲卢慧婷
申请(专利权)人:南宁学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1