基于RGB-T多源图像数据的显著性目标检测方法技术

技术编号：34533018 阅读：34 留言：0更新日期：2022-08-13 21:26

本发明专利技术公开一种基于RGB

全部详细技术资料下载

【技术实现步骤摘要】
基于RGB
‑
T多源图像数据的显著性目标检测方法

[0001]本专利技术涉及图像处理
，尤其涉及一种基于RGB
‑
T多源图像数据的显著性目标检测方法。

技术介绍

[0002]显著性目标检测旨在找出图像中最让人感兴趣的区域，要求能够准确给出物体位置并能与背景分割开来，包含物体定位和物体分割的任务，两个任务融合在一个过程中进行端到端检测。早期的显著性目标检测基于启发式的局部或者全局线索检测显著对象，手工特征限制了各种方法在复杂场景中的检测能力；随着深度学习的发展，基于卷积神经网络的模型能够快速高效地获得局部全局信息，逐步细化特征，从而增加显著目标检测的精度。
[0003]现实情况中，由于物体具有类内差异大、类间差异小的特点，一种物体在不同的情境下可能产生不同的语义，导致可见光图像和红外图像无法单独准确辨认物体。一般的可见光图像可以保存图像丰富的细节和纹理信息，但常常由于光线、伪装与烟雾等原因导致无法有效的区分目标和背景，而红外图像因其特殊的成像机制可以免受这些因素的影响，只要目标与周围环境存在温差，目标就能够显现出来。目前基于RGB
‑
T多源图像的显著性目标检测的模型被陆续提出，如Li等人提出的ADFNet[Tu Z,Ma Y,Li Z,et al.RGBT salient object detection:Alarge
‑
scale dataset and benchmark[J].arXiv preprint arXiv:2007....

【技术保护点】

【技术特征摘要】
1.一种基于RGB
‑
T多源图像数据的显著性目标检测方法，其特征在于，包括：步骤1：在传统的双通道VGG
‑
16网络架构的基础上，采用可变形卷积替换VGG
‑
16中部分卷积层，并去掉最后的全连接层，构成基于可变形卷积的VGG
‑
DCNet网络，将可见光图像和热红外图像作为VGG
‑
DCNet网络双通道的输入，利用VGG
‑
DCNet网络提取可见光图像和热红外图像的初级特征；步骤2：将提取的可见光图像和热红外图像的初级特征输入注意力特征融合模块，经过标准化注意力机制后分别得到可见光图像和热红外图像对应的注意力特征图，再将可见光图像和红外图像每层的注意力特征图进行两两融合，得到融合后的注意力特征图；步骤3：将最深层注意力特征经过多层金字塔池化操作后获取的全局语义信息融入到可见光图像和红外图像局部特征提取的过程中，从而在融合全局
‑
局部特征模块中将可见光图像和红外图像的全局多尺度的特征和局部多层次的特征进行融合，并输出最终的显著性预测图。2.根据权利要求1所述的基于RGB
‑
T多源图像数据的显著性目标检测方法，其特征在于，所述步骤1包括：采用可变形卷积替换VGG
‑
16中最后一个阶段的三层卷积。3.根据权利要求1所述的基于RGB
‑
T多源图像数据的显著性目标检测方法，其特征在于，所述注意力特征融合模块用于在标准化注意力机制NAM的作用下，得到经过加强的有益特征而抑制无关特征，获取注意力特征图，并将网络中间级获取的包含注意力信息的...

【专利技术属性】
技术研发人员：吴慧欣，安丽鑫，姜维，王喆，陈继坤，刘孟轩，李琳，张慢丽，李文静，
申请(专利权)人：华北水利水电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人