一种基于主体区域引导的伪装目标检测方法技术

技术编号:35606204 阅读:11 留言:0更新日期:2022-11-16 15:28
本发明专利技术涉及一种基于主体区域引导的伪装目标检测方法,包括训练图像预处理、伪装目标预测网络搭建和伪装目标预测网络的训练三个步骤。首先,通过训练图像预处理进行数据增强,然后搭建伪装目标预测网络,最后通过训练集图像完成伪装目标预测网络的训练,本发明专利技术方法针对编码部分包含丰富信息的浅层特征图,设计了主体区域分析模块进行有效提取,再通过特征融合模块利用对主体区域的预测信息,引导对伪装目标的检测。本发明专利技术方法提供的网络模型可以充分有效地利用主体区域引导信息来实现对自然图像中伪装目标的准确预测。图像中伪装目标的准确预测。图像中伪装目标的准确预测。

【技术实现步骤摘要】
一种基于主体区域引导的伪装目标检测方法


[0001]本专利技术涉及一种基于主体区域引导的伪装目标检测方法,属于计算机视觉


技术介绍

[0002]随着深度学习技术的不断进步,计算机视觉领域的各项任务也迎来了许多新的发展。伪装目标检测(COD,Camouflage Object Detection)是计算机视觉领域的一个热门研究方向,其任务是准确检测出图像中包含的伪装目标的位置信息,并实现目标区域二值分割。伪装目标检测与常规目标检测任务有着较大差异,伪装目标在图像中往往非常隐蔽,与背景环境重合度高,不能在第一时间被人类的视觉注意力捕捉到。伪装目标检测在许多相关研究领域中有着广泛的应用,例如迷彩伪装军事目标的检测、农业作物病虫害的分类和医学图像分割等,该任务已引起越来越大的重视。
[0003]以往伪装目标检测模型更多地采用传统基于手工特征的检测方法,比如基于颜色和纹理特征的检测方法、基于频域特征的检测方法和基于几何梯度特征的检测方法。但都存在明显的准确性缺陷,检测准确度也容易受到噪声、光照等因素的影响,综合能力不如基于深度学习的方法。
[0004]而现有基于深度学习的一些伪装目标检测模型,简单地将常规目标检测任务的检测模型移植到伪装目标检测任务中,没有进行符合伪装目标色彩特征的改进,对于伪装目标的定位能力较弱,存在严重的错误区分显著目标和伪装目标的问题。
[0005]神经网络模型中Encoder

Decoder(编码

解码)的结构首先在医学图像分割任务中被提出,并因为其卓越的分割表现被广泛应用,成为了图像分割任务中最常使用的网络结构。

技术实现思路

[0006]本专利技术的目的是针对现有方法存在的不足,提供一种基于主体区域引导的伪装目标检测方法。
[0007]为实现上述目的,本专利技术的技术方案是:
[0008]一种基于主体区域引导的伪装目标检测方法,包括以下步骤:
[0009]步骤一、训练图像预处理:训练数据集采用COD10K数据集和CAMO数据集,对输入训练图像进行随机翻转与随机裁剪操作,并使用距离变化算法生成主体区域的标签图,用作后续网络训练时的监督标签;
[0010]步骤二、伪装目标预测网络搭建:伪装目标预测网络采用Encoder

Decoder结构,包括基于Res2Net

50主干网络的编码部分、包含主体区域分析模块、特征融合模块的解码部分以及预测监督部分;
[0011]在编码部分,将经过图像预处理后的图像输入Res2Net

50的主干网络,得到通道数和尺寸不同的各编码层级卷积特征图,将各编码层级卷积特征图各输入一个卷积块进行
通道维度的压缩,压缩后将通道数相同的各层级特征图传递至解码部分;
[0012]在解码部分,网络主要包含主体区域分析模块和特征融合模块,主体区域分析模块接收到编码部分输出的卷积特征图和上一层级特征融合模块输出的特征图,通过残差融合的方式预测伪装目标的主体区域;特征融合模块接收到主体区域分析模块输出的特征图,采用自注意力的方式实现特征融合,进行伪装目标的预测,
[0013]在预测监督部分,将解码部分主体区域分析模块和特征融合模块输出的特征图输入卷积层,并使用上采样和Softmax操作得到最终的预测图序列。
[0014]步骤三、伪装目标预测网络的训练:网络的预测监督部分输出包含5张主体区域预测图和5张伪装目标预测图的序列,使用主体区域标签图和目标标签图进行监督训练,其中主体区域预测图和标签图的监督采用BCE损失函数,而伪装目标预测图和标签图的监督采用BCE和IOU的混合损失函数,
[0015]网络采用阶梯衰减的学习率策略,初始学习率和衰减系数分别为0.0001和0.5,批处理参数设置为8;网络使用随机梯度下降算法进行优化,动量系数设置为0.9。
[0016]与现有技术相比,本专利技术的有益效果在于:
[0017]本专利技术方法主要优势在于两个方面:解码部分的主体区域分析模块和特征融合模块。本专利技术方法针对编码部分包含丰富信息的浅层特征图,设计了主体区域分析模块进行有效提取,再通过特征融合模块利用对主体区域的预测信息,引导对伪装目标的检测。本专利技术方法提供的网络模型可以充分有效地利用主体区域引导信息来实现对自然图像中伪装目标的准确预测。
附图说明
[0018]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本专利技术基于主体区域引导的伪装目标检测方法的网络结构框架示意图;
[0020]图2为本专利技术基于主体区域引导的伪装目标检测方法的预测结果示意图。
具体实施方式
[0021]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0022]如图1所示,一种基于主体区域引导的伪装目标检测方法,包括以下步骤:
[0023]步骤一、训练图像预处理:训练数据集采用COD10K数据集和CAMO数据集,对输入训练图像进行随机翻转与随机裁剪操作,并使用距离变化(Distance Transformation)算法生成主体区域的标签图,用作后续网络训练时的监督标签;
[0024]步骤二、伪装目标预测网络搭建:伪装目标预测网络采用Encoder

Decoder(编码

解码)结构,包括基于Res2Net

50主干网络的编码部分、包含主体区域分析模块、特征融合
模块的解码部分以及预测监督部分;
[0025]在编码部分,将经过图像预处理后的图像输入Res2Net

50的主干网络,得到通道数和尺寸不同的各编码层级卷积特征图,将各编码层级卷积特征图各输入一个卷积块进行通道维度的压缩,压缩后将通道数相同的各层级特征图传递至解码部分;
[0026]IF
i
=ReLU(BN(Conv
1+3
(Encoder
i
)))
[0027]其中,Encoder
i
表示第i层级编码块的特征图,IF
i
表示第i层级编码块压缩后的特征图,Conv
1+3
()表示一个1
×
1的卷积层和一个3
×
3的卷积层,BN()表示批量归一化操作,ReLU()表示ReLU激活函数,压缩后将通道数相同的各层级特征图传递至解码部分。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于主体区域引导的伪装目标检测方法,其特征在于:包括以下步骤:步骤一、训练图像预处理:训练数据集采用COD10K数据集和CAMO数据集,对输入训练图像进行随机翻转与随机裁剪操作,并使用距离变化算法生成主体区域的标签图,用作后续网络训练时的监督标签;步骤二、伪装目标预测网络搭建:伪装目标预测网络采用Encoder

Decoder结构,包括基于Res2Net

50主干网络的编码部分、包含主体区域分析模块、特征融合模块的解码部分以及预测监督部分;步骤三、伪装目标预测网络的训练:网络的预测监督部分输出包含5张主体区域预测图和5张伪装目标预测图的序列,使用主体区域标签图和目标标签图进行监督训练,其中主体区域预测图和标签图的监督采用BCE损失函数,而伪装目标预测图和标签图的监督采用BCE和IOU的混合损失函数,网络采用阶梯衰减的学习率策略,初始学习率和衰减系数分别为0.0001和0.5,批处理参数设置为8;网络使用随机梯度下降算法进行优化,动量系数设置为0.9。2.根据权利要求1所述的一种基于主体区域引导的伪装目标检测方法,其特征在于:所述步骤二具体包括:在编码部分,将经过图像预处理后的图像输入Res2Net

50的主干网络,得到通道数和尺寸不同的各编码层级卷积特征图,将各编码层级卷积特征图各输入一个卷积块进行通道维度的压缩,压缩后将通道数相同的各层级特征图传递至解码部分;在解码部分,网络主要包含主体区域分析模块和特征融合模块,主体区域分析模块接收到编码部分输出的卷积特征图和上一层级特征融合模块输出的特征图,通过残差融合的方式预测伪装目标的主体区域;特征融合模块接收到主体区域分析模块输出的特征图,采用自注意力的方式实现特征融合,进行伪装目标的预测,在预测监督部分,将解码部分主体区域分析模块和特征融合模块输出的特征图输入卷积层,并使用上采样和Softmax操作得到最终的预测图序列。3.根据权利要求2所述的一种基于主体区域引导的伪装目标检测方法,其特征在于:所述步骤二中将各编码层级卷积特征图各输入一个卷积块进行通道维度的压缩,定义为:IF
i
=ReLU(BN(Conv
i+3
(Encoder
i
)))其中,Encoder
i
表示第i层级编码块的特征图,IF
i
表示第i层级编码块压缩后的特征图,Conv
1+3<...

【专利技术属性】
技术研发人员:吴智聪周晓飞张继勇李世锋周振何帆
申请(专利权)人:中电数据服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1