当前位置: 首页 > 专利查询>南开大学专利>正文

基于分组反向注意力的伪装物体检测方法及系统技术方案

技术编号:28736191 阅读:21 留言:0更新日期:2021-06-06 11:43
本发明专利技术公开了基于分组反向注意力的伪装物体检测方法及系统,包括:获取待检测图像;对待检测图像进行特征提取;基于特征提取结果,对待检测图像中的伪装物体进行搜索,得到伪装物体的定位图;基于特征提取结果和伪装定位物体的定位图,利用分组反向注意力方式进行处理,得到伪装物体的轮廓图。得到伪装物体的轮廓图。得到伪装物体的轮廓图。

【技术实现步骤摘要】
基于分组反向注意力的伪装物体检测方法及系统


[0001]本专利技术涉及图像检测
,特别是涉及基于分组反向注意力的伪装物体检测方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
,并不必然构成现有技术。
[0003]随着人们对图片处理要求的不断提升,伪装物体检测算法的应用也愈加广泛。感官生态学相关研究表明,伪装物体与背景之间具备高度的相似性,这种伪装策略极大地欺骗了观察者的视觉感知系统。因此,这类检测任务远比传统物体检测更具挑战性。伪装物体检测任务要求算法模型能够理解这类图像中的高层伪装语义,并从图像中检测出对应的伪装物体。这就要求模型能够理解图像语义内容,并分辨伪装模式。

技术实现思路

[0004]为了解决现有技术的不足,本专利技术提供了基于分组反向注意力的伪装物体检测方法及系统;用于挖掘图片中的伪装目标。用户提供一幅图片,算法会检测出包含伪装目标的精确轮廓。
[0005]第一方面,本专利技术提供了基于分组反向注意力的伪装物体检测方法;
[0006]基于分组反向注意力的伪装物体检测方法,包括:
[0007]获取待检测图像;对待检测图像进行特征提取;
[0008]基于特征提取结果,对待检测图像中的伪装物体进行搜索,得到伪装物体的定位图;
[0009]基于特征提取结果和伪装定位物体的定位图,利用分组反向注意力方式进行处理,得到伪装物体的轮廓图。
[0010]第二方面,本专利技术提供了基于分组反向注意力的伪装物体检测系统;
[0011]基于分组反向注意力的伪装物体检测系统,包括:
[0012]获取模块,其被配置为:获取待检测图像;对待检测图像进行特征提取;
[0013]搜索模块,其被配置为:基于特征提取结果,对待检测图像中的伪装物体进行搜索,得到伪装物体的定位图;
[0014]输出模块,其被配置为:基于特征提取结果和伪装定位物体的定位图,利用分组反向注意力方式进行处理,得到伪装物体的轮廓图。
[0015]第三方面,本专利技术还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述第一方面所述的方法。
[0016]第四方面,本专利技术还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述的方法。
[0017]与现有技术相比,本专利技术的有益效果是:
[0018]用于挖掘图片中的伪装目标。用户提供一幅图片,算法会检测出包含伪装目标的精确轮廓。具体地,之所以采用纹理增强模块是因为不同尺度的视觉感受野有利于捕捉到更更丰富尺度的细节纹理信息;之所以采用近邻邻接部分解码器,是因为将高层富语义与低层弱语义融合有利于提升模型的特征表达能力;之所以采用分组反向注意力模块,是因为以分组的方式融合反向注意力有助于显式地优化来自编码器的粗糙特征。
[0019]本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0020]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0021]图1为第一个实施例的方法流程图;
[0022]图2为第一个实施例的近邻连接部分解码器;
[0023]图3(a)为第一个实施例的分组反向模块;
[0024]图3(b)为第一个实施例的反向注意力模块;
[0025]图4(a)为第一个实施例的输入图像;
[0026]图4(b)为第一个实施例的真值标签;
[0027]图4(c)为第一个实施例的本专利技术SINet的效果图;
[0028]图4(d)为第一个实施例的SINet_evpr的效果图;
[0029]图4(e)为第一个实施例的PraNet的效果图;
[0030]图4(f)为第一个实施例的PFANet的效果图。
具体实施方式
[0031]应该指出,以下详细说明都是示例性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。
[0032]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0033]在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。
[0034]实施例一
[0035]本实施例提供了基于分组反向注意力的伪装物体检测方法;
[0036]如图1所示,基于分组反向注意力的伪装物体检测方法,包括:
[0037]S101:获取待检测图像;对待检测图像进行特征提取;
[0038]S102:基于特征提取结果,对待检测图像中的伪装物体进行搜索,得到伪装物体的
定位图;
[0039]S103:基于特征提取结果和伪装定位物体的定位图,利用分组反向注意力方式进行处理,得到伪装物体的轮廓图。
[0040]如图1所示,本技术方案将伪装目标检测任务分解成搜索与识别两个阶段。
[0041]对于搜索阶段,首先使用基于Res2Net骨架网络的特征编码器对输入图片进行特征提取,然后使用纹理增强模块分别对高三层特征图进行细节增强,最后使用一个近邻连接部分解码器模块得到初步的伪装物体定位图。
[0042]而对于识别阶段,我们引入一种从粗略到精细的逐级优化策略,在每一个特征级别中使用多个级联的分组反向注意力块(Group

Reversal Attention,GRA),用于进一步提纯来自于编码器的特征,并改善初步的定位图。在测试阶段,我们在采用Sigmoid激活函数,得到最终的预测图。
[0043]作为一个或多个实施例,所述S101中,对待检测图像进行特征提取;具体包括:
[0044]基于Res2Net

50骨架网络,对待检测图像进行特征提取;
[0045]其中,Res2Net

50骨架网络,包括:依次连接的第一卷积块、第二卷积块、第三卷积块、第四卷积块和第五卷积块;
[0046]第一卷积模块,对待检测图像进行卷积处理,输出第一特征图;
[0047]第二卷积模块,对第一特征图进行卷积处理,输出第二本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于分组反向注意力的伪装物体检测方法,其特征是,包括:获取待检测图像;对待检测图像进行特征提取;基于特征提取结果,对待检测图像中的伪装物体进行搜索,得到伪装物体的定位图;基于特征提取结果和伪装定位物体的定位图,利用分组反向注意力方式进行处理,得到伪装物体的轮廓图。2.如权利要求1所述的基于分组反向注意力的伪装物体检测方法,其特征是,对待检测图像进行特征提取;具体包括:基于Res2Net

50骨架网络,对待检测图像进行特征提取;其中,Res2Net

50骨架网络,包括:依次连接的第一卷积块、第二卷积块、第三卷积块、第四卷积块和第五卷积块;第一卷积模块,对待检测图像进行卷积处理,输出第一特征图;第二卷积模块,对第一特征图进行卷积处理,输出第二特征图;第三卷积模块,对第二特征图进行卷积处理,输出第三特征图;第四卷积模块,对第三卷积图进行卷积处理,输出第四特征图;第五卷积模块,对第四特征图进行卷积处理,输出第五特征图。3.如权利要求1所述的基于分组反向注意力的伪装物体检测方法,其特征是,基于特征提取结果,对待检测图像中的伪装物体进行搜索,得到伪装物体的定位图;具体包括:第三特征图,经过第一纹理增强模块进行处理,输出第一纹理增强图;第四特征图,经过第二纹理增强模块进行处理,输出第二纹理增强图;第五特征图,经过第三纹理增强模块进行处理,输出第三纹理增强图;第一、第二和第三纹理增强图,同时输入到近邻连接部分解码器,得到伪装物体的定位图。4.如权利要求3所述的基于分组反向注意力的伪装物体检测方法,其特征是,所述第一纹理增强模块,包括:一条残差分支和四条侧分支;其中,四条侧分支彼此之间为并联关系;其中,四条侧分支包括:第一侧分支、第二侧分支、第三侧分支和第四侧分支;残差分支,包括:依次连接的卷积核为1*1卷积层和加法器;第一侧分支,包括:一个卷积核为1*1的卷积层;第二侧分支,包括:四个串联的卷积层,依次为卷积核为1*1的卷积层、卷积核为1*3的卷积层、卷积核为3*1的卷积层和卷积核为3*3且空洞率为3的卷积层;第三侧分支,包括:四个串联的卷积层,依次为卷积核为1*1的卷积层、卷积核为1*5的卷积层、卷积核为5*1的卷积层和卷积核为3*3且空洞率为5的卷积层;第四侧分支,包括:四个串联的卷积层,依次为卷积核为1*1的卷积层、卷积核为1*7的卷积层、卷积核为7*1的卷积层和卷积核为3*3且空洞率为7的卷积层;第一、第二、第三和第四侧分支的输入端均与残差分支的输入端连接,残差分支的输入端作为第一纹理增强模块的输入端;第一、第二、第三和第四侧分支的输出端均与拼接器的输入端连接;拼接器的输出端与加法器的输入端连接;加法器的输出端作为第一纹理增强模块的输出端。
5.如权利要求3所述的基于分组反向注意力的伪装物体检测方法,其特征是,所述近邻连接部分解码器,内部结构包括:第一输入端、第二输入端和第三输入端;其中,第一输入端用于输入第一纹理增强图;第二输入端用于输入第二纹理增强...

【专利技术属性】
技术研发人员:程明明范登平季葛鹏
申请(专利权)人:南开大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1