System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种伪装目标的多频率解析方法、装置、设备及存储介质制造方法及图纸_技高网

一种伪装目标的多频率解析方法、装置、设备及存储介质制造方法及图纸

技术编号:40093237 阅读:4 留言:0更新日期:2024-01-23 16:32
本公开的实施例公开了一种伪装目标的多频率解析方法、装置、设备及存储介质。该方法的一具体实施方式包括:获取RGB输入图像,使用不同的架构来编码并提取有辨识性的频率表征;使用频率表征推理模块,聚合频率表征;通过解码器融合层级表征并获取最终预测结果。该实施方式提高了对于伪装目标的检测能力。

【技术实现步骤摘要】

本公开的实施例涉及计算机,具体涉及一种伪装目标的多频率解析方法、装置、设备及存储介质


技术介绍

1、伪装目标检测(camouflaged object detection,cod)旨在识别并分割出与背景混为一体的隐藏物体。作为一项基础研究,可以在多种现实领域被应用,包括农业上的害虫检测,制造业的缺陷检测以及医疗中的息肉分割等,吸引了越来越多的关注。

2、最近,基于深度学习方法的已经有了令人瞩目的表现。一些方法尝试使用新的解码器结构来替代传统的u型解码器结构,例如x型结构,金字塔收缩结构以及双分支结构等。一些方法受到人类或者捕猎者的行为启发,例如放缩策略,粗略搜索到准确识别策略等,通过模拟这些策略,提高方法表现。还有一些方法引入先验知识来指导模型,如纹理、边缘等。这些方法大多引入了额外的监督信号来引导模型关注预先设计好的对于伪装目标检测重要的线索。

3、与常规场景下的目标检测任务不同,伪装目标场景下的物体通常在纹理、颜色等属性下与背景极其相似,因此现有的方法难以对其定位并准确分割其边界。一些方法设计了复杂的结构提取特征对场景进行解析,但是伪装目标本身与环境的相似性导致一些强刺激信号无法被很好的获取,导致提取到的特征缺乏差异性,进而影响检测结果。因此有方法将额外将边缘纹理等作为额外的线索引导模型进行检测分割,然而这种方式在某些复杂场景下会失效,因为这些仍然还是属于人类视觉系统可以观察到的属性,依旧容易被忽视或欺骗。

4、现有方法都只考虑了图像rgb域的信息,然而根据生物学和心理学的研究表明,一些捕猎者的捕猎行为是基于频率信息的,他们的感知器可以区分目标与背景的特定的频率特征。动物在处理视觉场景时,有着比人类更加广的频带感知能力,使他们比人类更易于发现伪装目标。因此,需要将频率的信息融入伪装目标检测的过程中,超出人类视觉感知的能力来强化伪装目标检测模型的能力。


技术实现思路

1、本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。

2、本公开的一些实施例提出了伪装目标的多频率解析方法、装置、电子设备和存储介质,来解决以上
技术介绍
部分提到的技术问题中的一项或多项。

3、第一方面,本公开的一些实施例提供了一种伪装目标的多频率解析方法,该方法包括:获取rgb输入图像,使用不同的架构来编码并提取有辨识性的频率表征;使用频率表征推理模块,聚合频率表征;通过解码器融合层级表征并获取最终预测结果。

4、第二方面,本公开的一些实施例提供了一种伪装目标的多频率解析装置,装置包括:获取单元,被配置成获取rgb输入图像,使用不同的架构来编码并提取有辨识性的频率表征;聚合单元,被配置成使用频率表征推理模块,聚合频率表征;融合单元,被配置成通过解码器融合层级表征并获取最终预测结果。

5、第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。

6、第四方面,本公开的一些实施例提供了一种计算机存储介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。

7、本公开的上述各个实施例中具有如下有益效果:通过本公开的一些实施例的伪装目标的多频率解析方法,引入拉普拉斯金字塔对图像进行空间频率分解,对不同频带的信号进行分别处理,学习到有代表性的线索后进行特征聚合,从而有效提高伪装目标检测能力。

本文档来自技高网...

【技术保护点】

1.一种伪装目标的多频率解析方法,包括:

2.根据权利要求1所述的方法,其中,所述方法还包括:

3.根据权利要求1所述的方法,其中,所述获取RGB输入图像,使用不同的架构来编码并提取有辨识性的频率表征,包括:

4.根据权利要求1所述的方法,其中,所述使用频率表征推理模块,聚合频率表征,包括:

5.根据权利要求1所述的方法,其中,所述图像低频编码器为ViT模型;以及

6.根据权利要求3所述的方法,其中,所述残余频率阵列编码器是通过以下步骤提取残差频率分量中的高频特征的:

7.一种伪装目标的多频率解析装置,包括:

8.一种电子设备,包括:

9.一种计算机存储介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1至6中任一所述的方法。

【技术特征摘要】

1.一种伪装目标的多频率解析方法,包括:

2.根据权利要求1所述的方法,其中,所述方法还包括:

3.根据权利要求1所述的方法,其中,所述获取rgb输入图像,使用不同的架构来编码并提取有辨识性的频率表征,包括:

4.根据权利要求1所述的方法,其中,所述使用频率表征推理模块,聚合频率表征,包括:

5.根据权利要求1所述的方法,其中...

【专利技术属性】
技术研发人员:李甲夏长群谢晨熹于天舒赵沁平
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1