一种大规模遥感图像中不规则形状目标的检测方法及系统技术方案

技术编号:26172422 阅读:46 留言:0更新日期:2020-10-31 13:50
本发明专利技术涉及一种大规模遥感图像中不规则形状目标的检测方法及系统,包括:获取待检测遥感图像;将所述待检测遥感图像输入至预先训练的不规则形状目标检测网络,通过注意力机制捕获图像中目标物体的所在区域,给予高度关注,再利用可变形卷积对物体进行特征提取,提取丰富的可变形物体的特征,最后使用特征金字塔网络对浅层特征进行增强,以及全卷积神经网络对目标进行分类和回归,输出所述待检测遥感图像中的目标对应检测结果;本发明专利技术提供的技术方案中全部由卷积操作完成,不需要预先设定的回归框,目标识别过程中不需要物体具有明显的几何特征,简单高效,在处理形状不规则的非刚性物体方面精度和速度都有很大提升。

【技术实现步骤摘要】
一种大规模遥感图像中不规则形状目标的检测方法及系统
本专利技术涉及计算机视觉领域,具体涉及一种大规模遥感图像中不规则形状目标的检测方法及系统。
技术介绍
现有的目标检测技术主要面向的是刚性物体,刚性物体往往具有统一的形状特征,这使得网络可以通过学习目标物体的形状达到检测的目的。但是在现实生活中还存在许多非刚性物体,同一类别之内形状差异巨大,没有明显的几何特征。这些使得现有的目标检测技术检测非刚性物体时遇到了两个巨大困难,一是特征提取模块无法提取丰富的形状不规则物体特征,二是无法同时对多种形状很好地回归。首先在特征提取方面,卷积神经网络提出以后,在图像分类、目标检测、语义分割等领域取得了巨大的进展,但是常规的卷积操作往往只能捕获局部特征,无法对形状变化较大的不规则物体进行有效建模。可变形卷积则解决了这个问题,可变形卷积对卷积核中的每个采样点的位置都增加了一个offset。通过这些offset,卷积核就可以在当前位置附近随意的采样,实现对不规则物体的建模。但是在没有辅助监督的情况下,可变形卷积往往会额外捕获目标物体周围的多余信息,影响物体的本文档来自技高网...

【技术保护点】
1.一种大规模遥感图像中不规则形状目标的检测方法,其特征在于,所述方法包括:/n获取待检测遥感图像;/n将所述待检测遥感图像输入至预先训练的不规则形状目标检测网络,获取所述预先训练的不规则形状目标检测网络输出的所述待检测遥感图像中的目标对应检测结果;/n基于所述待检测遥感图像中的目标对应检测结果实现所述待检测遥感图像中的目标的目标识别。/n

【技术特征摘要】
1.一种大规模遥感图像中不规则形状目标的检测方法,其特征在于,所述方法包括:
获取待检测遥感图像;
将所述待检测遥感图像输入至预先训练的不规则形状目标检测网络,获取所述预先训练的不规则形状目标检测网络输出的所述待检测遥感图像中的目标对应检测结果;
基于所述待检测遥感图像中的目标对应检测结果实现所述待检测遥感图像中的目标的目标识别。


2.如权利要求1所述的方法,其特征在于,所述预先训练的不规则形状目标检测模型的获取过程包括:
步骤1.人工标注遥感图像数据中遥感图像的检测目标的类别和边界框;
步骤2.将所述遥感图像数据划分为训练数据和测试数据;
步骤3.利用所述训练数据和测试数据对初始不规则形状目标检测网络进行训练,并将训练完成的初始不规则形状目标检测网络为所述预先训练的不规则形状目标检测网络。


3.如权利要求2所述的方法,其特征在于,所述初始不规则形状目标检测网络包括:基础卷积神经网络、注意力模块、第一可变形卷积神经网络、第二可变形卷积神经网络、第一特征金字塔网络、第二特征金字塔网络、第三特征金字塔网络和全卷积神经网络;
所述基础卷积神经网络,用于提取输入图像的第一层特征;
所述注意力模块,用于基于所述输入图像的第一层特征提取输入图像的第二层特征;
所述第一可变形卷积神经网络,用于基于所述输入图像的第二层特征提取输入图像的第三层特征;
所述第二可变形卷积神经网络,用于基于所述输入图像的第三层特征提取输入图像的第四层特征;
所述第一特征金字塔网络,用于当所述输入图像各像素的回归距离最大值在0-32之间时,将所述输入图像的第四层特征经过1×1卷积执行卷积操作后得到第一降维特征,并将所述第一降维特征经过3×3卷积执行卷积操作;
所述第二特征金字塔网络,用于当所述输入图像各像素的回归距离最大值在32-128之间时,将所述输入图像的第三层特征经过1×1卷积执行卷积操作后得到第二降维特征,将所述第一降维特征通过2倍上采样与所述第二降维特征融合得到第一融合特征,并将所述第一融合特征经过3×3卷积执行卷积操作;
所述第三特征金字塔网络,用于当所述输入图像各像素的回归距离最大值在128-∞之间时,将所述输入图像的第二层特征经过1×1卷积执行卷积操作后得到第三降维特征,将所述第二降维特征通过2倍上采样与所述第三降维特征融合得到第二融合特征,并将所述第二融合特征经过3×3卷积执行卷积操作;
所述全卷积神经网络,用于分别对第一特征金字塔网络的输出特征、第二特征金字塔网络的输出特征和第三特征金字塔网络的输出特征进行分类回归。


4.如权利要求3所述的方法,其特征在于,所述基础卷积神经网络具体用于:
按下式提取输入图像中每一空间点p对应第一层特征中的特征y1p:



上式中,xp为输入图像中空间点p的像素坐标值,K为卷积操作所需的空间采样点总数,wk为卷积操作的第k个空间采样点的权重,pk为对应于空间点p...

【专利技术属性】
技术研发人员:孙显付琨闫志远刁文辉闫梦龙刘迎飞王佩瑾武斌李霁豪
申请(专利权)人:中国科学院空天信息创新研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1