基于可学习提议和激活图的小目标识别方法技术

技术编号:39573300 阅读:7 留言:0更新日期:2023-12-03 19:25
本发明专利技术公开了一种基于可学习提议和激活图的小目标识别方法,包括:构建小目标识别网络,该小目标识别网络包括骨干网络

【技术实现步骤摘要】
基于可学习提议和激活图的小目标识别方法


[0001]本专利技术属于图像处理
,具体涉及一种基于可学习提议和激活图的小目标识别方法


技术介绍

[0002]随着无人机技术的发展,在当今社会,无人机视角下目标检测已经成为人们日常生活和各领域工作中的重要应用之一,通过无人机拍摄的图像或视频,结合目标检测算法等技术手段,可以快速

准确地识别和定位目标,如人



建筑物

农作物等

它能够广泛地应用到公共安全

建筑工程

农业等领域中,如进行情报收集

监测火灾

检测建筑物损伤

监测农作物生长状态等

[0003]但是由于无人机视角场景,目标分布不均匀,目标尺度小且尺度变化大等特性,传统的目标检测方法无法适应无人机视角场景

而目前的无人机视角的小目标检测器,主要在两个方面有所欠缺

首先是模型的复杂度,现有无人机视角的小目标检测器通常通过两个阶段的检测,首先使用粗糙检测器粗略检测目标分布,再使用精细检测器细化目标的分布

它们通常没法做到端到端的实施,结果过于复杂

其次是模型的效率,现有无人机视角的小目标检测器为了适应分布不均匀和尺度小的难题,会根据目标分布将图片切成多个子图然后再分别检测,最后将检测结果融合,但是这样的方式非常耗时,且会存在子图截断目标等情况

[0004]而近期新出现的基于可学习提议的目标检测器如
Sparse R

CNN
等,能够让提议自动学习目标分布,且因为采用一对一的训练策略,无需非极大值抑制后处理,在密集情况下,不会错误滤掉正确目标

但是这种基于可学习提议的目标检测器仍然无法适应无人机视角中极端尺度变化的情况,且会有大量的可学习提议检测到无用区域从而影响效率


技术实现思路

[0005]为了解决现有技术中存在的上述问题,本专利技术提供了一种基于可学习提议和激活图的小目标识别方法

本专利技术要解决的技术问题通过以下技术方案实现:
[0006]本专利技术提供了一种基于可学习提议和激活图的小目标识别方法,包括:
[0007]构建基于可学习提议和激活图的小目标识别网络,所述小目标识别网络包括骨干网络

特征金字塔网络

激活图生成网络

尺度分离可学习提议模块和动态头,其中,所述骨干网络和所述特征金字塔网络用于获得原始图像具有不同尺度和语义信息的多级特征图,所述激活图生成网络用于对所述多级特征图进行处理,获得不同尺度等级的激活图;所述尺度分离可学习提议模块用于通过可学习提议框提取不同尺度等级的特征图上的感兴趣区域特征,并通过将所述感兴趣区域特征与可学习提议特征进行交互,然后通过所述动态头生成新的可学习提议,通过不断细化可学习提议最终得到识别结果;
[0008]利用训练数据集对所述小目标识别网络进行训练,获得训练后的小目标识别网络;
[0009]将待识别的原始图像输入所述训练后的小目标识别网络,获得识别结果

[0010]在本专利技术的一个实施例中,所述激活图生成网络生成的激活图的数量与所述特征金字塔网络输出的多级特征图的数量相同,激活图生成网络包括多个卷积核大小为3×3的卷积块

[0011]在本专利技术的一个实施例中,所述激活图生成网络的激活图伪标签为:
[0012][0013][0014]其中,表示所有
A
b
的并集,
D(x,y)
表示点
(x,y)
到目标
(x
c
,y
c
,w,h)
中心点的欧式距离
(x
c
,y
c
)
表示目标的中心点坐标,
w,h
表示目标边界框的宽和高,
r
a

r
的倍数

[0015]在本专利技术的一个实施例中,所述激活图生成网络的激活图损失函数为:
[0016]L

FL(A,A
GT
)

[0017]其中,
FL
表示
Focal Loss

Focal Loss
的表达式为:
[0018]L
fl


(1

p
t
)
γ
log(p
t
)

[0019]其中,其中,表示所述激活图生成网络预测样本属于正样本的概率,
γ
为可调参数,
y
表示标签,值为0或
1。
[0020]在本专利技术的一个实施例中,所述尺度分离可学习提议模块包括多个可学习提议,所述多个可学习提议根据目标尺度等级划分为多个尺度组,将目标利用目标尺度分离策略划分为不同的尺度等级,并分配至对应的尺度组,其中,所述目标尺度分离策略为:
[0021]对于一个目标
b

(x
c
,y
c
,w,h)
,其中,
(x
c
,y
c
)
表示目标的中心点,
w,h
表示目标边界框的宽和高,将目标
b
划分为不同的尺度等级的划分公式为:
[0022][0023]其中,
A
表示划分的尺度等级,
l0,
s
为经验阈值

[0024]在本专利技术的一个实施例中,在训练阶段进行训练样本集中的训练样本分配时,目标标签根据其所在的尺寸等级分配至对应等级的特征图上计算损失函数,以保证特定等级尺度组的可学习提议仅预测特定尺寸等级的目标

[0025]在本专利技术的一个实施例中,所述尺度分离可学习提议模块包括多个可学习提议,每个可学习提议包括一个可学习提议框和一个可学习提议特征,每个可学习提议框包含四个参数:可学习提议框中心的横坐标和纵坐标以及可学习提议框的宽度和高度,用于获得提议框区域内的感兴趣区域;所述可学习提议特征包括一个一维特征,所述一维特征能够
与所述感兴趣区域进行交互作用,将得到的特征送入对应的动态头中

[0026]在本专利技术的一个实施例中,所述可学习提议的数量大于训练过程中训练样本集中目标的数量

[0027]在本专利技术的一个实施例中,所述训练数据集中包括多个训练图像,所述训练图像包括目标标签,所述目标标签包含目标的类别以及目标的宽度
...

【技术保护点】

【技术特征摘要】
1.
一种基于可学习提议和激活图的小目标识别方法,其特征在于,包括:构建基于可学习提议和激活图的小目标识别网络,所述小目标识别网络包括骨干网络

特征金字塔网络

激活图生成网络

尺度分离可学习提议模块和动态头,其中,所述骨干网络和所述特征金字塔网络用于获得原始图像具有不同尺度和语义信息的多级特征图,所述激活图生成网络用于对所述多级特征图进行处理,获得不同尺度等级的激活图;所述尺度分离可学习提议模块用于在所述激活图的引导下通过可学习提议框提取不同尺度等级的特征图上的感兴趣区域特征,并通过将所述感兴趣区域特征与可学习提议特征进行交互,然后通过所述动态头生成新的可学习提议,通过不断细化可学习提议最终得到识别结果;利用训练数据集对所述小目标识别网络进行训练,获得训练后的小目标识别网络;将待识别的原始图像输入所述训练后的小目标识别网络,获得识别结果
。2.
根据权利要求1所述的基于可学习提议和激活图的小目标识别方法,其特征在于,所述激活图生成网络生成的激活图的数量与所述特征金字塔网络输出的多级特征图的数量相同,激活图生成网络包括多个卷积核大小为3×3的卷积块
。3.
根据权利要求2所述的基于可学习提议和激活图的小目标识别方法,其特征在于,所述激活图生成网络的激活图伪标签为:述激活图生成网络的激活图伪标签为:其中,表示所有
A
b
的并集,
D(x,y)
表示点
(x,y)
到目标
(x
c
,y
c
,w,h)
中心点的欧式距离
(x
c
,y
c
)
表示目标的中心点坐标,
w,h
表示目标边界框的宽和高,
r
a

r
的倍数
。4.
根据权利要求3所述的基于可学习提议和激活图的小目标识别方法,其特征在于,所述激活图生成网络的激活图损失函数为:
L

FL(A,A
GT
)
,其中,
FL
表示
Focal Loss

Focal Loss
的表达式为:
L
fl


(1

p
t
)
γ
log(p
t
)
,其中,其中,表示所述激活图生成网络预测样本属于正样本的概率,
γ
为可调参数,
...

【专利技术属性】
技术研发人员:钱学明尹能中刘成旭赵国帅薛尧
申请(专利权)人:陕西域览九州智能光电科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1