无人机平台多尺度目标检测方法和装置制造方法及图纸

技术编号:28504145 阅读:22 留言:0更新日期:2021-05-19 22:54
本发明专利技术公开了一种无人机平台多尺度目标检测方法,使用无监督学习对训练集的目标框进行聚类,引入空洞卷积,通过网络对多尺度目标特征进行提取,加入正负样本平衡的方式;在训练阶段,加入图像增强技术;使用正则化方法,进一步优化网络结构;在后处理阶段,使用soft

【技术实现步骤摘要】
无人机平台多尺度目标检测方法和装置


[0001]本专利技术属于无人机目标检测
涉及一种基于无人机平台的多尺度目标检测算法方案,尤其涉及一种无人机平台多尺度目标检测方法、装置、存储介质以及计算机程序产品。

技术介绍

[0002]由于无人机移动平台的超高机动性和环境的复杂性,航拍图像信噪比较低,目前通用的视频采集方案实现目标检测识别较为困难,主要原因包括:
[0003]图像质量低。受相机质量、恶劣环境、运动抖动等因素影响,航拍图像数据质量往往不够理想
[0004]目标易遮挡形变。目标对象之间相互遮挡,拍摄视角会随无人机飞行姿态而改变。
[0005]多尺度目标识别困难。待识别目标物理大小尺寸各异,并随着无人机飞行高度和相机视角而变化,小目标与背景难以分割、定位和分类。
[0006]对象的多样性。自然物体种类繁多,有限的模型网络资源难以应对众多目标种类的识别任务。
[0007]无人机体积小、供电能力弱、运行环境复杂、而目标检测算法对算力要求高,通常无法实现实时计算,而是把图像带回地面控制站统一处理。...

【技术保护点】

【技术特征摘要】
1.一种无人机平台多尺度目标检测方法,其特征在于所述方法使用无监督学习对训练集的目标框进行聚类,引入空洞卷积,通过网络对多尺度目标特征进行提取,加入正负样本平衡的方式;在训练阶段,加入图像增强技术;使用正则化方法,进一步优化网络结构;在后处理阶段,使用soft

NMS替换NMS,解决目标检测中的物体重叠难以预测,分类分数与IoU不匹配的问题;引入注意力机制,对通道间的依赖关系进行建模,自适应调整各通道的特征响应值。2.根据权利要求1所述的无人机平台多尺度目标检测方法,其特征在于,所述方法使用无监督学习算法k

means对训练集的目标框进行聚类,使用IOU作为距离函数,锚框的个数设计为3个,每个目标框返回5个参数,分别是位置坐标、目标框大小以及置信度评分偏移量:t
x
、t
y
、t
w
、t
h
、t
o
;假设网格左上角位置坐标为(C
x
,C
y
),锚框的宽高为(P
w
,P
h
),则目标框的位置和置信度评分的预测结果如下:其中b
x
,b
y
,b
w
,b
h
为目标框大小及位置坐标的实际预测结果,σ(t0)为目标框的置信度评分,c
x
和c
y
表示网格左上角点的位置坐标,p
w
和p
h
表示锚框的宽度及高度。3.根据权利要求1所述的无人机平台多尺度目标检测方法,其特征在于,所述空洞卷积为卷积层引入扩张率参数,所述参数定义了卷积核处理数据时各值的间距。4.根据权利要求1所述的无人机平台多尺度目标检测方法,其特征在于,所述正负样本平衡的方式为FocalLoss,在交叉熵损失函数上进行修改。5.根据权利要求1所述的无人机平台多尺度目标检测方法,其特征在于,所述训练阶段,加入图像扰动、随机裁剪、翻转、mixup以及其他图像增强技术。6.根据权利要求2所述的无人机平台多尺度目标检测方法,其特征在于,所述无监督学习算法k

means选择锚框初始个数为9个,平均分配到3种尺度进行目标检测,每种尺度预测3个box。7.根据权利要求6所述的无人机平台多尺度目标检测方法,其特征在于,所述无监督学习算法k

means使用逻辑回归判定每个边界框的目标评分,如果预测框与真值框重叠超过任何其他预测框或者预测框与真值框重叠超过某一阈值,则设置其目标评分1,根据目标评分结果选择对应的预测框在训练阶段利用二元交叉熵损失进行目标类别预测。8.根据权利要求1所述的无人机平台多尺度目标检测方法,其特征在于,所述空洞卷积为卷积层引入...

【专利技术属性】
技术研发人员:王斌金帅王礼健
申请(专利权)人:深圳中湾智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1