基于YOLOX的光学遥感影像地物检测方法技术

技术编号:38145437 阅读:8 留言:0更新日期:2023-07-08 10:03
本发明专利技术公开一种基于YOLOX的光学遥感影像地物检测方法,首先设计了基于CBMA混合域卷积块注意力机制的特征提取模块,更加关注特征图中正样本特征信息。其次,在特征提取模块PANET加入了ASFF模块,以解决多尺度目标检测问题。最后,通过引入EIoU损失和VariFocalLoss损失,准确反映两个预测目标的真实距离误差,提升多目标检测性能。在DOTA数据集上进行实验,通过消融实验和对比实验验证了改进方法的最佳机制和有效性。在添加ASFF机制和CBAM注意力机制的前提下,改进网络模型mAP精度达70.75%,较原始网络提升了9.08%,与主流目标检测算法的对比实验结果表明提出的方法的有效性。对比实验结果表明提出的方法的有效性。对比实验结果表明提出的方法的有效性。

【技术实现步骤摘要】
基于YOLOX的光学遥感影像地物检测方法


[0001]本专利技术涉及遥感影像目标检测
,尤其涉及一种基于YOLOX的光学遥感影像地物检测方法。

技术介绍

[0002]遥感影像中的地物要素分类,在地形图测绘、情报侦察、城市规划和灾害应急响应等方面都具有重要的应用价值。与传统的自然图像不同,遥感影像含有大量典型目标信息,遥感影像背景复杂,特征图上干扰信息的多,目标分布密集的情况进一步加大了遥感图像目标检测的难度。经典的深度学习目标检测算法在这种复杂条件下精度低、易漏检。
[0003]近年来,基于深度学习的方法广泛应用于遥感影像地物检测。2016年,Joseph Redmon等人提出了YOLO模型[Redmon J,Divvala S,Girshick R,et al.You Only Look Once:Unified,Real

Time Object Detection[C]//Proceedings of 2016IEEE Conference on Computer Vision and Pattern Recognition.Piscataway:IEEE Press,2016:779

788.],依靠YOLO系列强大的特征提取能力涌现了大量的检测算法,在小目标、多尺度、多模态变化等具有挑战性的遥感检测场景,相较于原网络性能明显提升。然而以YOLO系列网络为代表的检测算法仍有改进优化的空间:多尺度特征提取中,对高层特征图中的弱小特征的加强提取不足,目标细节化特征和语义化作用发挥不明显;复杂背景下无法对无效特征信息进行抑制,正样本信息挖掘利用不充分;密集目标检测中,重合目标预测精度不高,回归不准确,易丢漏错漏;密集目标检测器分类中,前景类和背景类之间样本不平衡造成分类性能差等问题都有待进一步优化。

技术实现思路

[0004]本专利技术针对以YOLO系列网络为代表的检测算法目前存在的上述问题,提出一种基于YOLOX的光学遥感影像地物检测方法。
[0005]为了实现上述目的,本专利技术采用以下技术方案:
[0006]一种基于YOLOX的光学遥感影像地物检测方法,包括:
[0007]步骤1,对YOLOX进行改进;包括:首先,在主干网络特征图和采样层输出部分添加基于CBAM混合域卷积块的注意力机制,得到基于CBMA混合域卷积块注意力机制的特征提取模块,对高层特征图中的弱小特征进行加强提取;其次,在FPN特征金字塔提取网络中融合ASFF模块,通过扩大的感受野挖掘高级语义特征,来兼顾底层特征中的细粒度;最后,在YOLOHead检测模块中引入EIoU损失和VariFocalLoss损失,改化预测框模糊误差,直接计算真实误差,抑制无用信息,聚焦正面特征信息;
[0008]步骤2,基于改进后的YOLOX进行光学遥感影像地物检测。
[0009]进一步地,所述基于CBAM混合域卷积块的注意力机制用于首先逐通道提取全局特征,生成通道注意力特征图,并以此作为空间注意力的输入,最终生成混合域特征图。
[0010]进一步地,所述ASFF模块用于自适应地学习各尺度特征映射融合的空间权重,通
过学习权重参数的方式将不同层的特征融合到一起。通过引入ASFF结构,实现每一层的权重参数与特征相乘再相加的融合方式,能过滤其它层的特征,只保留该阶层有用的信息,使得提取的特征更加层次化。
[0011]进一步地,所述在FPN特征金字塔提取网络中融合ASFF模块包括:
[0012]在FPN特征金字塔提取网络的PANET特征提取模块中引入ASFF模块。
[0013]进一步地,所述在YOLOHead检测模块中引入EIoU损失和VariFocalLoss损失包括:
[0014]将YOLOX的IoU损失替换为EIoU损失,基于交叉熵损失函数,设置VariFocalLoss损失函数。
[0015]与现有技术相比,本专利技术具有的有益效果:
[0016]①
针对SPP特征金字塔网络结构在不同尺度上的不一致性,在多尺度检测阶段引入了自适应空间特征融合ASFF。通过在空间上过滤掉冲突信息来抑制多尺度不一致性。
[0017]②
在CSPDarknet主干网络输出和FPN特征金字塔提取部分,设计了基于CBAM混合域卷积块的注意力机制,使网络模型聚焦在感兴趣的局部信息中。
[0018]③
改进损失函数。
[0019](1)针对IoU损失不能准确反映两个预测目标的距离远近、相交比这一缺陷,引入EIoU损失,综合考虑了重叠面积,中心点距离、长宽边长真实差。
[0020](2)基于交叉熵损失函数,设置了VariFocalLoss损失函数。优化了密集目标训练中前景类和背景类之间极度不平衡的问题,使检测模型更加聚焦于高质量正向特征信息。
[0021]综上,本专利技术首先设计了基于CBMA混合域卷积块注意力机制的特征提取模块,更加关注特征图中正样本特征信息。其次,在特征提取模块PANET加入了自适应空间特征融合(ASFF)网络,以解决多尺度目标检测问题。最后,通过引入EIoU损失和VariFocalLoss损失,准确反映两个预测目标的真实距离误差,提升多目标检测性能。在DOTA数据集上进行实验,通过消融实验和对比实验验证了改进方法的最佳机制和有效性。在添加ASFF机制和CBAM注意力机制的前提下,改进网络模型mAP精度达70.75%,较原始网络提升了9.08%,与主流目标检测算法的对比实验结果表明提出的方法的有效性。
附图说明
[0022]图1为本专利技术实施例一种基于YOLOX的光学遥感影像地物检测方法改进后网络结构示意图;
[0023]图2为本专利技术实施例采用的DOTA数据集15个类别标注示例;
[0024]图3为本专利技术实施例原始网络和改进网络效果对比;其中(a)、(c)对应原始YOLOX网络;(b)、(d)对应本专利技术改进网络;
[0025]图4为本专利技术实施例数据集可视化和改进方法预测效果对比;其中(a)、(c)为原始数据集标签;(b)、(d)为改进方法实验检测效果。
具体实施方式
[0026]为了便于理解,对本专利技术的具体实施方式中出现的部分名词作以下解释说明:
[0027]YOLOX是旷世公司2021年8月提出的新型单阶段目标检测网络,创新使用了Focus主干网络、DecoupledHead预测分支解耦、Mosaic数据增强和AnchorFree机制。YOLOX网络在
YOLO系列里面具有代表性和突出性,选择在其基础上改进更好解决遥感影像目标检测问题。
[0028]下面结合附图和具体的实施例对本专利技术做进一步的解释说明:
[0029]本专利技术提出的一种基于YOLOX的光学遥感影像地物检测方法中改进后的YOLOX网络结构如图1所示,首先,我们在在主干网络特征图和采样层输出部分添加了基于混合域卷积注意力模块CBAM的特征提取模块,对高层本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于YOLOX的光学遥感影像地物检测方法,其特征在于,包括:步骤1,对YOLOX进行改进;包括:在主干网络特征图和采样层输出部分添加基于CBAM混合域卷积块的注意力机制,得到基于CBMA混合域卷积块注意力机制的特征提取模块,在FPN特征金字塔提取网络中融合ASFF模块,在YOLOHead检测模块中引入EIoU损失和VariFocalLoss损失;步骤2,基于改进后的YOLOX进行光学遥感影像地物检测。2.根据权利要求1所述的基于YOLOX的光学遥感影像地物检测方法,其特征在于,所述基于CBAM混合域卷积块的注意力机制用于首先逐通道提取全局特征,生成通道注意力特征图,并以此作为空间注意力的输入,最终生成混合域特征图。3.根据权利要求1所...

【专利技术属性】
技术研发人员:芮杰李美霖刘智杨松坤金飞王淑香林雨准左溪冰马莉朱艳
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1