一种改进YOLOX网络结构的小目标检测方法技术

技术编号：35831411 阅读：22 留言：0更新日期：2022-12-03 14:00

本发明专利技术涉及目标检测技术领域，具体涉及一种改进YOLOX网络结构的小目标检测方法，通过引入CSPDarkNet网络并进行改进，将多尺度空间金字塔池化层、全局自注意力和多尺度特征融合等模块融入网络模型中，能够从复杂数据集中提取图像的小目标特征，准确地检测小目标的定位与有效检测。主要解决三个方面技术问题，一是针对有限使用最大池化卷积使顶层卷积变得过于稀疏，导致所提取的特征不完整的问题；二是针对CNN缺乏全局建模、长距离建模的能力问题；三是针对单一层次提取的特征，会造成最终的预测结果与真实情况相差甚远的问题。测结果与真实情况相差甚远的问题。测结果与真实情况相差甚远的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种改进YOLOX网络结构的小目标检测方法

[0001]本专利技术涉及目标检测
，具体涉及一种改进YOLOX网络结构的小目标检测方法。

技术介绍

[0002]YOLOX是在2021年被提出的基于YOLO算法的一种目标检测方法，并且开发者团队一直在对YOLOX网络模型进行改进和维护，因此基于YOLOX网络结构的目标检测方法得到了广泛的应用。
[0003]然而现有的基于YOLOX网络结构的小目标检测方法存在以下缺点：
[0004]1、在特征提取阶段，使用有限核尺寸的最大池化会使高层卷积变得过于稀疏，捕获全局特征信息的能力下降，造成局部和远距离的特征信息丢失，导致所提取的特征不完整。对于目标检测而言，目标的呈现形态复杂多变，当卷积网络进行特征提取时，若网络无法从全局的角度去提取目标特征，会使得最终的预测结果丢失大量的细节信息，从而导致检测的准确率降低。
[0005]2、YOLOX主干特征提取网络为CNN网络，CNN具有平移不变性和局部性，缺乏全局建模、长距离建模的能力。
[0006]3、低层特征具有较高的分辨率，包含更多的位置和细节信息，但语义较低，噪声较大。高层特征语义信息较强，但分辨率很低，对细节的感知较差。对于小目标检测而言，物体呈现复杂多变，例如物体变形，遮挡物体，重叠物体等，而且实际捕捉的图像中小目标的数目在整个图像像素中占比少，所以仅使用单一层次的卷积进行特征提取，会造成最终的预测结果与真实情况相差甚远。

技术实现思路

[0007]本专利技术的目的在于提供一...

【技术保护点】

【技术特征摘要】
1.一种改进YOLOX网络结构的小目标检测方法，其特征在于，包括下列步骤：选择CSPDarkNet网络作为骨干网络进行初始化；在CSPDarkNet网络的第五层嵌入多尺度空间金字塔池化模块；在CSPDarkNet网络的第二层、第五层与路径聚合特征金字塔之间嵌入全局自注意力模块；在原始路径聚合特征金字塔的C3_P3与C3_n3之间嵌入全局自注意力模块构成多尺度融合模块；训练及评估改进后的CSPDarkNet网络模型，用于小目标检测。2.如权利要求1所述的改进YOLOX网络结构的小目标检测方法，其特征在于，在CSPDarkNet网络的第五层嵌入多尺度空间金字塔池化模块的过程，具体为将第二层卷积特征提取的位置信息与语义信息输入到多尺度特征融合阶段，并将第五层的空间金字塔池化层替换成多尺度空间金字塔池化模块。3.如权利要求2所述的改进YOLOX网络结构的小目标检测方法，其特征在于，所述多尺度空间金字塔池化模块通过3
×
3、5
×
5、9
×
9、13
×
13、17
×
17池化核尺寸来增加感受野提取的特征信息数量，与原空间金字塔池化层的不同在于针对局部信息增加小核池化卷积3
×
3，对于全局信息提取增加17
×
17的大核池化卷积。4.如权利要求1所述的改进YOLOX网络结构的小目标检测方法，其特征在于，在CSPDarkNet网络的第二层、第五...

【专利技术属性】
技术研发人员：瞿中，王升烨，樊骏雅，李翠锦，高乐园，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人