一种基于快速分组残差模块的单特征无锚框目标检测方法技术

技术编号:37544198 阅读:23 留言:0更新日期:2023-05-12 16:14
本发明专利技术适用于计算机视觉深度学习技术领域,涉及一种基于快速分组残差模块的单特征无锚框目标检测方法,包括:S10、图像增强;S20、构建目标检测网络;S30、预测得到目标类别概率向量、目标位置距离向量和目标关键度的概率向量;S40、计算分类分支误差、位置分支误差和关键度分支误差,并更新目标检测网络的参数,直至迭代次数达到预设次数;S50、将待检测图像输入到迭代次数达到预设次数时所得到的模型中,得到图像的目标类别概率向量、目标位置距离向量和目标关键度的概率向量,利用关键度分支对预测的类别得分进行调整,并得到最后的目标分类置信度和目标位置。本发明专利技术流程简单、检测精度高,降低了模型的参数量,提高了模型的检测速度。速度。速度。

【技术实现步骤摘要】
一种基于快速分组残差模块的单特征无锚框目标检测方法


[0001]本专利技术属于计算机视觉深度学习
,尤其涉及一种基于快速分组残差模块的单特征无锚框目标检测方法。

技术介绍

[0002]如今,人工智能技术正在迅速地改变着我们的世界。作为智能世界的双眸,计算机视觉是人工智能技术的一大分支,它通过采集数字图像、视频或其他视觉输入信号并用深度学习模型训练,使得计算机可以准确地进行识别和分类,然后对其“看到”的内容做出反应。目标检测,其任务是在图像中定位出目标边框的位置并识别该目标所属的类别,目标检测广泛应用于科学研究和实际生产生活等下游任务中。
[0003]以FCOS和FoveaBox为代表的密集点预测方法为了提高检测效果,一方面使用重新赋权方法来提高检测质量,另一方面使用FPN分而治之的解决方案即人工指定不同尺度让目标落入相应特征图来帮助检测器分离重叠的目标,训练时将目标指定到某一层上学习,这本质上是“锚框”的另一种形式,每一层的每个检测点都有一个隐形的固定大小的方形锚框。由于每一个特征层都需要有一个对应的检测头,大量的参数造成检测速度慢。公开号为CN112818964A的专利提供了基于FoveaBox无锚神经网络的无人机检测方法,首先设定FoveaBox神经网络模型的初始参数,将无人机数据库中的训练集图像输入设定的FoveaBox神经网络模型进行训练,得到基于深度学习的无人机检测模型;将待检测的无人机图像输入到步骤一训练好的无人机检测模型,得到多层预测目标可能性的特征图;接着通过位置子网络对主干网的输出特征图进行处理,并结合检测头部子网络对主干网的输出特征图进行逐像素的分类,直接检测获取目标类型及位置信息。此专利也是采用现有技术中常用的foveaBox无锚神经网络,虽然保证了适用范围与通用性,但是在检测速度上仍然存在弊端。
[0004]因此,如何提供一种在保证目标检测精度的同时,检测速度还快的目标检测方法是本
人员亟待解决的问题。

技术实现思路

[0005]针对现有技术的不足,本专利技术的目的是提供一种基于快速分组残差模块的单特征无锚框目标检测方法,以解决现有技术中目标检测方法检测速度慢的问题;另外本专利技术还提供了一种基于快速分组残差模块的单特征无锚框目标检测介质及终端。
[0006]为了解决上述技术问题,本专利技术采用了如下的技术方案:
[0007]第一方面,本专利技术提供了一种基于快速分组残差模块的单特征无锚框目标检测方法,包括以下步骤:
[0008]S10、对训练样本图像进行图像增强;
[0009]S20、构建基于快速分组残差模块的单特征无锚框目标检测网络,包括经过裁剪的RepVGG网络、含有快速分组残差模块的U型特征融合网络及检测头,所述检测头包括分类分支网络、位置分支网络和关键度分支网络;
[0010]S30、将所述步骤S10增强后的训练样本输入所述步骤S20的目标检测网络中,预测得到目标类别概率向量、目标位置距离向量和目标关键度的概率向量;
[0011]S40、采用正负样本优化策略标记正负样本,根据所述步骤S30中预测得到的向量与真实的向量分别计算分类分支误差、位置分支误差和关键度分支误差,并基于所述分类分支误差、位置分支误差和关键度分支误差更新所述目标检测网络的参数,直至迭代次数达到预设次数;
[0012]S50、将迭代次数达到预设次数时所得到的模型作为训练好的所述目标检测网络模型的参数,将待检测图像输入到所述目标检测网络中,得到图像的目标类别概率向量、目标位置距离向量和目标关键度的概率向量,利用关键度分支对预测的类别得分进行调整,并得到最后的目标分类置信度和目标位置。
[0013]进一步的,所述步骤S10中,图像增强包括随机调整亮度、色度和对比度;对图像进行裁剪;以50%概率对图像进行随机左右翻转;以50%概率对图像进行随机缩放,其中缩小倍数不低于原始图像的0.5倍,放大倍数不高于原始图像的3倍;以30%的概率对图像进行随机马赛克拼接;最后得到增强后的图像数据I∈R
H
×
W
×3,其中H和W分别是原始图像的长和宽,3为图像通道数。
[0014]进一步的,所述步骤S20的具体步骤如下:
[0015]S201、使用修改后的RepVGG

A0作为骨干网络,仅保留RepVGG

A0中C3和C4两层特征层,特征层步长分别为8和16,特征图通道数分别为96和192;
[0016]S202、调整输入U型特征融合网络的通道数,设输出特征层通道数为N,若C3或C4的通道数不等于则使用1
×
1卷积将其通道数调整为分别记为D3和D4,否则直接记为D3和D4;使用分组为4且步长为2的3
×
3卷积、分组为4且步长为2的1
×
1卷积和残差连接并行组成的三分支分组卷积块对C4进行两次下采样,分别记为D5和D6,其通道数均为
[0017]S203、将特征D6输入快速分组残差模块得到P6;
[0018]S204、使用双线性插值对P6上采样,将特征图P6放大到与前一层D5相同的大小,接着将D5与P6串联起来得到通道数为N的特征图,最后将串联后的特征输入所述步骤S203中的快速分组残差模块得到P5;
[0019]S205、对D4和D3重复所述步骤S203到S204,分别得到P4和P3,最后仅取P3作为最终的特征层;
[0020]S206、对P3分别使用两个输入和输出通道数均为N的三分支分组卷积块,分别记为P3'和P
3”;对P3'使用一个输出通道数为C的1
×
1卷积生成分类分支,C为类别数,得到P3层各像素点各类别概率向量其中i为P3上像素点横坐标,j为P3上像素点纵坐标,c为类别编号,c={1,
···
,C};对P
3”使用一个输出通道数为4的1
×
1卷积生成定位分支,得到P3层各像素点到边界框的位置距离向量;对P
″3使用一个输出通道数为1的1
×
1卷积生成关键度分支,得到P3层各像素点关键度的概率
向量
[0021]进一步的,所述步骤S203中的快速分组残差模块的具体构建步骤如下:
[0022]S231、记输入快速分组残差模块的特征数据为F0,首先连续使用三个分组为4的3
×
3卷积、分组为4的1
×
1卷积和残差连接并行组成的三分支分组卷积块进行特征提取,其卷积层的输入通道与输出通道数相等,并且保存每次经过三分支分组卷积块后的特征信息,并分别记为与
[0023]S232、加入混淆模块,并且每层输出特征都与输入特征F0进行残差连接:
[0024][0025][0026][0027]其中,是3
×
3卷积,是1
×
1卷积,δ是ReLU激活函数;
[0028]S233、将特征信息F0、与共4层串本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于快速分组残差模块的单特征无锚框目标检测方法,其特征在于,包括以下步骤:S10、对训练样本图像进行图像增强;S20、构建基于快速分组残差模块的单特征无锚框目标检测网络,包括经过裁剪的RepVGG网络、含有快速分组残差模块的U型特征融合网络及检测头,所述检测头包括分类分支网络、位置分支网络和关键度分支网络;S30、将所述步骤S10增强后的训练样本输入所述步骤S20的目标检测网络中,预测得到目标类别概率向量、目标位置距离向量和目标关键度的概率向量;S40、采用正负样本优化策略标记正负样本,根据所述步骤S30中预测得到的向量与真实的向量分别计算分类分支误差、位置分支误差和关键度分支误差,并基于所述分类分支误差、位置分支误差和关键度分支误差更新所述目标检测网络的参数,直至迭代次数达到预设次数;S50、将迭代次数达到预设次数时所得到的模型作为训练好的所述目标检测网络模型的参数,将待检测图像输入到所述目标检测网络中,得到图像的目标类别概率向量、目标位置距离向量和目标关键度的概率向量,利用关键度分支对预测的类别得分进行调整,并得到最后的目标分类置信度和目标位置。2.根据权利要求1所述的一种基于快速分组残差模块的单特征无锚框目标检测方法,其特征在于,所述步骤S10中,图像增强包括随机调整亮度、色度和对比度;对图像进行裁剪;以50%概率对图像进行随机左右翻转;以50%概率对图像进行随机缩放,其中缩小倍数不低于原始图像的0.5倍,放大倍数不高于原始图像的3倍;以30%的概率对图像进行随机马赛克拼接;最后得到增强后的图像数据I∈R
H
×
W
×3,其中H和W分别是原始图像的长和宽,3为图像通道数。3.根据权利要求1所述的一种基于快速分组残差模块的单特征无锚框目标检测方法,其特征在于,所述步骤S20的具体步骤如下:S201、使用修改后的RepVGG

A0作为骨干网络,仅保留RepVGG

A0中C3和C4两层特征层,特征层步长分别为8和16,特征图通道数分别为96和192;S202、调整输入U型特征融合网络的通道数,设输出特征层通道数为N,若C3或C4的通道数不等于则使用1
×
1卷积将其通道数调整为分别记为D3和D4,否则直接记为D3和D4;使用分组为4且步长为2的3
×
3卷积、分组为4且步长为2的1
×
1卷积和残差连接并行组成的三分支分组卷积块对C4进行两次下采样,分别记为D5和D6,其通道数均为S203、将特征D6输入快速分组残差模块得到P6;S204、使用双线性插值对P6上采样,将特征图P6放大到与前一层D5相同的大小,接着将D5与P6串联起来得到通道数为N的特征图,最后将串联后的特征输入所述步骤S203中的快速分组残差模块得到P5;S205、对D4和D3重复所述步骤S203到S204,分别得到P4和P3,最后仅取P3作为最终的特征层;S206、对P3分别使用两个输入和输出通道数均为N的三分支分组卷积块,分别记为P3'和
P
3”;对P3'使用一个输出通道数为C的1
×
1卷积生成分类分支,C为类别数,得到P3层各像素点各类别概率向量其中i为P3上像素点横坐标,j为P3上像素点纵坐标,c为类别编号,c={1,
···
,C};对P3”使用一个输出通道数为4的1
×
1卷积生成定位分支,得到P3层各像素点到边界框的位置距离向量对P
3”使用一个输出通道数为1的1
×
1卷积生成关键度分支,得到P3层各像素点关键度的概率向量4.根据权利要求3所述的一种基于快速分组残差模块的单特征无锚框目标检测方法,其特征在于,所述步骤S203中的快速分组残差模块的具体构建步骤如下:S231、记输入快速分组残差模块的特征数据为F0,首先连续使用三个分组为4的3
×
3卷积、分组为4的1
×
1卷积和残差连接并行组成的三分支分组卷积块进行特征提取,其卷积层的输入通道与输出通道数相等,并且保存每次经过三分支分组卷积块后的特征信息,并分别记为与S232、加入混淆模块,并且每层输出特征都与输入特征F0进行残差连接:进行残差连接:进行残差连接:其中,是3
×
3卷积,是1
×
1卷积,δ是ReLU激活函数;S233、将特征信息F0、与共4层串联,得到比输入特征F0通道数大4倍的新特征通道数大4倍的新特征其中,concat为串联操作;S234、用一个1
×
1卷积将特征F2通道数降低到与F0相同大小,并与F0相加作为局部特征融合得到特征层F3:其中,是1
×
1卷积,δ是ReLU激活函数,F3即为快速分组残差模块的输出结果。5.根据权利要求1所述的一种基于快速分组残差...

【专利技术属性】
技术研发人员:陶家俊刘伟胡为李小智
申请(专利权)人:湖南中医药大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1