一种基于鲁棒采样和混合注意力金字塔的目标检测方法技术

技术编号:34388635 阅读:30 留言:0更新日期:2022-08-03 21:14
本发明专利技术公开了一种基于鲁棒采样和混合注意力金字塔的目标检测方法,包括步骤:基于输入图像生成的候选样本框集合设计鲁棒性训练样本采样策略,构建鲁棒性更强的正负训练样本集合;利用正负训练样本集合对全卷积目标检测网络模型进行训练,将空间注意力机制和通道注意力机制与全卷积目标检测网络模型中的金字塔特征提取模块进行融合,设计出多种结构的混合注意力特征金字塔模块;设计出由教师

【技术实现步骤摘要】
一种基于鲁棒采样和混合注意力金字塔的目标检测方法


[0001]本专利技术属于模式识别
,具体涉及一种视频图像标注文字的合规性检验方法。

技术介绍

[0002]目前,在计算机视觉领域中,目标检测是最重要的任务之一,用于支持实例级识别任务以及下游应用,例如智能视频监控、自动驾驶、智慧城市等方面。单阶段检测方法相比两阶段检测方法具有更简单的设计和更有竞争力的性能优势,逐渐成为了目标检测领域的主流方法。文献“FCOS:Fully Convolutional One

Stage Object Detection”以每像素预测的方式进行检测,相比RetinaNet、SSD、YOLO v3这类依赖于预先设定的锚框,避免了与锚框相关的复杂计算,如训练过程中计算IoU分数,更为重要的是,避免了与锚框相关的超参数,这些超参数通常对最终检测性能敏感。文献“Bridging the Gap Between Anchor

based and Anchor

free Detection via Adapti本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于鲁棒采样和混合注意力金字塔的目标检测方法,其特征在于,包括如下步骤:步骤1:基于输入图像构建正训练样本和负训练样本集合;步骤1

1:图像中每个目标的真实框建立一个候选正样本集合,对于特征金字塔的每一层,将与该层特征金字塔对应的候选锚框中心在真实框内部且与真实框中心的L2距离排名前十的候选锚框挑选出来;其中,分别表示第p个维度的两个向量对应的数值,I1、I2分别表示两个同等维度的向量,p表示第p个维度,d2(.)表示L2距离;步骤1

2:采用式(2)计算步骤1

1挑选出的候选锚框与真实框的A
g
值:值:值:其中,b表示候选锚框中心与真实框中心点之间的欧几里得距离;g表示能够同时覆盖候选锚框与真实框的最小框的对角线距离,AR表示宽高比;x1、x2分别表示锚框的左下角横坐标和右上角横坐标,y1、y2分别表示锚框的左下角纵坐标和右上角纵坐标,A、B分别表示候选锚框与真实框,AR
A
、AR
B
分别表示候选锚框与真实框的宽高比;步骤1

3:根据步骤1

2计算得到的结果建立正态分布,进行建模拟合,计算均值和标准差,进而划定正样本阈值;步骤1

4:将步骤1

2计算得到的A
g
值结果中高于正样本阈值的数值所对应的候选锚框挑选出来作为正样本集合,其余部分作为负样本集合;步骤2:构建基于混合注意力特征金字塔的全卷积目标检测网络模型,并利用正样本集合和负样本集合作为训练集对全卷积目标检测网络模型进行训练;步骤2

1:所述基于混合注意力特征金字塔的全卷积目标检测网络模型包括主干网络模块、混合注意力模块和头部解码模块;步骤2

2:所述主干网络模块使用ResNet

50或ResNeXt

64x4d

101;步骤2

3:所述混合注意力模块由通道注意力模块和空间注意力模块串联,通道注意力层在前,空间注意力层在后,具体如下:构造通道注意力层:输入图像经过特征提取层后,特征图的大小设定为(w,h,c),w、h、c分别表示特征图的宽度、高度和深度;每个分支的特征图分为四个分支,第一分支经过最大池化层后得到形状为(1,1,c)的特征图,再经过两个1
×
1卷积先降维后升维,得到用于表示特征图之间的相关性向量(1,1,c);第二分支经过最大池化层后变为形状为(1,1,c)的特征图,进行压缩转置为形状为(c,1)大小的向量,再经过3
×
3的一维卷积层后得到形状为(c,1)大小的向量,再经过转置扩张恢复成形状为(1,1,c)的特征图;第三分支经过平均池化层后得到形状为(1,1,c)的特征图,进行压缩转置为形状为(c,1)大小的向量,再经过3
×
3的
一维卷积层后得到形状为(c,1)大小的向量,再经过转置扩张恢复为形状为(1,1,c)的特征图;第四分支经过平均池化层后得到形状为(1,1,c)的特征图,再经过两个1
×
1卷积先降维后升维,得到用于表示特征图之间的相关性向量(1,1,c);四个分支叠加起来经过Sigmoid函数归一化到0~1之间后,将得到的权重向量与输入的特征图相乘,得到通道注意力特征图;构造空间注意力层:通道注意力特征图大小设定为(w,h,c),分为两个分支,两个分支都经过1
×
1卷积降低特征数量得到形状为(w,h,c/2)的特征图,第一分支经过均值化计算模块得到形状为...

【专利技术属性】
技术研发人员:张秀伟郭炜张艳宁倪涵尹翰林孙怡
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1