一种类注意力机制构建方法及目标检测方法技术

技术编号：35590984 阅读：32 留言：0更新日期：2022-11-16 15:08

本发明专利技术提供了一种类注意力机制构建方法及目标检测方法。所述类注意力机制构建方法：对小特征图上采样并运算得到上采样权值，将上采样权值作用于大特征图得到过渡特征图，对过渡特征图下采样并运算得到下采样权值，将下采样权值作用于小特征图，该方法构建的类注意力机制增强了小特征图的几何信息；所述目标检测方法，将类注意力机制设计成算法模块，嵌入YOLOv3算法中，得到基于类注意力机制的YOLOv3算法，用于目标检测。本发明专利技术的有益效果可包括：改变传统注意力机制算法权值单一问题，提高了注意力效果；利用类注意力机制改进YOLOv3，在浮点运算量和网络复杂度增加不到1%的条件下，检测精度mPA高于同类算法Faster

全部详细技术资料下载

【技术实现步骤摘要】
一种类注意力机制构建方法及目标检测方法

[0001]本专利技术涉及人工智能领域，具体来讲，涉及图像中的目标检测。

技术介绍

[0002]目标检测的任务是找出图像或视频中的感兴趣目标对象，同时检测出它们的位置和大小。传统目标检测算法主要是将矩形窗口在整张图像上滑动，通过扫描图像来生成多个图像区域，然后从每个区域中提取局部图像特征，再将提取到的特征传递给传统机器学习分类器。虽然这些方法在某些特定场景下能够取得较好检测效果，但实时性较低。同时，特定环境或结构化场景已经不能满足现实需求，因此传统目标检测方法的应用场景非常有限。
[0003]卷积神经网络CNN（Convolutional Neural Network）由于其可映射任意复杂的非线性关系，具有强大的特征提取能力，提升了目标检测的速度和精度，因此基于CNN的目标检测算法已成为检测任务的首选。基于CNN的目标检测算法主要分为三类：（1）基于R
‑
CNN（Region with Convolutional Neural Network）的检测算法，如R
‑
CNN、Fast R
‑
CNN、及Faster R
‑
CNN，由于计算开销大或小目标检测精度低等原因，该类算法未能得到很好的应用。（2）基于SSD（Single Shot Multi Detector）的算法，如SSD、DSSD（Deconvolutional Single Shot Multi Detector），会出现小目标漏检情况。（...

【技术保护点】

【技术特征摘要】
1.一种类注意力机制构建方法，其特征在于：对小特征图上采样并进行运算得到上采样权值，作用于大特征图得到过渡特征图，对过渡特征图下采样并进行运算得到下采样权值，将下采样权值作用于小特征图，该方法构建的类注意力机制增强了小特征图的几何信息；所述构建的类注意力机制的输入为不同大小分辨率的特征图；所述小特征图是分辨率较小的特征图；所述大特征图是分辨率较大的特征图；所述对小特征图上采样是对小特征图补0填充后卷积（卷积核大小为3，步长1），得到上采样特征图；所述进行运算得到上采样权值是利用Sigmoid函数对上采样特征图进行计算，得到上采样权值；所述作用于大特征图得到过渡特征图是将上采样权值与大特征图逐元素相乘再相加，得到过渡特征图；所述对过渡特征图下采样是对过渡特征图卷积（卷积核大小为3，步长2），得到下采样特征图；所述进行运算得到下采样权值是利用Sigmoid函数对下采样特征图进行计算，得到下采样权值；所述将下采样权值作用于小特征图是将下采样权值与小特征图逐元素相乘再相加。2.目标检测方法，其特征在于，将权利要求1中所述构建的类注意力机制设计成算法模块，嵌入YOLOv3算法中，得到基于类注意力机制的YOLOv3算法，并用于目标检测；所述将构建的类注意力机制设计成算法模块是用Python语言，将类注意力机制编写成程序模块；所述嵌入YOLOv3算法中，得到基于类注意力机制的YOLOv3算法，是将程序模块分别嵌入到宿主算法YOLOv3骨干网络DarkNet
‑
53的第一个模块和第二个模块之后；所述用于目标检测包括以下步骤：S1、用训练数据集对基于类注意力机制的YOLOv3算法进行模型训练，得到模型参数；S2、加载模型参数，用测试数据集进行测试；基于类注意力机制的YOLOv3算法进行模型训练包括以下步骤：S101、设置初始学习率α=0.001，动量参数momentum=0.9，权重衰减系数γ=0.0005，每批图像数batchsize=4，交并比IOU（Intersection
‑
over
‑
...

【专利技术属性】
技术研发人员：李自胜，胡朝海，肖晓萍，
申请(专利权)人：西南科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人