一种基于注意力机制的行人检测模型制造技术

技术编号：23766270 阅读：26 留言：0更新日期：2020-04-11 20:00

本发明专利技术公开了一种基于注意力机制的行人检测模型，包括YOLOv3的多尺度预测结构、用于残差连接的通道注意力机构结构和用于残差连接的通道积空间注意力机制机构，YOLOv3的多尺度预测结构用能够提取到更丰富特征的基础神经网络、融合多个尺度的特征来进行检测的方法。本发明专利技术通过YOLOv3算法的实时检测性减少端到端行人目标检测算法中漏检和误检的情况，通过对于所提取出的特征向量进行充分的利用和修正，同时修改残差连接结构中的单一连接方式，使整个网络能更好地筛选出有利于后续检测的特征向量，其次，高效、低耗的检测算法能够更好地应用于智能设备或无人机之类的使用场景中，因此对回归型算法的改进研究也具有一定的现实意义。

A pedestrian detection model based on attention mechanism

全部详细技术资料下载

【技术实现步骤摘要】
一种基于注意力机制的行人检测模型
本专利技术涉及检测模型领域，特别涉及一种基于注意力机制的行人检测模型。
技术介绍
在机器翻译或者自然语言处理领域，使用数理统计的方法来进行分析和处理。近些年来，随着AlphaGo的兴起，除了在游戏AI领域，深度学习在计算机视觉领域，机器翻译和自然语言处理领域也有着巨大的用武之地。在2016年，随着深度学习的进一步发展，seq2seq的训练模式和翻译模式已经开始进入人们的视野。除此之外，在端到端的训练方法中，除了需要海量的业务数据之外，在网络结构中加入一些重要的模块也是非常必要的。在此情形下，基于循环神经网络的注意力机制进入了人们的视野。近几年来，随着深度卷积神经网络在计算机视觉领域的深入应用，以YOLO算法以及SSD算法为代表的实时目标检测模型在工业领域以及实际应用场景中发挥了很好的检测效果。但是，由于这两种算法将目标检测过程视作回归问题来处理，不能很好地将前景区域与背景区域区分开，容易产生误检和漏检。而以Faster-RCNN(RPN)的检测算法能在感兴趣区域的生成阶段就将可能含有待检测物体的区域大致确定下来，在大大提升准确率的同时也能为之后的分类阶段节省处理时间。目前对目标检测算法的改进主要包括：采用能够提取到更丰富特征的基础神经网络、融合多个尺度的特征来进行检测或是其他对于检测环节改进的方法。在YOLOv3检测算法中，所提取的卷积特征并未对卷积核中不同的位置进行加权处理，即同等对待整个特征图中的每个区域，认为每个区域对于检测的贡献是相同的。然而在实际的生活场景中...

【技术保护点】
1.一种基于注意力机制的行人检测模型，其特征在于，包括YOLOv3的多尺度预测结构、用于残差连接的通道注意力机构结构和用于残差连接的通道积空间注意力机制机构；/nYOLOv3的多尺度预测结构：用能够提取到更丰富特征的基础神经网络、融合多个尺度的特征来进行检测的方法；/n用于残差连接的通道注意力机构结构，其系统的执行步骤为：/nS1：Attention-YOLO算法对网络中所有的残差连接进行替换；/nS2：首先通过特征图上的全局平均池化获得残差模块上的信息；/nS3：然后使用两个全连接层及ReLU非线性激活函数和Sigmoid激活函数来自适应地对全局平均池化模块上的信息进行建模；/nS4：再将残差模块上的信息与自适应学习建模后的权重进行加权处理,实现特征响应及特征重校准的效果；/n用于残差连接的通道积空间注意力机制机构，其系统的执行步骤为：/nS1：Attention-YOLO算法对网络中所有的残差连接进行替换；/nS2：接着网络中残差模块上的信息传递分别传递到特征图上的全局平均池化和全局最大池化；/nS3：然后使用两个全连接层及ReLU非线性激活函数和Sigmoid激活函数来自适应地对...

【技术特征摘要】
1.一种基于注意力机制的行人检测模型，其特征在于，包括YOLOv3的多尺度预测结构、用于残差连接的通道注意力机构结构和用于残差连接的通道积空间注意力机制机构；
YOLOv3的多尺度预测结构：用能够提取到更丰富特征的基础神经网络、融合多个尺度的特征来进行检测的方法；
用于残差连接的通道注意力机构结构，其系统的执行步骤为：
S1：Attention-YOLO算法对网络中所有的残差连接进行替换；
S2：首先通过特征图上的全局平均池化获得残差模块上的信息；
S3：然后使用两个全连接层及ReLU非线性激活函数和Sigmoid激活函数来自适应地对全局平均池化模块上的信息进行建模；
S4：再将残差模块上的信息与自适应学习建模后的权重进行加权处理,实现特征响应及特征重校准的效果；
用于残差连接的通道积空间注意力机制机构，其系统的执行步骤为：
S1：Attention-YOLO算法对网络中所有的残差连接进行替换；
S2：接着网络中残差模块上的信息传递分别传递到特征图上的全局平均池化和全局最大池化；
S3：然后使用两个全连接层及ReLU非线性激活函数和Sigmoid激活函数来自适应地对各全局平均池化和全局最大池化模块上的信息进行建模；
S4：神经网络中处理后的特征加权模块降维到通道中所有的残差模块；
S5：然后通道中残差模块上的信息传递分别传递到特征图上的通道平均池化和通道最大池化模块上；
S6：接着分别使用叠加层和卷积层及Sigmoid激活函数来自...

【专利技术属性】
技术研发人员：白夏颖，王可心，戎淇，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人