一种基于注意力机制的行人检测模型制造技术

技术编号:23766270 阅读:26 留言:0更新日期:2020-04-11 20:00
本发明专利技术公开了一种基于注意力机制的行人检测模型,包括YOLOv3的多尺度预测结构、用于残差连接的通道注意力机构结构和用于残差连接的通道积空间注意力机制机构,YOLOv3的多尺度预测结构用能够提取到更丰富特征的基础神经网络、融合多个尺度的特征来进行检测的方法。本发明专利技术通过YOLOv3算法的实时检测性减少端到端行人目标检测算法中漏检和误检的情况,通过对于所提取出的特征向量进行充分的利用和修正,同时修改残差连接结构中的单一连接方式,使整个网络能更好地筛选出有利于后续检测的特征向量,其次,高效、低耗的检测算法能够更好地应用于智能设备或无人机之类的使用场景中,因此对回归型算法的改进研究也具有一定的现实意义。

A pedestrian detection model based on attention mechanism

【技术实现步骤摘要】
一种基于注意力机制的行人检测模型
本专利技术涉及检测模型领域,特别涉及一种基于注意力机制的行人检测模型。
技术介绍
在机器翻译或者自然语言处理领域,使用数理统计的方法来进行分析和处理。近些年来,随着AlphaGo的兴起,除了在游戏AI领域,深度学习在计算机视觉领域,机器翻译和自然语言处理领域也有着巨大的用武之地。在2016年,随着深度学习的进一步发展,seq2seq的训练模式和翻译模式已经开始进入人们的视野。除此之外,在端到端的训练方法中,除了需要海量的业务数据之外,在网络结构中加入一些重要的模块也是非常必要的。在此情形下,基于循环神经网络的注意力机制进入了人们的视野。近几年来,随着深度卷积神经网络在计算机视觉领域的深入应用,以YOLO算法以及SSD算法为代表的实时目标检测模型在工业领域以及实际应用场景中发挥了很好的检测效果。但是,由于这两种算法将目标检测过程视作回归问题来处理,不能很好地将前景区域与背景区域区分开,容易产生误检和漏检。而以Faster-RCNN(RPN)的检测算法能在感兴趣区域的生成阶段就将可能含有待检测物体的区域大致确定下来,在大大提升准确率的同时也能为之后的分类阶段节省处理时间。目前对目标检测算法的改进主要包括:采用能够提取到更丰富特征的基础神经网络、融合多个尺度的特征来进行检测或是其他对于检测环节改进的方法。在YOLOv3检测算法中,所提取的卷积特征并未对卷积核中不同的位置进行加权处理,即同等对待整个特征图中的每个区域,认为每个区域对于检测的贡献是相同的。然而在实际的生活场景中,图中待检测物体的周围往往具有复杂且丰富的语境信息,对目标区域的特征加以权重,可以使之能更好地定位在待检测的特征之上,也能在不引入过多参数量的基础上提升网络的泛化性能。
技术实现思路
本专利技术的目的在于提供一种基于注意力机制的行人检测模型,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于注意力机制的行人检测模型,包括YOLOv3的多尺度预测结构、用于残差连接的通道注意力机构结构和用于残差连接的通道积空间注意力机制机构;YOLOv3的多尺度预测结构:用能够提取到更丰富特征的基础神经网络、融合多个尺度的特征来进行检测的方法;用于残差连接的通道注意力机构结构,其系统的执行步骤为:S1:Attention-YOLO算法对网络中所有的残差连接进行替换;S2:首先通过特征图上的全局平均池化获得残差模块上的信息;S3:然后使用两个全连接层及ReLU非线性激活函数和Sigmoid激活函数来自适应地对全局平均池化模块上的信息进行建模;S4:再将残差模块上的信息与自适应学习建模后的权重进行加权处理,实现特征响应及特征重校准的效果;用于残差连接的通道积空间注意力机制机构,其系统的执行步骤为:S1:Attention-YOLO算法对网络中所有的残差连接进行替换;S2:接着网络中残差模块上的信息传递分别传递到特征图上的全局平均池化和全局最大池化;S3:然后使用两个全连接层及ReLU非线性激活函数和Sigmoid激活函数来自适应地对各全局平均池化和全局最大池化模块上的信息进行建模;S4:神经网络中处理后的特征加权模块降维到通道中所有的残差模块;S5:然后通道中残差模块上的信息传递分别传递到特征图上的通道平均池化和通道最大池化模块上;S6:接着分别使用叠加层和卷积层及Sigmoid激活函数来自适应地对各通道平均池化和通道最大池化模块上的信息进行建模;S7:再将通道残差模块上的信息与自适应学习建模后的权重进行加权处理,实现特征响应及特征重校准的效果。优选的,全局平均池化是对整个特征图进行平均池化,--张特征图得出一个值。优选的,通道注意力模块的作用是通过对特征图的各个通道之间的依赖性进行建模以提高对于重要特征的表征能力,网络可以有选择性地加强包含重要信息的特征并抑制作用无关或较弱关联的特征。优选的,神经网络中传递的特征通道加以不同的权重,网络可以更加重视权重较大的通道进行参数更新,在前向传播的过程中,重要的特征通道将会占有更大的比重,在所呈现的输出图像中也能更加明显地展现出检测网络所重点关注的部分,更好地分辨出待检测物体优选的,YOLOv3算法的实时检测性为了在不加深网络深度的前提下提升检测精度,Attention-YOLO算法仅仅对网络中所有的残差连接进行替换,通过对于传递特征的筛选,使得残差融合时保留的信息更加有利于训练损失的降低,有利于定位及分类的准确,网络在这部分增加的计算量集中在全连接层部分,通过一定比例的降维可以权衡性能和检测速度的取舍。本专利技术的技术效果和优点:1、本专利技术通过Attention-YOLO算法以较低的额外传播时间代价换取了检测精准度的提升,其主要思想是在保持回归型检测算法的能快速预测结果的前提下,通过对于所提取出的特征向量进行充分的利用和修正,同时修改残差连接结构中的单一连接方式,使整个网络能更好地筛选出有利于后续检测的特征向量;2、本专利技术通过Attention-YOLO中涉及的注意力机制和改进的特征融合方法可以迁移至其他具有残差连接的特征提取网络中,对于其他若干种注意力机制迁移至检测算法中的研究具有一定指导意义;3、本专利技术通过高效、低耗的检测算法能够更好地应用于智能设备或无人机之类的使用场景中,因此对回归型算法的改进研究也具有一定的现实意义。附图说明图1为本专利技术的YOLOv3的多尺度预测结构结构示意图。图2为本专利技术的用于残差连接的通道注意力机构结构结构示意图。图3为本专利技术的用于残差连接的通道积空间注意力机制机构结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术提供了如图1-3所示的一种基于注意力机制的行人检测模型:实施案例一:本包括YOLOv3的多尺度预测结构、用于残差连接的通道注意力机构结构和用于残差连接的通道积空间注意力机制机构,其中YOLOv3的多尺度预测结构用能够提取到更丰富特征的基础神经网络、融合多个尺度的特征来进行检测的方法,YOLOv3算法的实时检测性为了在不加深网络深度的前提下提升检测精度,Attention-YOLO算法仅仅对网络中所有的残差连接进行替换,通过对于传递特征的筛选,使得残差融合时保留的信息更加有利于训练损失的降低,有利于定位及分类的准确,网络在这部分增加的计算量集中在全连接层部分,通过一定比例的降维可以权衡性能和检测速度的取舍;通过Attention-YOLO算法以较低的额外传播时间代价换取了检测精准度的提升,其主要思想是在保持回归型检测算法的能本文档来自技高网
...

【技术保护点】
1.一种基于注意力机制的行人检测模型,其特征在于,包括YOLOv3的多尺度预测结构、用于残差连接的通道注意力机构结构和用于残差连接的通道积空间注意力机制机构;/nYOLOv3的多尺度预测结构:用能够提取到更丰富特征的基础神经网络、融合多个尺度的特征来进行检测的方法;/n用于残差连接的通道注意力机构结构,其系统的执行步骤为:/nS1:Attention-YOLO算法对网络中所有的残差连接进行替换;/nS2:首先通过特征图上的全局平均池化获得残差模块上的信息;/nS3:然后使用两个全连接层及ReLU非线性激活函数和Sigmoid激活函数来自适应地对全局平均池化模块上的信息进行建模;/nS4:再将残差模块上的信息与自适应学习建模后的权重进行加权处理,实现特征响应及特征重校准的效果;/n用于残差连接的通道积空间注意力机制机构,其系统的执行步骤为:/nS1:Attention-YOLO算法对网络中所有的残差连接进行替换;/nS2:接着网络中残差模块上的信息传递分别传递到特征图上的全局平均池化和全局最大池化;/nS3:然后使用两个全连接层及ReLU非线性激活函数和Sigmoid激活函数来自适应地对各全局平均池化和全局最大池化模块上的信息进行建模;/nS4:神经网络中处理后的特征加权模块降维到通道中所有的残差模块;/nS5:然后通道中残差模块上的信息传递分别传递到特征图上的通道平均池化和通道最大池化模块上;/nS6:接着分别使用叠加层和卷积层及Sigmoid激活函数来自适应地对各通道平均池化和通道最大池化模块上的信息进行建模;/nS7:再将通道残差模块上的信息与自适应学习建模后的权重进行加权处理,实现特征响应及特征重校准的效果。/n...

【技术特征摘要】
1.一种基于注意力机制的行人检测模型,其特征在于,包括YOLOv3的多尺度预测结构、用于残差连接的通道注意力机构结构和用于残差连接的通道积空间注意力机制机构;
YOLOv3的多尺度预测结构:用能够提取到更丰富特征的基础神经网络、融合多个尺度的特征来进行检测的方法;
用于残差连接的通道注意力机构结构,其系统的执行步骤为:
S1:Attention-YOLO算法对网络中所有的残差连接进行替换;
S2:首先通过特征图上的全局平均池化获得残差模块上的信息;
S3:然后使用两个全连接层及ReLU非线性激活函数和Sigmoid激活函数来自适应地对全局平均池化模块上的信息进行建模;
S4:再将残差模块上的信息与自适应学习建模后的权重进行加权处理,实现特征响应及特征重校准的效果;
用于残差连接的通道积空间注意力机制机构,其系统的执行步骤为:
S1:Attention-YOLO算法对网络中所有的残差连接进行替换;
S2:接着网络中残差模块上的信息传递分别传递到特征图上的全局平均池化和全局最大池化;
S3:然后使用两个全连接层及ReLU非线性激活函数和Sigmoid激活函数来自适应地对各全局平均池化和全局最大池化模块上的信息进行建模;
S4:神经网络中处理后的特征加权模块降维到通道中所有的残差模块;
S5:然后通道中残差模块上的信息传递分别传递到特征图上的通道平均池化和通道最大池化模块上;
S6:接着分别使用叠加层和卷积层及Sigmoid激活函数来自...

【专利技术属性】
技术研发人员:白夏颖王可心戎淇
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1