一种道路场景车辆和行人的目标检测算法制造技术

技术编号:32178914 阅读:13 留言:0更新日期:2022-02-08 15:39
本发明专利技术公开了一种道路场景车辆和行人的目标检测算法,步骤为:加入注意力机制,加强网络对于特征图和重要通道间的相关表达,在特征提取时重点关注高价值信息,抑制无效信息,加强网络的特征提取能力,提高网络在实际道路场景中的检测精度;引入空间金字塔池化结构提取不同感受野的多尺度深层特征信息,增强网络提取特征的表达能力提升网络检测准确率;优化损失函数,反映预测框和真实框的重叠区域和距离,解决原网络中梯度消失无法优化的问题,提高网络对于小目标的敏感性和检测精度。本发明专利技术提升了检测速度和准确度,为解决道路场景中车辆行驶安全问题、发展道路图像监控系统以及自动驾驶、辅助驾驶等提供了现实指导意义。辅助驾驶等提供了现实指导意义。辅助驾驶等提供了现实指导意义。

【技术实现步骤摘要】
一种道路场景车辆和行人的目标检测算法


[0001]本专利技术属于目标检测的
,尤其涉及一种道路场景车辆和行人 的目标检测算法。

技术介绍

[0002]传统的目标检测方法主要分为区域选择、特征提取、分类器三个部分, 这些传统方法是基于底层视觉特征进行检测,因此很难获取复杂图像中的 语义信息。为了更好的提取目标特征信息,Hinton在2006年提出了深度学 习,深度学习是人工智能领域的研究重心和最新热点,它被广泛的应用在 目标检测、语义分割、物理分类等方面;近年来,随着深度学习的发展, 神经网络在计算机视觉领域取得突破性进展,卷积神经网络是神经网络的 一种,包括输入层、卷积层、池化层、全连接层和分类器,主要通过权值 共享将网络的层次不断加深,使网络具有更强的解析能力。人工智能和新 一代汽车技术发展已经加快了汽车同互联网之间的紧密联系,自动驾驶和 辅助系统已经成为了目前各大汽车公司研究的研究方向和重要课题,因此, 将卷积神经网络应用到道路场景,对车辆和行人进行目标检测,可以做到 实时性和准确性检测,为解决道路场景中车辆行驶安全问题、发展道路图 像监控系统以及自动驾驶、辅助驾驶等提供了现实指导意义。
[0003]目标检测由图像处理发展而来,是计算机视觉研究的重点和热点之一。 传统目标检测方法主要分为预处理、窗口滑动、特征提取、特征选择、特 征分类和后处理六个步骤。
[0004]传统目标检测方法的研究重点是在特征提取(提高目标的表征能力) 和特征分类(提高分类器的精度和速度)上。由此,研究人员提出了多种 形式的特征描述子和分类器:1999年由David Lowe提出的SITF是一种局 部特征描述子,其对旋转、尺度缩放、对视角变化、噪声等具有一定的稳 定性;2005由Navneet Dalal和Bill Triggs在CVPR上提出的梯度方向直 方图(HOG),通过计算和统计图像局部的梯度方向来构成特征;1995年 Freund and Schapire提出AdaBoost算法是机器学习方法的一种,通过不断 的对训练集训练不同的弱分类器,再将其集合起来构成一个强分类器筛选 特征;1964年,Vapnik和Alexey Y.Chervonenkis提出并建立了支持向量机 (SVM),是一种二分类模型,通过使用监督学习的方式对数据进行分类 的线性分类器;2010年由Felzenszwalb提出的DPM算法是一种基于部件 的检测方法,对目标的形变具有很强的鲁棒性,它结合了改进后的HOG 特征描述子和SVM分类器,采用了基于图结构的部件模型策略进行特征 融合和分类。
[0005]但是,由于传统目标检测方法使用设计的特征,即使运用最好的非线 性分类器进行特征分类,目标检测的准确度也达不到实际需求。2014年, Girshick等人提出的R

CNN算法在PSACAL VOC检测数据集上以绝对优 势击败了传统的DPM算法,为目标检测开启了一个新的里程碑。自此, 深度学习算法在目标检测的研究领域里占据了绝对的主导地位,并一直持 续至今。由R

CNN网络改进的Fast R

CNN及Faster R

CNN开始的二阶段 算法虽然已经实现了端到端训练的完整流程,但是与真正满足实时性需求 仍有相当大的差距。因此,以YOLO算法为代表的一阶段检测器便登上了 舞台。这一类算法不再单独设计生成候选区
域的初始阶段,而是在整张图像上一次性完成所有目标的定位与分类。Sermanent等人于2013年提出的OverFeat是最早的一阶段检测器。虽然它的精度不如同期R

CNN,但其思想很有前瞻性;(1)采用卷积层替代全连接层实现全卷积神经网络,适应不同分辨率的图像作为输入,相当于用卷积来快速实现滑动窗口算法;(2)采用同一个卷积神经网络作为共享的骨架网络,通过更改网络头部分别实现分类、定位和检测任务,这使得OverFeat比R

CNN的检测速度快了9倍。2015年,Redmon等人提出的YOLO算法则真正地实现了实时性目标检测,YOLO是一种端到端的算法,没有候选框这一概念,输入一张图片,在检测到前景的同时就回归得到了需要的属性。从实验结果来看,YOLO的检测速度能够达到45FPS,FastYOLO甚至能到155FPS,比二阶段检测器快了一个数量级。除此以外,YOLO在检测时考虑了更多的背景信息,因此将背景误判为前景的概率比FastR

CNN要低很多。
[0006]2014年RossB.Girshick等人在CNN的基础上设计了R

CNN模型,R

CNN(摒弃了传统的滑动窗口(通过多尺度滑动窗口确定所有可能的目标区域)和人工选取特征的方法如将候选区域算法和卷积神经网络相结合,使得检测速度和精度明显提升。
[0007](1)区域推荐(regionproposal)即候选区域:给定一张图片,通过选择性搜索算法产生1000~2000个候选边框,但形状和大小是不相同的,这些框之间是可以互相重叠互相包含的;利用图像中的纹理、边缘、颜色等信息,可以保证在选取较少窗口的情况下保持较高的召回率;
[0008](2)特征提取:利用卷积神经网络(CNN)对每一个候选边框提取深层特征;
[0009](3)分类:利用线性支持向量机(SVM)对卷积神经网络提取的深层特征进行分类;
[0010](4)去除重叠:将非极大值抑制方法应用于重叠的候选边框,挑选出支持向量机得分较高的边框(boundingbox)。
[0011]上述方案的缺点在于:
[0012](1)重复计算:重复为每个候选框提取特征是非常耗时的。SelectiveSearch为每张图像产生大约2000个候选框,那么每张图像需要经过2000次的完整的CNN前向传播得到特征,而且这2000个候选框有很多重叠的部分,造成很多计算都是重复的,这将导致计算量大幅上升,相当耗时;
[0013](2)训练占用内存大:对于每一类分类器和回归器,都需要大量的特征作为训练样本;
[0014](3)训练过程是多阶段的:首先对卷积神经网络微调训练;然后提取全连接层特征作为SVM的输入,训练得到目标检测器;最后训练边框回归器;
[0015](4)目标检测速度慢;
[0016](5)输入CNN网络的图像大小固定为227*227,在输入网络前需要对候选区域图像进行归一化,容易使物体产生截断或拉伸,会导致输入CNN的信息丢失。
[0017]FasterR

cnn是在FastR

cnn和R

cnn的基础上进行了改进之后,由ShaoqingRen在2016年发表。FasterR

cnn将特征提取、候选区域生成、边界框回归、目标分类整合到一个网络模型当中,不仅是网络模型的性能有了进一步提高,还在检测精度和速度方面有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种道路场景车辆和行人的目标检测算法,其特征在于,包括以下步骤:步骤1:加入注意力机制,加强网络对于特征图和重要通道间的相关表达,在特征提取时重点关注高价值信息,抑制无效信息,加强网络的特征提取能力,提高网络在实际道路场景中的检测精度;步骤2:引入空间金字塔池化结构提取不同感受野的多尺度深层特征信息,增强网络提取特征的表达能力提升网络检测准确率;步骤3:优化损失函数,反映预测框和真实框的重叠区域和距离,解决原网络中梯度消失无法优化的问...

【专利技术属性】
技术研发人员:王光计思璐
申请(专利权)人:辽宁工程技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1