一种基于改进SSD算法的交通障碍检测方法和系统技术方案

技术编号:35430613 阅读:29 留言:0更新日期:2022-11-03 11:35
本发明专利技术公开了一种基于改进SSD算法的交通障碍检测方法,包括:基于VGG

【技术实现步骤摘要】
一种基于改进SSD算法的交通障碍检测方法和系统


[0001]本专利技术属于人工智能目标检测
,具体涉及一种基于改进SSD算法的交通障碍检测方法和系统。

技术介绍

[0002]目前我国汽车保有量已达3.07亿辆,超越美国居全球首位,汽车销售额占社会零售总额比重达到10%,随之而来的驾驶安全和驾驶体验成为如今需要解决提升的重点问题。随着深度学习技术、人工智能的崛起和5G网络的普及,高速度、低延时、高并发支持为汽车智能化提供了更好的基础设施。辅助障碍检测功能可以降低驾驶的风险,有效提升驾驶体验,因此,交通障碍检测的研究对于我们而言十分有意义。
[0003]随着深度学习的迅猛发展,采用滑动窗口的传统目标检测已经发展为基于深度学习的目标检测。早期的目标检测任务提取特征时,主要采取的方式是人工提取,具有一定的局限性,同时手工特征的性能也趋于饱和。卷积神经网络的广泛应用使得目标检测开启了新的征程,目标检测开始以前所未有的速度快速发展。深度学习时代,目标检测算法根据检测思想的不同通常可以分为两大类别:两阶段(two

stage)检测和一阶段(one

stage)检测。
[0004]两阶段检测算法基于提议的候选框,是一个“由粗到细”的过程。首先产生区域候选框,其次提取每个候选框的特征,最后产生位置框并预测对应的类别,特点是精度高但速度慢。一阶段检测算法基于边界框的回归,是一个“一步到位”的过程。一阶段检测网络在产生候选框的同时进行分类和边界框回归,特点是速度快但精度稍低。YOLO将目标检测看作回归问题,将整个图像分割为固定数量的网格单元(如使用 7
ꢀ×ꢀ
7 网格),每个单元被看作一个候选框,然后网络检测候选框中是否存在一或多个对象。基于轻量级架构,YOLO的检测速度有很大提升,但是只有一个特征图可用于预测,这不适合预测多种尺寸和宽高比的对象,检测精度远低于两阶段的算法,尤其是对小目标的检测精度不佳。Liu等人提出Single

Shot Mulibox Detector (SSD)检测器,一定程度上解决了YOLO的缺陷。SSD将图像分割为网格单元,但是在每一个网格单元中,可以生成一组不同尺寸和宽高比的锚点框,从而离散化边界框的输出空间。SSD在多个特征图上预测对象,且每一个特征图基于其感受野来检测特定尺寸的对象。但是SSD算法依赖提前预设密集的先验框,在训练阶段根据预测框与真值框的比较(可能是IoU或其他标准)进行正样本的确定,这会产生大量冗余的结果,需要非极大值抑制后处理(NMS)来过滤掉多余的框。

技术实现思路

[0005]解决的技术问题:本专利技术提出了一种基于改进SSD算法的交通障碍检测方法和系统,有效提高了模型检测的速度以及对各类不同大小的交通障碍检测的平均精度。
[0006]技术方案:一种基于改进SSD算法的交通障碍检测方法,所述交通障碍检测方法包括以下步
骤:S1,获取若干张包含交通障碍的原始图像,对原始图像进行预处理,得到相应的交通障碍样本图像,生成图像数据集,将图像数据集按照预设比例划分成训练集和验证集;S2,基于VGG

16基础网络构建交通障碍检测网络模型;所述交通障碍检测网络模型包括改进后的VGG

16基础网络、多尺度提取模块、特征融合模块、候选框预设模块、动态检测模块和分类回归模块;所述改进后的VGG

16基础网络将VGG

16基础网络的全连接层FC6和全连接层FC7转换成3*3的卷积层Conv6和1*1的卷积层Conv7;所述多尺度提取模块包括依次连接在卷积层Conv7之后的卷积层Conv8_2、卷积层Conv9_2、卷积层Conv10_2和卷积层Conv11_2;所述特征融合模块对改进后的VGG

16基础网络的卷积层Conv1_2、卷积层Conv2_2和卷积层Conv3_3的特征图进行融合,再将融合结果分别与卷积层Conv4_3、卷积层Conv7、卷积层Conv8_2进行融合,得到第一融合特征、第二融合特征和第三融合特征;所述候选框预设模块用于在第一融合特征、第二融合特征、第三融合特征,以及卷积层Conv9_2、卷积层Conv10_2和卷积层Conv11_2输出的特征图上预设一组初始可迭代的候选框用以表示目标位置;所述动态检测模块包括高维特征引入单元和若干个动态检测头,高维特征引入单元用于针对每个候选框引入一个与候选框一对一匹配的高维特征,用以表示候选框内所包含对象的深层次的抽象特征信息;所述动态检测头用于将提取出的特征图与候选框进行融合,并通过ROI

Align得到感兴趣区域,再将感兴趣区域与相应的高维特征进行特征交互,输出对象特征至分类回归模块进行分类回归;所述分类回归模块综合所有动态检测头输出特征的分类回归结果,得到最终的预测结果;S3,采用图像数据集训练交通障碍检测网络模型;其中,将训练集作为输入,分类和回归结果作为输出,结合损失函数对交通障碍检测网络模型进行训练;S4,将测试集输入训练完成的交通障碍检测网络模型,得到测试集的目标检测结果。
[0007]进一步地,步骤S1中,对原始图像进行预处理的过程包括以下步骤:S11,获取开源数据集,从中找出包含行人、障碍物的原始图像,对原始图像进行包括随机旋转、随机裁剪在内的数据增强处理;S12,针对各个数据增强处理后的原始图像,按照预先设置的尺寸,对各个原始图像的像素和大小进行统一设置,得到包含目标物体的有效图像;S13,针对包含目标物体的有效图像,使用图片标注工具标注出行人和障碍物的目标检测边界框的大小和位置,再对目标检测边界框的障碍物类别进行标注,得到交通障碍样本图像。
[0008]进一步地,所述特征融合模块包括依次连接的第一融合单元、第二融合单元和降维单元;所述第一融合单元对卷积层Conv1_2、卷积层Conv2_2和卷积层Conv3_3输出的特征图降维至相同深度后进行融合;降维后的深度与卷积层Conv4_3的深度相同;所述第二融合单元将第一融合单元的融合结果分别与卷积层Conv4_3、卷积层
Conv7、卷积层Conv8_2进行融合或者降维融合;所述降维单元包括三个并联的3*3卷积层,与第二融合单元输出的三个特征图一一对应,对第二融合单元输出的三个特征图进行降维处理,得到保有原有卷积层Conv4_3、卷积层Conv7、卷积层Conv8_2相应深度的第一融合特征、第二融合特征和第三融合特征。
[0009]进一步地,在交通障碍检测网络模型中,单次降采样结构先进行1次step为1,filter为3
×
3的卷积处理,对细节特征进行总结,再使用step为2的跨步卷积来降低特征融合的冗余,最后进行一次批正则化操作。
[0010]进一步地,所述候选框采用四维向量(x,y,h,w)表示,x,y分别表示归一化后的候选框的中心点横坐标和纵坐标,h表示候选框的高度,w表示候选框的宽度。
[0011]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进SSD算法的交通障碍检测方法,其特征在于,所述交通障碍检测方法包括以下步骤:S1,获取若干张包含交通障碍的原始图像,对原始图像进行预处理,得到相应的交通障碍样本图像,生成图像数据集,将图像数据集按照预设比例划分成训练集和验证集;S2,基于VGG

16基础网络构建交通障碍检测网络模型;所述交通障碍检测网络模型包括改进后的VGG

16基础网络、多尺度提取模块、特征融合模块、候选框预设模块、动态检测模块和分类回归模块;所述改进后的VGG

16基础网络将VGG

16基础网络的全连接层FC6和全连接层FC7转换成3*3的卷积层Conv6和1*1的卷积层Conv7;所述多尺度提取模块包括依次连接在卷积层Conv7之后的卷积层Conv8_2、卷积层Conv9_2、卷积层Conv10_2和卷积层Conv11_2;所述特征融合模块对改进后的VGG

16基础网络的卷积层Conv1_2、卷积层Conv2_2和卷积层Conv3_3的特征图进行融合,再将融合结果分别与卷积层Conv4_3、卷积层Conv7、卷积层Conv8_2进行融合,得到第一融合特征、第二融合特征和第三融合特征;所述候选框预设模块用于在第一融合特征、第二融合特征、第三融合特征,以及卷积层Conv9_2、卷积层Conv10_2和卷积层Conv11_2输出的特征图上预设一组初始可迭代的候选框用以表示目标位置;所述动态检测模块包括高维特征引入单元和若干个动态检测头,高维特征引入单元用于针对每个候选框引入一个与候选框一对一匹配的高维特征,用以表示候选框内所包含对象的深层次的抽象特征信息;所述动态检测头用于将提取出的特征图与候选框进行融合,并通过ROI

Align得到感兴趣区域,再将感兴趣区域与相应的高维特征进行特征交互,输出对象特征至分类回归模块进行分类回归;所述分类回归模块综合所有动态检测头输出特征的分类回归结果,得到最终的预测结果;S3,采用图像数据集训练交通障碍检测网络模型;其中,将训练集作为输入,分类和回归结果作为输出,结合损失函数对交通障碍检测网络模型进行训练;S4,将测试集输入训练完成的交通障碍检测网络模型,得到测试集的目标检测结果。2.根据权利要求1所述的基于改进SSD算法的交通障碍检测方法,其特征在于,步骤S1中,对原始图像进行预处理的过程包括以下步骤:S11,获取开源数据集,从中找出包含行人、障碍物的原始图像,对原始图像进行包括随机旋转、随机裁剪在内的数据增强处理;S12,针对各个数据增强处理后的原始图像,按照预先设置的尺寸,对各个原始图像的像素和大小进行统一设置,得到包含目标物体的有效图像;S13,针对包含目标物体的有效图像,使用图片标注工具标注出行人和障碍物的目标检测边界框的大小和位置,再对目标检测边界框的障碍物类别进行标注,得到交通障碍样本图像。3.根据权利要求1所述的基于改进SSD算法的交通障碍检测方法,其特征在于,所述特征融合模块包括依次连接的第一融合单元、第二融合单元和降维单元;所述第一融合单元对卷积层Conv1_2、卷积层Conv2_2和卷积层Conv3_3输出的特征图降维至相同深度后进行融合;降维后的深度与卷积层Conv4_3的深度相同;
所述第二融合单元将第一融合单元的融合结果分别与卷积层Conv4_3、卷积层Conv7、卷积层Conv8_2进行融合或者降维融合;所述降维单元包括三个并联的3*3卷积层,与第二融合单元输出的三个特征图一一对应,对第二融合单元输出的三个特征图进行降维处理,得到保有原有卷积层Conv4_3、卷积层Conv7、卷积层Conv8_2相应深度的第一融合特征、第二融合特征和第三融合特征。4.根据权利要求1所述的基于改进SSD算法的交通障碍检测方法,其特征在于,在交通障碍检测网络模型中,单次降采样结构先进行1次step为1,filter为3
×
3的卷积处理,对细节特征进行总结,再使用step为2的跨步卷积来降低特征融合的冗余,最后进行一次批正则化操作。5.根据权利要求1所述的基于改进SSD算法的交通障碍检测方法,其特征在于,所述候选框采用四维向量(x,y,h,w)表示,x,y分别表示归一化后的候选框的中心点横坐...

【专利技术属性】
技术研发人员:夏景明戴如晨谈玲
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1