【技术实现步骤摘要】
一种基于改进SSD算法的交通标识的检测识别方法
本专利技术属于计算机视觉中的图像识别领域,涉及一种图像检测识别方法的创新。
技术介绍
交通标识的检测与分类识别是无人驾驶系统和驾驶员辅助系统的重要组成部分,解决交通标识的识别问题对无人驾驶技术发展具有重要意义。根据当前目标检测领域的算法工作流程可以将目标识别方法分为两类:一种是双步法,如R-CNN、FastR-CNN算法模型;另一种是单步法,比较经典的算法模型有YOLO和SSD(SingleShotMultiBoxDetector,下文简称SSD)等。SSD算法由北卡罗来纳大学教堂山分校的WeiLiu等人提出,专门针对解决YOLO类算法的定位精度问题。SSD算法结合FasterR-CNN的anchorbox机制和YOLO的回归思想,通过预测不同尺度特征提取层上的目标区域,将边界框的输出空间离散化为一系列多尺度、多比例的预选框。在检测阶段网络将生成感兴趣目标的对应置信度并对预选框进行调整以匹配目标区域。SSD在大目标检测方面表现良好,并且对于不同目标的长宽比鲁棒性好,对于小目标检测可以通过增加输入图像的尺寸以提高检测率,但是仍然需要进一步的改进。通过基于区域建议和基于回归的目标检测算法在COCO、PASCALVOC2007、PASCALVOC2012数据集上的平均精度均值和检测速度的对比,可以发现:基于回归的目标检测算法在检测精度上略高于基于区域建议的目标检测算法,在检测速度上明显高于基于区域建议的目标检测算法,所以本专利技术采用SSD算法对交通标识图像进行检测和 ...
【技术保护点】
1.一种基于改进SSD算法的交通标识检测识别方法,其特征在于:具体方法包括以下内容:/nS1目标检测识别网络的前置网络/nS1.1深度学习网络引入残差网络结构,残差结构单元通过捷径连接实现,捷径将这个结构的输入和输出进行加叠操作;深度残差网络在ImageNet上通过使用不同层数的网络结构进行测试;/nS1.2在SSD模型中,前置网络是用来为权重附初始值,使得训练时更快收敛,前置网络的选取会影响到整个网络的训练效率;/nS1.3在SSD原有模型的基础上,对VGG16、ResNet34、ResNet18三种网络分别作为目标检测模型的前置网络,逐一在PASCAL VOC 2007数据集上进行对比测试;采用ResNet18网络来作为前置网络代替VGG16网络;/nS2目标检测识别网络引入预选框/nS2.1在SSD模型目标检测算法中引入了预选框,预选框在不同的特征层中拥有不同的尺寸大小,在同一个特征层中又有不同的纵横比值,覆盖输入图像中的各种形状和大小的目标,softmax分类和边框回归得到真实目标的所在位置;以特征图上每个点的中点为中心,生成一系列同心的预选框,预选框最小边长为min_size ...
【技术特征摘要】
1.一种基于改进SSD算法的交通标识检测识别方法,其特征在于:具体方法包括以下内容:
S1目标检测识别网络的前置网络
S1.1深度学习网络引入残差网络结构,残差结构单元通过捷径连接实现,捷径将这个结构的输入和输出进行加叠操作;深度残差网络在ImageNet上通过使用不同层数的网络结构进行测试;
S1.2在SSD模型中,前置网络是用来为权重附初始值,使得训练时更快收敛,前置网络的选取会影响到整个网络的训练效率;
S1.3在SSD原有模型的基础上,对VGG16、ResNet34、ResNet18三种网络分别作为目标检测模型的前置网络,逐一在PASCALVOC2007数据集上进行对比测试;采用ResNet18网络来作为前置网络代替VGG16网络;
S2目标检测识别网络引入预选框
S2.1在SSD模型目标检测算法中引入了预选框,预选框在不同的特征层中拥有不同的尺寸大小,在同一个特征层中又有不同的纵横比值,覆盖输入图像中的各种形状和大小的目标,softmax分类和边框回归得到真实目标的所在位置;以特征图上每个点的中点为中心,生成一系列同心的预选框,预选框最小边长为min_size,最大边长为每在prototxt设置一个纵横比,增加了2个长方形预选框,该预选框的长度和宽度分别为和
S2.2预选框的大小与输入图片比值Sk通过公式1计算得到;
其中m是指做预测的特征图的总数,Smin和Smax是表示预选框的大小与输入图片比值Sk的最小值与最大值;在设定好预选框大小和输入图片比例的最小值和最大值时,按照上述公式计算获得一组比值,该组比值依次对应着每个特征层中预选框与输入图片的比例,计算出各特征层预选框的最大值和最小值;
S2.3当设置预选框边长的纵横比时,特征层中会另外增加2个长方形预选框,每个长方形预选框宽的长度和高的长度分别由公式2和公式3计算;
其中边长的纵横比为a预,确定各层特征层的取值,设置各特征层纵横比,根据以上公式计算出每层生成的长方形预选框的宽度与高度;
S3目标检测识别网络激活函数
S3.1交通标识检测网络将在ResNet18网络中的3个卷积层即conv3_2、conv4_2、conv5_2和在SSD网络中额外添加的3个卷积层即conv8、conv9、conv10上进行相邻卷积层间多尺度特征融合操作,得到5个特征层即convfl_1、convfl_2、convfl_3、convfl_4、convfl_5;加上该网络最后的平均池化层pool11构成网络特征提取层用来预测目标位置和目标置信度;经过实验对比选取的前置网络ResNet18,设置比例值Sk的间距值和每个特征提取层的预选框纵横比数值,基于以上网络结构的设置构建交通标识检测网络模型,检测网络的输入图像大小为300×300,每个卷积层的卷积核尺寸大小设为3×3,池化层的采样核尺寸大小设为1×1;
S3.2在相邻层特征图融合前需要加入BN层和激活函数进行归一化以及激活操作;
S3.3ReLU激活函数当训练神经网络模型时设置大的学习率时,会出现训练中...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。