一种基于SRCNN的交通标志识别方法技术

技术编号:22295874 阅读:53 留言:0更新日期:2019-10-15 04:58
本发明专利技术公开了一种基于SRCNN的交通标志识别方法,包括以下步骤:步骤一:对输入的交通标志图像进行图像预处理:将输入的交通标志图像的像素与处理分界点像素进行比较,对于像素小于处理分界点像素的图像,利用基于SRCNN的超分辨率重建算法将输入图像重建为处理分界点像素的图像;对于像素不小于处理分界点像素的图像,利用双线性插值算法缩小为处理分界点像素的图像;步骤二:对Lenet‑5卷积神经网络进行训练,得到Lenet‑5卷积神经网络模型;步骤三:将步骤一预处理后的交通标志图像输入步骤二得到的Lenet‑5神经网络模型进行识别,得到交通标志图像类别。本发明专利技术具有能提高低分辨率图像识别准确率且计算量小的优点。

A Traffic Sign Recognition Method Based on SRCNN

【技术实现步骤摘要】
一种基于SRCNN的交通标志识别方法
本专利技术涉及图像处理
,具体涉及一种基于SRCNN的交通标志识别方法。
技术介绍
随着智能交通的发展,自动驾驶汽车的多项技术也受到了广泛关注和研究。为了帮助驾驶员判断前进方向,限速范围以及当前的道路情况,交通标志识别(TSR)成为了智能交通系统中不可忽视的问题,得到了国内外研究人员的广泛关注。当前,关于交通标志的识别分类算法主要包括径向基函数方法、多层决策树分类法,支持向量机分类法,句法分类和卷积神经网络等。在径向基函数方法中(黄锋.基于径向基函数神经网络的图像识别研究[D].太原理工大学,2007),使用降维显著地降低计算量,对提高处理速度,保证系统的实时性要求具有重要的意义。径向基函数网络的实质是降维映射,因而在交通标志的分类中获得应用。相关文献采用径向基函数网络进行分类,其中径向基函数采用线性斜坡函数而非高斯函数。径向基函数网络具有拓扑结构简单、易于学习训练的优点,但基函数的选择比较困难,且网络的泛化能力有限。在多层决策树分类法中(LeiSongandZheyuan,“Color-basedtrafficsigndetection”,2012InternationalConferenceonQuality,Reliability,Risk,Maintenance,andSafetyEngineering),采用多层结构的决策树进行分类,比采用单分类器分类能加快处理速度、提高分类结果的精度,而且通过将相关特征分解到各层简化分类器的设计。相关文献提出根据颜色、形状以及图元的三层决策树的分类方法,每个树的节点都是一个统计分类器。对彩色图像和黑白图像都可以采用这种任务分解的方法进行分类。交通标志可根据颜色信息或几何形状的先验知识逐层分解进行分类。在分类器的设计中,有的文献采用基于laplace-kernel分类器(PPacllk,JPPudil,PSomol,“roadsignclassificationusingLaplacekernelclassifier”,PatternRecognitionLetters,2000:1165-1173)。这类方法具有并行结构,可采用计算机并行算法实现,以提高处理速度,但优化的决策树的设计是个难点,目前,大都依靠经验知识,而且分类器的参数选择也较复杂。在支持向量机分类法中,由于支持向量机根据结构风险最小化原理进行设计,所以具有结构简单、泛化能力强等特点,是一种新的模式识别分类方法。在相关文献中(JGPark,KJKim,“DesignofavisualperceptionmodelwithedgeadaptiveGaborfilterandsupportvectormachinefortrafficsigndetection”,ExpertSystemswithApplications,2013:3679-3687),也有采用支持向量机确定交通标志的类型。但是,这部分的研究才刚刚开始,目前的处理时间还较大,如何构造合适的核函数还尚未解决。在句法分类方法中,利用目标的结构特征对目标进行描述和识别,在交通标志识别中也是人们关注的重点之一。有的文献根据颜色、形状、基本图元以及相互的位置,建立语义网对交通标志进行描述,采用LISP语言在符号化的工作站上编程实现。针对侦测的不确定性知识,采用证据理论融合各种知识后,采用语义网对交通标志进行分类。但是对于复杂的目标,只提取它的数值特征构成特征向量,往往不能全面对其进行描述,这是因为这些数值特征不能反映目标的结构信息。基于卷积神经网络(CNN,ConvolutionalNeuralNetwork)的交通标志识别算法因为学习能力强,权值共享、正确率高等优点得到了研究人员的高度关注。但在实际场景中,由于受到周围环境(如恶劣天气)等不确定性因素的影响,系统捕捉到的交通标志图像较为模糊,分辨率低。所以仅使用这种方法对该种情况适应能力较差,准确率难以保证。因此,需要设计一种能提高低分辨率图像识别准确率的交通标志识别算法。超分辨率重建卷积神经网络(SRCNN,Super-ResolutionConvolutionalNeuralNetwork)是一种进行图像超分辨率重建的经典算法,通过该算法可以将低分辨率图像还原为高分辨率图像。使用SRCNN对图像进行预处理并应用于交通标志识别网络,可以改善对低分辨率图像的识别准确率。现阶段,《陕西师范大学学报(自然科学版)》2017年02期公开了一种“基于二级改进LeNet-5的交通标志识别算法”,该算法以真实场景中拍摄的交通标志图像数据集GTSRB为研究对象,将卷积神经网络与支持向量机相结合;上述基于二级改进LeNet-5的交通标志识别算法,首先根据识别系统的实时性要求,对原始LeNet-5结构进行改进;然后用裁剪、灰度化、图像增强和尺寸归一化等操作对原始图像进行预处理,得到32×32的感兴趣区域;接下来,利用数据集GTSRB训练出一个二级改进LeNet-5,其中第一级改进LeNet-5将感兴趣区域中包含的交通标志粗分为6类,第二级改进LeNet-5对粗分类结果进行细分类,识别出交通标志所属的最终类别。实验结果表明,基于二级改进LeNet-5交通标志识别算法因网络模型能够提取交通标志的多尺度特征,识别正确率可达91.76%。但是上述基于二级改进LeNet-5的交通标志识别算法存在以下缺点:该算法的预处理过程只是简单的对输入图像进行缩放的处理,而原图在缩放过程中容易丢失部分信息,尤其是将小尺寸图像放大成大尺寸图像时,放大后的图像较为模糊,即使肉眼也难以识别,若将其直接作为图像输入进行识别,极有可能造成识别错误。目前,还有一种交通标志识别方法:先利用图像聚类算法对原始数据集进行样本优化;然后采用多种图像预处理操作使样本整体质量进一步提升;最后构造了深度为9的CNN结构,通过多次训练得到最终的网络模型,将待识别的图像输入到CNN模型来实现自动识别。在德国交通标志数据集(GTSRB)和比利时交通标志数据集(BTSD,Belgiumtrafficsigndataset)上证明了算法的有效性,单张图片的识别速度只需0.2s,识别精度高达98.5%以上。本算法具有识别速度快、准确率高的特点,可为智能驾驶的可靠性和安全性提供理论依据和技术支持。但是上述算法存在以下缺点:方案二的训练过程中的计算量非常大,对硬件要求较高,操作复杂,且非常耗时。所采用的CNN结构参数复杂,输入和输出特征较多。
技术实现思路
本专利技术的目的是提供一种能提高低分辨率图像识别准确率且计算量小的基于SRCNN的交通标志识别方法。为实现上述目的,本专利技术采用了如下技术方案:一种基于SRCNN的交通标志识别方法,包括以下步骤:步骤一:对输入的交通标志图像进行图像预处理:先定义处理分界点像素;然后将输入的交通标志图像的像素与处理分界点像素进行比较,对于像素小于处理分界点像素的图像,利用基于SRCNN的超分辨率重建算法将输入图像重建为处理分界点像素的图像;对于像素不小于处理分界点像素的图像,利用双线性插值算法缩小为处理分界点像素的图像;步骤二:对Lenet-5卷积神经网络进行训练,得到Lenet-5卷积神经网本文档来自技高网
...

【技术保护点】
1.一种基于SRCNN的交通标志识别方法,其特征在于:包括以下步骤:步骤一:对输入的交通标志图像进行图像预处理:先定义处理分界点像素;然后将输入的交通标志图像的像素与处理分界点像素进行比较,对于像素小于处理分界点像素的图像,利用基于SRCNN的超分辨率重建算法将输入图像重建为处理分界点像素的图像;对于像素不小于处理分界点像素的图像,利用双线性插值算法缩小为处理分界点像素的图像;步骤二:对Lenet‑5卷积神经网络进行训练,得到Lenet‑5卷积神经网络模型;步骤三:将步骤一中预处理后的交通标志图像输入步骤二得到的Lenet‑5神经网络模型进行识别,得到该交通标志图像的类别。

【技术特征摘要】
1.一种基于SRCNN的交通标志识别方法,其特征在于:包括以下步骤:步骤一:对输入的交通标志图像进行图像预处理:先定义处理分界点像素;然后将输入的交通标志图像的像素与处理分界点像素进行比较,对于像素小于处理分界点像素的图像,利用基于SRCNN的超分辨率重建算法将输入图像重建为处理分界点像素的图像;对于像素不小于处理分界点像素的图像,利用双线性插值算法缩小为处理分界点像素的图像;步骤二:对Lenet-5卷积神经网络进行训练,得到Lenet-5卷积神经网络模型;步骤三:将步骤一中预处理后的交通标志图像输入步骤二得到的Lenet-5神经网络模型进行识别,得到该交通标志图像的类别。2.根据权利要求1所述的一种基于SRCNN的交通标志识别方法,其特征在于:在步骤一中,使用基于SRCNN的超分辨率重建方法对输入图像进行超分辨率重建的具体步骤如下:步骤(1.1):将输入图像P按照R、G、B三个通道进行分割,对每个通道的图片分别进行超分辨率重建,使用ReLu作为激活函数d(x)=max(0,x);(1.1.1)对G通道的矩阵G:Y1=d(G*W1+B1)Y2=d(Y1*W2+B2)Y3=d(Y2*W3+B3)其中,Yi为第i层卷积层的输出特征,作为第i+1层的输入,Bi和Wi为第i层的偏置和权重,*表示卷积运算;其中,权重初始为正态分布,偏置初始化为0;第一层卷积网络对输入的图片进行特征提取,第二层对第一层提取的特征进行非线性映射,第三层生成高分辨率图像;(1.1.2)对B通道的矩阵B:Y1=d(B*W1+B1)Y2=d(Y1*W2+B2)Y3=d(Y2*W3+B3)其中,Yi为第i层卷积层的输出特征,作为第i+1层的输入,Bi和Wi为第i层的偏置和权重,*表示卷积运算;其中,权重初始为正态分布,偏置初始化为0;第一层卷积网络对输入的图片进行特征提取,第二层对第一层提取的特征进行非线性映射,第三层生成高分辨率图像;(1.1.3)对R通道的矩阵R:Y1=d(B*W1+B1)Y2=d(Y1*W2+B2)Y3=d(Y2*W3+B3)其中,Yi为第i层卷积层的输出特征,作为第i+1层的输入,Bi和Wi为第i层的偏置和权重,*表示卷积运算;其中,权重初始为正态分布,偏置初始化为0;第一层卷积网络对输入的图片进行特征提取,第二层对第一层提取的特征进行非线性映射,第三...

【专利技术属性】
技术研发人员:曹宇孔金迪张绩成陈可佳
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1