一种基于卷积神经网络的车牌字符识别方法技术

技术编号:22330738 阅读:52 留言:0更新日期:2019-10-19 12:23
本发明专利技术公开了一种用于车牌字符识别的卷积神经网络结构的构建方法,包括设定车牌识别卷积神经网络模型,对模型进行训练的步骤,其中车牌识别卷积神经网络初始结构包括2层卷积层、2层采样层、3层dropout层和2层全连接层,按照输入层、第一卷积层、第一采样层、第一dropout层、第二卷积层、第二采样层、第二dropout层、第一全连接层、第三dropout层、第二全连接层和输出层顺次相连,前序层的输出作为当前层的输入。本发明专利技术不仅在每一全连接层中加入dropout层,同时还在卷积层中加入了一个dropout层,并在多次试验中,将每个dropout层的丢弃概率值调整到了合适的值,使网络模型的性能较好,提升了模型的泛化能力和图像字符识别的准确率。

A method of license plate character recognition based on convolution neural network

【技术实现步骤摘要】
一种基于卷积神经网络的车牌字符识别方法
本专利技术涉及机器学习领域,特别涉及基于LeNet-5卷积神经网络构建一种改进的卷积神经网络结构,以用于车牌字符识别。
技术介绍
LeNet-5是最早提出的用于识别手写体数字方面的一种卷积神经网络模型。在设计网络时,设定的每层神经元代表一个学习到的中间特征,中间特征为几个权值的组合,网络所有神经元共同作用来表征输入数据的特定属性,以实现对图片进行自动分类等操作。当相对于网络的复杂程度(即网络的表达能力、拟合能力)而言数据量过小时,容易出现过拟合现象,显然这时各神经元表示的特征相互之间存在许多重复和冗余。为了防止这种过拟合现象,提高模型泛化能力,现在不少基于LeNet-5改进的模型被提出,一般是将dropout加在最后的全连接层,但效果不是特别理想,此外,dropout概率值的选取和最终的效果也有必然的联系,需要通过反复试验去对比。同时传统的LeNet-5网络结构包括现有的改进模型在识别相似字符时准确率不是很高且速度慢,容易识别错误,如将7识别成1,手写体2甚至识别成4等。
技术实现思路
针对上述的
技术介绍
,为克服卷积神经网络车牌字符识别算法中出现的过拟合问题以及相似字符识别率不高速度慢的问题,本专利技术提出一种用于车牌字符识别的卷积神经网络结构的构建方法,经该方法构建的卷积神经网络模型可显著防止过拟合的发生,提高模型对车牌字符识别的准确率。同时,本专利技术还提出了改变卷积神经网络特征层数目的车牌字符识别方法。本专利技术构建卷积神经网络车牌字符识别的技术方案是:一种用于车牌字符识别的卷积神经网络结构的构建方法,包括以下步骤:步骤A:基于经典卷积神经网络LeNet-5设定的用于车牌字符识别的卷积神经网络初始结构;步骤B:使用预处理后的一组字符样本训练图以及和训练图字符对应的标签对步骤A中设定的初始车牌识别卷积神经网络进行训练,得到训练好的车牌识别卷积神经网络;步骤C:使用预处理后的一组字符样本训练图以及和训练图字符对应的标签对步骤B中训练好的车牌识别卷积神经网络进行测试,得到验证后的车牌识别卷积神经网络;其中步骤A中所述车牌识别卷积神经网络初始结构包括2层卷积层、2层采样层、3层dropout层和2层全连接层,按照输入层、第一卷积层、第一采样层、第一dropout层、第二卷积层、第二采样层、第二dropout层、第一全连接层、第三dropout层、第二全连接层和输出层顺次相连,前序层的输出作为当前层的输入;其中所述卷积层用于对输入的图像进行特征提取,所述采样层用于降维和特征整合,所述全连接层用于线性变换,所述dropout层用于缩减网络臃肿结构,防止模型过拟合,提高收敛速度,所述输出层与所述第二全连接层构成一个Softmax分类器,所述Softmax分类器用于对字符图片进行分类,输出字符图片对应车牌中的字符。进一步的,所述输入层为36*28px大小的字符图像,所述第一卷积层和第二卷积层包括4个5*5的卷积核,所述第一采样层和第二采样层的采样窗口为2*2,采用最大池化方法对前序层的输出进行池化,所述第一全连接层包含256个神经元,所述第二全连接层包含128个神经元,所述第一dropout层、第二dropout层和第三dropout层的概率值为0.2~0.5,所述输出层为34个神经元构成的向量,对应除I和O外的24个字母和0~9十个数字。进一步的,所述第一dropout层的概率值为0.3,第二dropout层和第三dropout层的概率值为0.4。进一步的,步骤B中所述的一组字符样本训练图为手写字符图集或者车牌字符图集或者手写字符图集与车牌字符图集的混合图集。进一步的,第一卷积层的特征图数目为4,第二卷积层的特征图数目为12。本专利技术车牌识别方法的技术方案是:一种车牌识别方法,包括获取车牌的图像并进行预处理的步骤;对车牌进行分割,得到单个字符图像的步骤,以及使用卷积神经网络对分割后的字符进行识别的步骤,所述的卷积神经网络为按前述构建车牌识别卷积神经网络步骤训练所得的卷积神经网络。和现有技术相比,本专利技术在构建车牌识别卷积神经网络的结构上,不仅在每一全连接层中加入dropout层,同时还在卷积层中加入了一个dropout层,并在多次试验中,将每个dropout层的丢弃概率值调整到了合适的值,使网络模型的性能教好,提升了模型的泛化能力和图像字符识别准确率。附图说明附图1为本专利技术车牌识别卷积神经网络结构示意图。附图2为本专利技术车牌识别方法流程图。附图中,1为输入层,2为第一卷积层,3为第一采样层,4为第一dropout层,5为第二卷积层,6为第二采样层,7为第二dropout层,8为第一全连接层,9为第三dropout层,10为第二全连接层,11为输出层。具体实施方式以下参照附图,对本专利技术的技术方案和效果做进一步的详细说明。本专利技术公开了一种车牌识别卷积神经网络结构的构建方法,包括设定车牌识别卷积神经网络初始结构的步骤,还包括将车牌图像进行预处理,构成车牌训练的样本集的步骤,需要注意的是,上述两个步骤不构成时间上的先后顺序,然后将车牌训练的样本集的一部分作为训练集对设定车牌识别卷积神经网络模型进行训练,一部分作为测试集测试训练后的模型效果。参看图1,为本专利技术车牌识别卷积神经网络结构示意图,所述车牌识别卷积神经网络初始结构包括2层卷积层、2层采样层、3层dropout层和2层全连接层,按照输入层1、第一卷积层2、第一采样层3、第一dropout层4、第二卷积层5、第二采样层6、第二dropout层7、第一全连接层8、第三dropout层9、第二全连接层10和输出层11顺次相连,前序层的输出作为当前层的输入。其中输入层为36*28px(像素)大小的字符图像。第一卷积层2有4个大小为5*5的卷积核,在进行卷积运算后,可获得前序图层也即输入层中图像的一些局部特征。第一采样层3采用最大池化方式,每个采样窗口大小为2*2,层中的特征图经过下采样变成大小为16*12的特征图;在池化操作后降低了特征的维度并保留有效的信息,一定程度上避免过拟合;另外,可以使图像保持旋转、平移、伸缩不变形等。第二卷积层5得到12个大小为12*8的特征图,每个特征图都是S2层4个特征图卷积的累加,每个卷积核大小为5*5,共12*4个卷积核。第二采样层6采用最大池化方式,分别对该层的每个特征图进行下采样,得到12个大小为6*4的特征图,每个采样窗口大小为2*2。第一全连接层8包含256个神经元。全连接就是为了将卷积之前得到的所有局部特征整合,保证各个局部特征对整体图像的识别都起到一定的作用。从而实现图像分类。第二全连接层10包含128个神经元;得到全局特征信息输出。本实施例中,考虑到当网络复杂度高,训练数据量偏小时,模型会把训练样本特有的一些性质当做所有样本普遍具有的性质,从而导致模型泛化性能很差,故在第二采样层6后加入第二dropout层,以及在第一全连接层8后加入第三dropout层。而在全连接层增加dropout层后,在每次训练过程中,dropout强迫一个神经元和随机挑选出来的其他神经元共同工作,消弱减除了神经元节点之间的联合适应性,可以阻止某些特征的协同作用,使得模型不会太依赖某些局部特征,从而增强模型的鲁棒性。此外,本文档来自技高网...

【技术保护点】
1.一种用于车牌字符识别的卷积神经网络结构的构建方法,包括步骤A:基于经典卷积神经网络LeNet‑5设定车牌识别卷积神经网络初始结构;步骤B:使用预处理后的一组字符样本训练图以及和训练图字符对应的标签对步骤A中设定的初始车牌识别卷积神经网络进行训练,得到训练好的车牌识别卷积神经网络;步骤C:使用预处理后的一组字符样本训练图以及和训练图字符对应的标签对步骤B中训练好的车牌识别卷积神经网络进行测试,得到验证后的车牌识别卷积神经网络;其特征在于:步骤A中所述车牌识别卷积神经网络初始结构包括2层卷积层、2层采样层、3层dropout层和2层全连接层,按照输入层、第一卷积层、第一采样层、第一dropout层、第二卷积层、第二采样层、第二dropout层、第一全连接层、第三dropout层、第二全连接层和输出层顺次相连,前序层的输出作为当前层的输入;其中所述卷积层用于对输入的图像进行特征提取,所述采样层用于降维和特征整合,所述全连接层用于线性变换,所述dropout层用于简化复杂的网络结构,防止模型过拟合,提高收敛速度,所述输出层与所述第二全连接层构成一个Softmax分类器,所述Softmax分类器用于对字符图片进行分类,输出字符图片对应车牌中的字符。...

【技术特征摘要】
1.一种用于车牌字符识别的卷积神经网络结构的构建方法,包括步骤A:基于经典卷积神经网络LeNet-5设定车牌识别卷积神经网络初始结构;步骤B:使用预处理后的一组字符样本训练图以及和训练图字符对应的标签对步骤A中设定的初始车牌识别卷积神经网络进行训练,得到训练好的车牌识别卷积神经网络;步骤C:使用预处理后的一组字符样本训练图以及和训练图字符对应的标签对步骤B中训练好的车牌识别卷积神经网络进行测试,得到验证后的车牌识别卷积神经网络;其特征在于:步骤A中所述车牌识别卷积神经网络初始结构包括2层卷积层、2层采样层、3层dropout层和2层全连接层,按照输入层、第一卷积层、第一采样层、第一dropout层、第二卷积层、第二采样层、第二dropout层、第一全连接层、第三dropout层、第二全连接层和输出层顺次相连,前序层的输出作为当前层的输入;其中所述卷积层用于对输入的图像进行特征提取,所述采样层用于降维和特征整合,所述全连接层用于线性变换,所述dropout层用于简化复杂的网络结构,防止模型过拟合,提高收敛速度,所述输出层与所述第二全连接层构成一个Softmax分类器,所述Softmax分类器用于对字符图片进行分类,输出字符图片对应车牌中的字符。2.根据权利要求1所述的一种用于车牌识别的卷积神经网络结构的构建方法,其特征在于:所述输入层为36*28px大小的字符图像,所述第一卷积层和第二卷积层包括4个5*5的...

【专利技术属性】
技术研发人员:赵艳芹童朝娣
申请(专利权)人:黑龙江科技大学
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1