基于卷积神经网络的无固定多字符验证码识别方法技术

技术编号:22784127 阅读:19 留言:0更新日期:2019-12-11 04:22
基于卷积神经网络的无固定多字符验证码识别方法,涉及到字符验证码识别方法技术领域。解决传统的字符验证码识别方法存在效率低,无法对相连或重叠字符定位识别,及不定字符数量的图片难处理或无法处理等的技术不足,步骤:(1)图像预处理;(2)特征提取;使用卷积神经网络进行处理;(3)字符识别;将提取得到的特征分别作为不同全连接网络的输入;最后,将所有概率进行累乘,取概率最大的字符长度和字符组合作为最终的输出。运用多层卷积神经网络对图片进行预处理,提取图片特征信息;再运用概率模型作为优化目标,能够处理图片中无固定长度字符的识别问题,能够处理不定字符数量的图片,提高识别准确率,加快了处理效率和速度。

Recognition method of non fixed multi character verification code based on convolutional neural network

The recognition method of non fixed multi character verification code based on convolutional neural network relates to the technical field of character verification code recognition. The traditional method of character verification code recognition has the disadvantages of low efficiency, unable to locate and recognize the connected or overlapped characters, and difficult to process or unable to process the pictures with indefinite number of characters. The steps are: (1) image preprocessing; (2) feature extraction; processing with convolutional neural network; (3) character recognition; taking the extracted features as the input of different full connected networks respectively Finally, all probabilities are multiplied, and the character length and character combination with the largest probability are taken as the final output. The multi-layer convolution neural network is used to preprocess the image and extract the feature information of the image. Then, the probability model is used as the optimization objective, which can deal with the problem of recognition without fixed length characters in the image, can deal with the image with variable number of characters, improve the recognition accuracy, and accelerate the processing efficiency and speed.

【技术实现步骤摘要】
基于卷积神经网络的无固定多字符验证码识别方法
本专利技术涉及到字符验证码识别方法

技术介绍
传统的字符验证码识别方法都是对图像机型分步处理,具体处理流程是:待识别的字符验证码图像输入到识别系统中,首先要进行字符的定位,即要根据算法得到图中字符的位置;然后根据位置信息将所有字符分割成单独字符的形式;最后将单独的字符再送入最后的分类器中进行分类识别得到被分割的单独字符图像代表的字符信息进行组合才能得到最后的识别结。传统的字符验证码识别方法的缺点:(1)需要对图像进行分步处理,处理效率和速度较慢;(2)对于一些相连或者重叠的字符,难以对字符进行准确定位;(3)对于不定字符数量的图片难以处理甚至无法处理。
技术实现思路
综上所述,本专利技术的目的在于解决传统的字符验证码识别方法存在效率低,无法对相连或重叠字符定位识别,及不定字符数量的图片难处理或无法处理等的技术不足,而提出一种基于卷积神经网络的无固定多字符验证码识别方法。为解决本专利技术所提出的技术问题,采用的技术方案为:基于卷积神经网络的无固定多字符验证码识别方法,其特征在于所述方法采用如下步骤:(1)图像预处理;对输入图像的大小进行统一处理和减噪处理;(2)特征提取;使用卷积神经网络进行处理;其中,卷积神经网络的卷积层提取图片中的局部特征信息;卷积神经网络的池化层减少网络优化参数的数量;卷积神经网络的归一化层防止网络优化过程中发生梯度消失;卷积神经网络的输出层作为特征输入的下一步的字符识别任务中;(3)字符识别;将提取得到的特征分别作为不同全连接网络的输入,其中一个全连接网络用于判断图片中字符的长度,其余全连接网络分别表示对应位置的字符;最后,将所有概率进行累乘,取概率最大的字符长度和字符组合作为最终的输出。在(3)字符识别过程中,在给定一张图片的条件下,训练一个序列概率模型;令S表示表示输出的结果序列,X表示输入的图片;目标是训练模型P(S|X),使得在训练集上logP(S|X)的值最大化;定义S作为一个包含N个随机变量S1,S2,…,SN的集合表示输出序列的元素,定义随机变量L表示输出序列的长度,假设输出序列中各个字符出现的概率都是独立的,因此,模型的概率可以表示为:为了使得模型能够识别不定长度的字符,加入了额外的变量L来限制输出序列的长度;由于概率模型不能直接用图像作为输入,因此,用卷积神经网络所提取的特征作为概率模型的输入,用随机变量H表示所提取的特征;在这个模型中:P(S|X)=P(S|H)模型训练阶段,为了使得logP(S|X)在训练集上最大化,使用随机梯度下降法进行优化,每个softmax模型可以使用完全相同的反向传播学习规则;在测试阶段,预测:argmax阶段可以在线性的时间复杂度下被计算出来,而且每个字符都可以被独立的计算。本专利技术的有益效果为:本专利技术的方法运用多层卷积神经网络对图片进行预处理,提取图片特征信息;再运用概率模型作为优化目标,改模型能够处理图片中无固定长度字符的识别问题,能够处理不定字符数量的图片,提高识别准确率,实现端到端的字符识别,避免了传统方法定位、分割、识别的分步操作,加快了处理效率和速度。附图说明图1为本专利技术的工作流程示意图;图2为本专利技术的具体实施例的工作流程示意图。具体实施方式以下结合附图和本专利技术优选的具体实施例对本专利技术的方法作进一步地说明。参照图1和图2中所示,本专利技术基于卷积神经网络的无固定多字符验证码识别方法,其特征在于所述方法采用如下步骤:(1)图像预处理;对输入图像的大小进行统一处理和减噪处理;对于大量原始的输入图像,难免会存在尺寸不统一的问题,由于本专利技术所提出的方法只能接受相同大小的输入图像,因此,要对图像的大小进行统一,可以使用缩放、剪裁等方式。此外,由于验证码图片存在大量的噪声,可以提高图片对比度来减小噪声的影响。(2)特征提取;使用卷积神经网络进行处理;其中,卷积神经网络的卷积层的使用能够最大程度地提取图片中的局部特征信息;卷积神经网络的池化层能够减少网络优化参数的数量;卷积神经网络的归一化层防止网络优化过程中发生梯度消失;卷积神经网络的输出层作为特征输入的下一步的字符识别任务中;(3)字符识别;将提取得到的特征分别作为不同全连接网络的输入,其中一个全连接网络用于判断图片中字符的长度,其余全连接网络分别表示对应位置的字符;最后,将所有概率进行累乘,取概率最大的字符长度和字符组合作为最终的输出。本专利技术的方法是在给定一张图片的条件下,训练一个序列概率模型。令S表示表示输出的结果序列,X表示输入的图片。本专利技术的目标是训练模型P(S|X),使得在训练集上logP(S|X)的值最大化。本专利技术定义S作为一个包含N个随机变量S1,S2,…,SN的集合表示输出序列的元素,定义随机变量L表示输出序列的长度,本专利技术假设输出序列中各个字符出现的概率都是独立的,因此,模型的概率可以表示为:为了使得模型能够识别不定长度的字符,本专利技术所做的是加入了额外的变量L来限制输出序列的长度。由于概率模型不能直接用图像作为输入,因此,本专利技术用卷积神经网络所提取的特征作为概率模型的输入,用随机变量H表示所提取的特征。在这个模型中:P(S|X)=P(S|H)模型训练阶段,为了使得logP(S|X)在训练集上最大化,本专利技术可以使用随机梯度下降法进行优化,每个softmax模型可以使用完全相同的反向传播学习规则。在测试阶段,本专利技术预测:argmax阶段可以在线性的时间复杂度下被计算出来,而且每个字符都可以被独立的计算。也即是本专利技术对输入图像首先由卷积神经网络层进行卷积计算,经过多层的卷积、池化、归一化操作最终可以提取到图像的特征信息,将特征信息传递给概率输出层。概率输出层是由多个单层的神经网络构成的,可以将图像特征映射到每个字符的概率上,最终得到概率最大的字符组合就是该图像的识别结果输出。本专利技术技术方案:(1)实现端到端的字符识别,避免了传统方法定位、分割、识别的分步操作,加快了处理效率和速度。(2)没有预先设定图像包含字符的个数,通过概率组合得到概率最大字符组合便是识别结果的输出,能够处理不定长字符的图像识别问题。本文档来自技高网...

【技术保护点】
1.基于卷积神经网络的无固定多字符验证码识别方法,其特征在于所述方法采用如下步骤:/n(1)图像预处理;对输入图像的大小进行统一处理和减噪处理;/n(2)特征提取;使用卷积神经网络进行处理;其中,卷积神经网络的卷积层提取图片中的局部特征信息;卷积神经网络的池化层减少网络优化参数的数量;卷积神经网络的归一化层防止网络优化过程中发生梯度消失;卷积神经网络的输出层作为特征输入的下一步的字符识别任务中;/n(3)字符识别;将提取得到的特征分别作为不同全连接网络的输入,其中一个全连接网络用于判断图片中字符的长度,其余全连接网络分别表示对应位置的字符;最后,将所有概率进行累乘,取概率最大的字符长度和字符组合作为最终的输出。/n

【技术特征摘要】
1.基于卷积神经网络的无固定多字符验证码识别方法,其特征在于所述方法采用如下步骤:
(1)图像预处理;对输入图像的大小进行统一处理和减噪处理;
(2)特征提取;使用卷积神经网络进行处理;其中,卷积神经网络的卷积层提取图片中的局部特征信息;卷积神经网络的池化层减少网络优化参数的数量;卷积神经网络的归一化层防止网络优化过程中发生梯度消失;卷积神经网络的输出层作为特征输入的下一步的字符识别任务中;
(3)字符识别;将提取得到的特征分别作为不同全连接网络的输入,其中一个全连接网络用于判断图片中字符的长度,其余全连接网络分别表示对应位置的字符;最后,将所有概率进行累乘,取概率最大的字符长度和字符组合作为最终的输出。


2.根据权利要求1所述的基于卷积神经网络的无固定多字符验证码识别方法,其特征在于:在(3)字符识别过程中,在给定一张图片的条件下,训练一个序列概率模型;令S表示表示输出的结果序列,X表示输入的...

【专利技术属性】
技术研发人员:严文辉
申请(专利权)人:深圳索信达数据技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1