当前位置: 首页 > 专利查询>吴贤城专利>正文

一种基于Gabor的计算机图像验证码识别算法制造技术

技术编号:17486506 阅读:39 留言:0更新日期:2018-03-17 10:44
本发明专利技术涉及计算机图像验证码识别领域,尤其设计一种通过Gabor滤波实现图像自动识别的技术及其方法。本发明专利技术包含两部分,第一部分为提取用于识别计算机图像验证码内容的特征集过程,第二部分为基于机器学习方法的计算机图像验证码识别模型的训练与识别过程。计算机图像验证码内容特征集的提取采用与人类视觉系统相似的二维离散Gabor滤波与计算机图像验证码做卷积后得到,采用不同的参数以得到不同的图像特征集,包括波长、相位、方向、高斯标准差和窗口比率等;基于机器学习的方法采用有监督学习的支持向量机方法实现,采用高斯径向基RBF核函数,根据已标识计算机图像验证码进行训练得到识别模型后,根据模型对未知计算机图像验证码内容进行识别。

A computer image verification code recognition algorithm based on Gabor

The invention relates to the field of computer image verification code recognition, especially a technique and method for realizing automatic image recognition by Gabor filtering. The invention consists of two parts. The first part is the process of extracting feature set for identifying the content of computer image authentication code. The second part is the training and recognition process of computer image recognition code recognition model based on machine learning method. Computer image verification code content extraction feature set by similarity with the human visual system of 2-D Gabor filtering and image verification code after convolution, using different parameters to obtain different image features, including the wavelength, phase and direction, Gao Sibiao quasi difference and ratio of window; machine learning method used to achieve the support vector machine method based on supervised learning, using the Gauss radial basis kernel function RBF, according to the identified image verification code identification model for training, according to the model of the unknown image verification code identification content.

【技术实现步骤摘要】
一种基于Gabor的计算机图像验证码识别算法
本专利技术涉及计算机图像验证码识别领域,尤其设计一种通过Gabor滤波实现图像自动识别的技术及其方法。本专利技术包含两部分,第一部分为提取用于识别计算机图像验证码内容的特征集过程,第二部分为基于机器学习方法的计算机图像验证码识别模型的训练与识别过程。计算机图像验证码内容特征集的提取采用与人类视觉系统相似的二维离散Gabor滤波与计算机图像验证码做卷积后得到,采用不同的参数以得到不同的图像特征集,包括波长、相位、方向、高斯标准差和窗口比率等;基于机器学习的方法采用有监督学习的支持向量机方法实现,采用高斯径向基RBF核函数,根据已标识计算机图像验证码进行训练得到识别模型后,根据模型对未知计算机图像验证码内容进行识别。
技术介绍
CAPTCHA(CompletelyAutomatedPublicTuringtesttotellComputersandHumansApart)技术是一种广泛使用的用于区分人与机器的技术,该技术常见的形式是通过图像验证码来阻止非人类的访问。这类图像验证码一般采用增加扭曲、增加背景色、字符旋转和加入椒盐噪声等手段使得普通的图像识别算法无法正确识别图像内容。
技术实现思路
为了克服普通图像识别算法无法识别图像验证码的问题,本专利技术通过基于Gabor滤波的方法解决这一问题。Gabor变换在信号的时频分析中有着广泛的应用,而离散Gabor变换在图像处理中由于符合人类视觉系统的多分辨率多通信的特性也有较多的研究,研究发现二维的Gabor函数与人类脑部负责视觉系统的皮层接受野相似,因此可以通过Gabor滤波来有效地模仿人类视觉系统表示图像,进而可以应用在图像的纹理提取和图像识别等方面。二维的Gabor函数是由正统函数和高斯函数调制而成的,其表达式可以用公式表示如附图1。图1公式为Gabor函数的复数形式,一般情况下我们只考虑其实值部分,如图2所示。实值部分对应于频率于的幅值部分,其中参数λ表示波长,θ表示方向,φ对应于相移,σ为高斯函数的标准差,对应于窗口的宽高比率。将不同参数的Gabor滤波作用于验证码图像,获得图像的特征集,作为SVM的输入。图像的识别可以划分为训练和分类两个过程。首先输入一批带标签的验证码,在对验证码图像进行预处理和Gabor变换后提取得到相应的图像特征,再将得到的特征集输入SVM训练器进行训练,将训练后得结果保存为识别模型。对未知的验证码进行识别时需要先载入训练好的模型,对图像进行同样的预处理操作和Gabor变换后将得到的图像特征输入SVM模型从而得到分类的结果即识别码。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图3为基于Gabor的OCR算法处理流程;图4为本专利技术实施过程中得到的部分特征图像;图5为本专利技术实施的具体案例图像;具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例1:如图5所示,我们将首先获取足够量的图像验证码,通过人工标注的方法将图像验证码的内容进行标识并将整幅图像按字符切割成单个字符,保证每个字符都有足够量的对应图像验证码样本。将切割得到的图像通过二维离散Gabor滤波得到特征集Fλ,θ,φ,σ,γ,如图6所示。其中*表示卷积乘。不同的Gabor滤波参数代表不同的滤波效果,如λ参数表示二维Gabor的波长,用于模拟人眼对于图像识别的层次感。波长大,得到的将是图像的轮廓特征,波长小时,通过卷积得到的将是图像的细节特征。将不同Gabor参数得到特征集作为支持向量机的特征集输入,如图7所示。Fi对应于第i组参数得到的特征。支持向量机采用非线性高斯径向基RBF(RadialBasisFunction)核函数,并采用LIBSVM工具(参考文献:C.-C.ChangandC.-J.Lin.LIBSVM:alibraryforsupportvectormachines.ACMTransactionsonIntelligentSystemsandTechnology,2:27:1--27:27,2011.)进行网络搜索最优参数集{C,},其中C为惩罚系数,为高斯径向基参数。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。以上所述的实施方式,并不构成对该技术方案保护范围的限定。任何在上述实施方式的精神和原则之内所作的修改、等同替换和改进等,均应包含在该技术方案的保护范围之内。本文档来自技高网...
一种基于Gabor的计算机图像验证码识别算法

【技术保护点】
一种计算机图像验证码识别算法,其特征是:基于滤波和机器学习方法,采用二维的离散Gabor滤波提取用于识别图像的特征集,利用支持向量机对特征集进行学习训练后来识别图像。

【技术特征摘要】
1.一种计算机图像验证码识别算法,其特征是:基于滤波和机器学习方法,采用二维的离散Gabor滤波提取用于识别图像的特征集,利用支持向量机对特征集进行学习训练后来识别图像。2.根据权利要求1所述的计算机图像验证码识别算法,其特征是:采用机器学习方法进行图像识别,如采用支持向量机方法。3.根据权利要求1所述的计算机图像验证码识别算法,其特征是:采用滤波方法提取特征集,如采用二维离散Gabor滤波。4.根据权利要求1所述的计算...

【专利技术属性】
技术研发人员:吴贤城
申请(专利权)人:吴贤城
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1