【技术实现步骤摘要】
一种扭曲粘连字符图片验证码的识别方法及系统
本专利技术属于图像识别
,更为具体地讲,涉及一种扭曲粘连字符图片验证码的识别方法及系统。
技术介绍
验证码(CAPTCHA)是“CompletelyAutomatedPublicTuringtesttotellComputersandHumansApart”(全自动区分计算机和人类的图灵测试)的缩写,是一种区分用户是计算机还是人的公共全自动程序。验证码的种类比较多,主要有基于图像模式、基于文本模式和基于语音模式三种。而最广泛使用的是基于文本模式的验证码。它通过对验证码中的文本字符进行扭曲、粘连、变形以及增加噪音来阻止验证码中的文本内容被机器人程序通过模式识别的方式进行识别。对于这种经过扭曲、粘连、变形后的验证码识别的瓶颈在于字符的分割,随着手写体识别技术的不断发展,很多算法对于单字符识别准确度都达到了90%以上,但是手写体的扭曲有很大的随机性,这和验证码如出一辙,所以这些技术可以直接用于验证码单字符的识别,单字符识别算法中,比较成熟且准确率较高的有BP神经网络,卷积神经网络,支持向量机等。但至今没能找到一种效果理想 ...
【技术保护点】
1.一种扭曲粘连字符图片验证码的识别方法,其特征在于,包括以下步骤:(1)获取一定量的图片验证码作为训练样本;(2)对获取的图片验证码进行预处理;(3)采用滴水算法对经过预处理后的图片验证码进行切割,得到单个字符块;(4)对切割后得到的单个字符块进行分类标注、缩放,并提取特征,将特征保存为LibSvm的数据格式,得到训练集;(5)利用训练集对支持向量机svm_train函数的数据进行训练,得到训练好的识别模型;(6)重新获取一定量的图片验证码作为测试样本,重复步骤(2)至步骤(4),得到测试集;(7)将测试集输入识别模型进行识别,得到图片验证码的识别结果。
【技术特征摘要】
1.一种扭曲粘连字符图片验证码的识别方法,其特征在于,包括以下步骤:(1)获取一定量的图片验证码作为训练样本;(2)对获取的图片验证码进行预处理;(3)采用滴水算法对经过预处理后的图片验证码进行切割,得到单个字符块;(4)对切割后得到的单个字符块进行分类标注、缩放,并提取特征,将特征保存为LibSvm的数据格式,得到训练集;(5)利用训练集对支持向量机svm_train函数的数据进行训练,得到训练好的识别模型;(6)重新获取一定量的图片验证码作为测试样本,重复步骤(2)至步骤(4),得到测试集;(7)将测试集输入识别模型进行识别,得到图片验证码的识别结果。2.根据权利要求1所述的扭曲粘连字符图片验证码的识别方法,其特征在于,所述步骤(2)具体包括:若是彩色图片验证码则将其先采用加权平均法进行灰度化转换成灰度图片;然后将灰度图片采用最大类间方差法进行二值化处理转换成黑白图片;最后去除黑白图片中的干扰线,并采用修复算法把隔断的白色部分进行修补。3.根据权利要求1所述的扭曲粘连字符图片验证码的识别方法,其特征在于,所述步骤(4)具体包括:对切割后得到的单个字符块进行分类标注;对标注好类标号的图片按预设大小进行缩放;对缩放后的图片进行特征提取,得到训练集。4.一种扭曲粘连字符图片验证码的识别系统,其特征在于,包括:获取模块:...
【专利技术属性】
技术研发人员:余刚,
申请(专利权)人:成都市映潮科技股份有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。