移动平台的验证码识别系统及识别方法技术方案

技术编号:15330253 阅读:70 留言:0更新日期:2017-05-16 13:45
本发明专利技术公开了一种移动平台的验证码识别系统及识别方法,识别系统包括:移动平台验证码截取模块:用于将原始验证码图片从移动平台截取至验证码识别系统;验证码降噪模块:用于将原始验证码图片通过中值滤波算法进行降噪,得到二次验证码图片;验证码二值化模块:用于将二次验证码图片转化为黑白二色的图片,并切割成多个验证码子块;验证码识别核心模块:用于识别出切割好的验证码子块,并得出验证码代表的字符串,将字符串代表的算式值计算出来;自主学习模块:用于对最优可能的字符进行猜测性尝试,若对猜测值能正确通过,则自动将猜测值记录到自主学习数据库中。本发明专利技术能对移动平台提供的接口所包含的验证码进行快速自动识别、提升用户的体验。

Verification code recognition system and identification method for mobile platform

The invention discloses a verification code recognition system of a mobile platform and identification method, identification system includes: mobile platform verification code interception module: for the original picture verification code from the mobile platform to intercept verification code verification code identification system; noise reduction module: for the original verification code image denoising by median filtering algorithm, get the two verification code verification code image; binarization module for the two code image into black and white two color pictures, and cut into a plurality of verification code blocks; identification code for identifying core modules: cutting good verification code block, and the verification code represents the string string. The formula is calculated; independent learning module for speculative attempts on the optimal possible character, if the guess right through, it will automatically guess The value is recorded in an autonomic learning database. The invention can quickly and automatically identify the verification code provided by the mobile platform and enhance the user experience.

【技术实现步骤摘要】
移动平台的验证码识别系统及识别方法
本专利技术涉及验证码识别领域,特别涉及一种移动平台的验证码识别系统及识别方法。
技术介绍
全自动区分计算机和人类的公开图灵测试(CompletelyAutomatedPublicTuringtesttotellComputersandHumansApart,简称CAPTCHA)俗称验证码,是一种区分用户是计算机或人的公共全自动程序。在CAPTCHA测试中,作为服务器的计算机会自动生成一个问题由用户来解答。这个问题可以由计算机生成并评判,但是必须只有人类才能解答。由于计算机无法解答CAPTCHA的问题,所以回答出问题的用户就可以被认为是人类。CAPTCHA目前广泛用于网站的留言板,许多留言板为防止有人利用计算机程序大量在留言板上张贴广告或其他垃圾消息,因此会放置CAPTCHA要求留言者必须输入图片上所显示的数字或是算术题才可以完成留言。而为了避免被计算机程序以暴力法大量尝试交易,一些网络上的交易系统(如订票系统、网络银行)也会有CAPTCHA的机制。传统的验证码的生成方式较为简单,目前各平台使用的验证码技术从增加干扰点、线,到扭曲、变形验证码中的字符,更甚至通过点击答案图片、拖动图片拼图的方式来防止验证码被机器识别,阻止其他恶性行为的发生。在现有的自动化测试是,移动平台提供的接口模块包含验证码功能,而现有技术在对移动平台提供的接口所包含的验证码进行识别时,其识别较慢,严重影响用户的体验。另外,目前各网站基本都使用了验证码识别技术,该验证码识别技术可以有效地阻止计算机直接进入网站系统,为用户的信息安全提供了强大的保障。但有时也存在着阻碍自动化测试的普通验证码,这一类验证码的结构较为简单,却对自动化测试产生了较大的阻碍,在不得关闭服务器的验证码功能以及探寻到万能验证码的情况下,如何解决验证码的自动识别问题,成了自动化测试最大的瓶颈。
技术实现思路
本专利技术要解决的技术问题在于,针对现有技术的上述缺陷,提供一种能对移动平台提供的接口所包含的验证码进行快速自动识别、提升用户的体验的移动平台的验证码识别系统及识别方法。本专利技术解决其技术问题所采用的技术方案是:构造一种移动平台的验证码识别系统,包括:移动平台验证码截取模块:用于将原始验证码图片从移动平台截取至所述移动平台的验证码识别系统,做进一步的处理操作;验证码降噪模块:与所述移动平台验证码截取模块连接,用于将截取到的所述原始验证码图片通过中值滤波算法进行降噪处理,得到二次验证码图片;验证码二值化模块:与所述验证码降噪模块连接,用于将所述二次验证码图片转化为黑白二色的图片,并按照预先设定的截取框大小将所述黑白二色的图片切割成多个验证码子块;验证码识别核心模块:与所述验证码二值化模块连接,用于根据总像素含量、像素匹配度、线段拐角匹配度以及自主学习模块产生的学习库比较法,识别出切割好的所述验证码子块,并得出验证码代表的字符串,将所述字符串代表的算式值计算出来;自主学习模块:与所述验证码识别核心模块连接,用于当所述验证码识别核心模块无法通过算法和学习库比较法得出结果时,根据得到的总像素含量值、像素匹配度和线段拐角匹配度中最优可能的字符进行猜测性尝试,若移动平台接收到计算好的猜测值并能正确通过,则所述移动平台的验证码识别系统自动将所述猜测值记录到自主学习数据库中。在本专利技术所述的移动平台的验证码识别系统中,所述验证码的个数为5块。本专利技术还涉及一种利用上述移动平台的验证码识别系统进行验证码的识别方法,包括如下步骤:A)验证码截取模块将移动平台产生的原始验证码图片截取下来,并保存验证码的输入位置和提交按钮的位置;B)使用验证码降噪模块对所述原始验证码图片进行中值滤波,得到二次验证码图片;C)采用验证码二值化模块计算所述二次验证图片中的整体像素平均值,根据所述整体像素平均值设定阈值,将低于所述阈值的部分设定为黑色,将高于所述阈值的部分设定为白色,并将二值化后得到的黑白二色的图片按照预先设定的截取框切割成多个验证码子块;D)采用验证码识别核心模块对每一个所述验证码子块所代表的字符进行识别;E)将识别得到的结果值自动填入到所述验证码的输入位置,并自动点击所述提交按钮,判断所述移动平台返回的状态是否为成功,如是,进行后续的自动化测试;否则,调用第三方人工识别,得出正确结果后经由同步器将其同步至自主学习数据库。在本专利技术所述的识别方法中,所述步骤D)进一步包括:D1)对于每一个所述验证码子块,先计算出原图的总黑色像素数x、学习库比对图的总黑色像素数y、匹配的黑色像素个数a和当前学习图中匹配的黑色像素个数的最大值b,并根据所述原图的总黑色像素数x、学习库比对图的总黑色像素数y、匹配的黑色像素个数a和当前学习图中匹配的黑色像素个数的最大值b计算出原图黑色像素匹配率r1=a/x和学习库黑色像素匹配率r2=a/y;执行步骤D2)或D3);D2)若a大于b,且r1>0.6,则令b=a,β=r1,α=r2;其中,α为最大学习图匹配率,β为最大原图匹配率;若|y-x|≤4,且r1≥0.7,r2≥0.8,或者|y-x|>4且r1≥0.6,r2≥0.6,则认为学习图为原图的一个解;D3)若a不大于b,则根据b、α和β计算出加权平均值(b*0.5+α*0.25+β*0.25),选择加权平均值最高者作为猜测字符,得到最终的字符串计算式,测算出结果值并返回。在本专利技术所述的识别方法中,对于包含猜测字符的,在测算出的结果值的末尾设置一个标识位,当所述标识位的值为False时,表示所述测算出的结果值为猜测结果。在本专利技术所述的识别方法中,对于标识位为False的猜测结果,将所述猜测结果自动填入到所述验证码的输入位置,并自动点击所述提交按钮,当移动平台返回的状态为成功时,则经由所述同步器将所述猜测结果存入所述自主学习数据库,当移动平台返回的状态为失败时,则调用第三方人工识别,得出正确结果后,经由所述同步器将正确结果同步至所述自主学习数据库。在本专利技术所述的识别方法中,所述验证码子块的个数为5块。实施本专利技术的移动平台的验证码识别系统及识别方法,具有以下有益效果:由于对截取到的原始验证码图片通过中值滤波算法进行降噪处理,得到二次验证码图片;然后将二次验证码图片转化为黑白二色的图片,并切割成多个验证码子块;对切割好的验证码子块进行识别,得出验证码代表的字符串,对最优可能的字符进行猜测性尝试,若移动平台接收到计算好的猜测值并能正确通过,则自动将猜测值记录到自主学习数据库中;本专利技术能解决简单旋转、放大缩小的字符验证码图片的识别,对于计算式会进行自动运算,得出正确结果并返回,自身具备自主学习的优点,对于未正确识别过的字符,会进行猜测,第三方验证码若通过,会将本次猜测结果保存到自主学习数据库,如此一来,随着程序的运行时间越久,整体识别验证码的正确率将会越来越高,所以其能对移动平台提供的接口所包含的验证码进行快速自动识别、提升用户的体验。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其本文档来自技高网
...
移动平台的验证码识别系统及识别方法

【技术保护点】
一种移动平台的验证码识别系统,其特征在于,包括:移动平台验证码截取模块:用于将原始验证码图片从移动平台截取至所述移动平台的验证码识别系统,做进一步的处理操作;验证码降噪模块:与所述移动平台验证码截取模块连接,用于将截取到的所述原始验证码图片通过中值滤波算法进行降噪处理,得到二次验证码图片;验证码二值化模块:与所述验证码降噪模块连接,用于将所述二次验证码图片转化为黑白二色的图片,并按照预先设定的截取框大小将所述黑白二色的图片切割成多个验证码子块;验证码识别核心模块:与所述验证码二值化模块连接,用于根据总像素含量、像素匹配度、线段拐角匹配度以及自主学习模块产生的学习库比较法,识别出切割好的所述验证码子块,并得出验证码代表的字符串,将所述字符串代表的算式值计算出来;自主学习模块:与所述验证码识别核心模块连接,用于当所述验证码识别核心模块无法通过算法和学习库比较法得出结果时,根据得到的总像素含量值、像素匹配度和线段拐角匹配度中最优可能的字符进行猜测性尝试,若移动平台接收到计算好的猜测值并能正确通过,则所述移动平台的验证码识别系统自动将所述猜测值记录到自主学习数据库中。

【技术特征摘要】
1.一种移动平台的验证码识别系统,其特征在于,包括:移动平台验证码截取模块:用于将原始验证码图片从移动平台截取至所述移动平台的验证码识别系统,做进一步的处理操作;验证码降噪模块:与所述移动平台验证码截取模块连接,用于将截取到的所述原始验证码图片通过中值滤波算法进行降噪处理,得到二次验证码图片;验证码二值化模块:与所述验证码降噪模块连接,用于将所述二次验证码图片转化为黑白二色的图片,并按照预先设定的截取框大小将所述黑白二色的图片切割成多个验证码子块;验证码识别核心模块:与所述验证码二值化模块连接,用于根据总像素含量、像素匹配度、线段拐角匹配度以及自主学习模块产生的学习库比较法,识别出切割好的所述验证码子块,并得出验证码代表的字符串,将所述字符串代表的算式值计算出来;自主学习模块:与所述验证码识别核心模块连接,用于当所述验证码识别核心模块无法通过算法和学习库比较法得出结果时,根据得到的总像素含量值、像素匹配度和线段拐角匹配度中最优可能的字符进行猜测性尝试,若移动平台接收到计算好的猜测值并能正确通过,则所述移动平台的验证码识别系统自动将所述猜测值记录到自主学习数据库中。2.根据权利要求1所述的移动平台的验证码识别系统,其特征在于,所述验证码的个数为5块。3.一种利用如权利要求1所述的移动平台的验证码识别系统进行验证码的识别方法,其特征在于,包括如下步骤:A)验证码截取模块将移动平台产生的原始验证码图片截取下来,并保存验证码的输入位置和提交按钮的位置;B)使用验证码降噪模块对所述原始验证码图片进行中值滤波,得到二次验证码图片;C)采用验证码二值化模块计算所述二次验证图片中的整体像素平均值,根据所述整体像素平均值设定阈值,将低于所述阈值的部分设定为黑色,将高于所述阈值的部分设定为白色,并将二值化后得到的黑白二色的图片按照预先设定的截取框切割成多个验证码子块;D)采用验证码识别核心模块对每一个所述验证码子块所代表的字符进行识别;E)将识别得到的结果值自动填入到所述验证码的输入位置,并自动点击所述提交按钮,判断所述移动平台返回的状态是否为成功,如是,进行后续的自动...

【专利技术属性】
技术研发人员:张博熊琦松李十子毕文波谭颖骞胡剑
申请(专利权)人:深圳博十强志科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1