一种文本验证码识别方法技术

技术编号：29615514 阅读：22 留言：0更新日期：2021-08-10 18:31

本发明专利技术公开了一种文本验证码识别方法，具体步骤包括以下步骤：对验证码进行预处理；通过对抗训练的方法训练一对神经网络模型，分割网络和识别网络；由分割网络对预处理后的验证码进行分割；识别网络对分割的验证码进行识别。在对抗训练阶段引入一个分割网络和一个识别网络，解决了验证码在分割过程中因信息丢失而导致识别率不高的问题，同时在训练过程中分割网络会筛选出分割困难的验证码，识别网络也针对这些验证码进行训练，两个网络模型对抗训练，提高了验证码识别的准确率。本发明专利技术解决了验证码字符粘贴、扭曲、干扰信息难以去除，识别准确率低的问题，同时作用效果显著，适于广泛推广。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本验证码识别方法
本专利技术涉及验证码识别
，特别涉及，一种文本验证码识别方法。
技术介绍
验证码是为防止计算机恶意注册、刷票和论坛灌水的一种自动响应程序，在2003年提出后一直被广泛使用。验证码技术的全称是“全自动区分计算机和人类的图灵测试”基本思想：根据预先人为制定的规则，由计算机系统自动生成一个用户可以很容易解决但是计算机系统却很难或者根本无法解决的问题。其中文本验证码是使用最广泛的验证码技术之一，目前对于它的识别研究已经成为了一个比较热门的领域。文本验证码由多个随机产生的字符组生成。为了增加识别难度通常会使字符扭曲、形变并且加入干扰噪声。现阶段虽然有很多文本验证码替代方案，但许多网站和应用程序仍然使用其作为安全和身份验证的主要手段。现今，文本验证码的安全性不断提高，新引入的安全特性使得许多传统的识别方法不再适用。对于扭曲、粘贴的验证码这种现象更加明显。针对文本验证码中字符粘贴、扭曲、干扰信息难以去除，识别准确率低等问题，本专利技术提出一种文本验证码识别方法，解决上述问题。
技术实现思路
针对上述缺陷，本专利技术解决的技术问题在于，提供一种文本验证码识别方法，以解决现在技术所存在的验证码字符粘贴、扭曲、干扰信息难以去除，识别准确率低等问题。本专利技术提供了一种文本验证码识别方法，包括以下步骤：步骤1、对验证码进行预处理,生成预处理后的验证码；步骤2、通过对抗训练的方法训练一对神经网络模型，所述一对神经网络模型包括分割网络和识别网络；...

【技术保护点】
1.一种文本验证码识别方法，其特征在于，包括以下步骤：/n步骤1、对验证码进行预处理,生成预处理后的验证码；/n步骤2、通过对抗训练的方法训练一对神经网络模型，所述一对神经网络模型包括分割网络和识别网络；/n步骤3、由分割网络对所述预处理后的验证码进行分割，生成分割后的验证码；/n步骤4、识别网络对所述分割后的验证码进行识别。/n

【技术特征摘要】
1.一种文本验证码识别方法，其特征在于，包括以下步骤：
步骤1、对验证码进行预处理,生成预处理后的验证码；
步骤2、通过对抗训练的方法训练一对神经网络模型，所述一对神经网络模型包括分割网络和识别网络；
步骤3、由分割网络对所述预处理后的验证码进行分割，生成分割后的验证码；
步骤4、识别网络对所述分割后的验证码进行识别。

2.根据权利要求1所述的一种文本验证码识别方法，其特征在于，所述步骤2包括：
步骤2.1、将预处理后的文本验证码使用平均法分割法分割，生成平均分割后的验证码；
步骤2.2、将所述平均分割后的验证码放入识别网络，识别网络经过训练后得到准确率和丢失率；
步骤2.3、根据准确率和损失函数对切割的性能和难易程度进行评估；
步骤2.4、调整分割网络分割验证码的位置，同时找出分割困难的验证码；
步骤2.5、识别网络对经过步骤2.4分割后的验证码进行识别训练。

3.根据权利要求1所述的一种文本验证码识别方法，其特征在于，所述步骤1包括：
步骤1.1、训练预处理网络模型；
步骤1.2、利用训练好的预处理网络模型去...

【专利技术属性】
技术研发人员：冷勇，
申请(专利权)人：北京享云智汇科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人