验证码自动识别方法及装置制造方法及图纸

技术编号:24757963 阅读:154 留言:0更新日期:2020-07-04 09:34
本申请公开一种验证码自动识别方法及装置,方法包括如下步骤:步骤1:基于图像处理库获取多个同一类型的验证码图片,生成验证码图片集;步骤2:基于seq2seq+attention深度神经网络模型,使用验证码图片集中的部分验证码图片训练模型,剩余的验证码图片对训练后的模型进行测试,得到验证码识别模型;步骤3:根据验证码识别模型识别待破解的验证码图片。装置对应于上述方法。本发明专利技术提供的验证码识别技术,自动高效识别验证码,极大的提高系统维护工作的自动化效率,从而提高整个系统的稳定性。

Automatic identification method and device of verification code

【技术实现步骤摘要】
验证码自动识别方法及装置
本申请一般涉及机器学习的
,具体涉及一种验证码识别方法,尤其涉及一种验证码自动识别方法及装置。
技术介绍
在互联网技术发达的今天,为防止机器人自动注册登录网站进行恶意操作,大多数网站都采用了验证码技术(随机生成一串需要人为识别带有干扰、形变的字符)。然而在很多系统维护工作中通过验证码提升数据安全性,但是识别验证码的过程往往会极大的降低维护工作的效率;对于许多机器学习项目而言,往往需要通过爬虫获取大量的原始数据,许多网站通过验证码等技术限制了爬虫获得数据的能力。传统破解验证码的方法往往是:首先进行图片预处理操作(去噪+二值化),再对图片进行字符分割,最后对分割出的每个字符进行识别。这样识别方法泛化能力不强,往往需要根据不同类型的验证码构建不同的图像预处理以及分割操作,并且预处理的好坏直接影响最终的处理结果。
技术实现思路
鉴于现有技术中的上述缺陷或不足,期望提供一种验证码自动识别方法及装置。第一方面,本专利技术提供一种验证码自动识别方法,包括如下步骤:步骤1:基于图像处理本文档来自技高网...

【技术保护点】
1.一种验证码自动识别方法,其特征在于,包括如下步骤:/n步骤1:基于图像处理库获取多个同一类型的验证码图片,生成验证码图片集;/n步骤2:基于seq2seq+attention深度神经网络模型,使用所述验证码图片集的部分验证码图片训练模型,剩余的验证码图片对训练后的模型进行测试,得到验证码识别模型;/n步骤3:根据所述验证码识别模型识别待破解的验证码图片。/n

【技术特征摘要】
1.一种验证码自动识别方法,其特征在于,包括如下步骤:
步骤1:基于图像处理库获取多个同一类型的验证码图片,生成验证码图片集;
步骤2:基于seq2seq+attention深度神经网络模型,使用所述验证码图片集的部分验证码图片训练模型,剩余的验证码图片对训练后的模型进行测试,得到验证码识别模型;
步骤3:根据所述验证码识别模型识别待破解的验证码图片。


2.根据权利要求1所述的验证码自动识别方法,其特征在于,步骤1中,所述基于获取多个同一类型的验证码图片,生成验证码图片集包括:
步骤11:基于图像处理库,根据预设定的图片参数创建空白图片;
步骤12:从预先建立的验证码语料库中随机选取至少一个字符,按照预设定的字符参数将选出的字符写入所述空白图片中,生成字符图片;
步骤13:对所述字符图片进行加密处理生成验证码图片;
步骤14:返回步骤11,达到设定循环次数后生成多个验证码图片,基于多个验证码图片生成所述验证码图片集。


3.根据权利要求2所述的验证码自动识别方法,其特征在于,步骤13中,所述加密处理包括扭曲、滤镜、倾斜、干扰线以及干扰点中的一种或者多种。


4.根据权利要求1所述的验证码自动识别方法,其特征在于,步骤2中,所述基于seq2seq+attention深度神经网络模型,使用所述验证码图片集中的部分验证码图片训练模型,剩余的验证码图片对训练后的模型进行测试,得到验证码识别模型包括:
步骤21:随机选取所述验证码图片集的所述部分验证码图片构成训练集,所述剩余的验证码图片构成测试集;
步骤22:将所述训练集中的验证码图片输入seq2seq+attention深度神经网络模型,训练seq2seq+attention深度神经网络模型;
步骤23:将所述测试集中的验证码图片输入训练后的seq2seq+attention深度神经网络模型,得识别准确率;
步骤24:判断所述识别准确率是否达到预设准确性阈值,若否,则调整seq2seq+attention深度神经网络模型的超参数,返回步骤22;否则将训练后的seq2seq+attention深度神经网络模型作为验证码识别模型。


5.根据权利要求4所述的验证码自动识别方法,其特征在于,步骤22中,所述训练seq2seq+attention深度神经网络模型包括:
采用卷积神经网络CNN对所述训练集中各个验证码图片进行特征提取,生成特征序列;
对所述特征序列采用注意力机制进行特征聚焦,得聚焦后的特征向量,采用长短时记忆网络LSTM对聚焦后的特征向量进行识别,生成输出序列;
根据所述特征序列和所述输出序列,采用梯度下降算法更新所...

【专利技术属性】
技术研发人员:赵培姚小龙武晨
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1