【技术实现步骤摘要】
字符验证码的识别方法、系统、电子设备和存储介质
本专利技术涉及人工智能与机器学习领域,尤其涉及一种字符验证码的识别方法、系统、电子设备和存储介质。
技术介绍
验证码被广泛应用于网站登录、注册、查询等环节,用来增强身份验证的难度和防止来自计算机程序的自动攻击。验证码作为区分计算机和人类的工具,可以限制网络垃圾信息的滋生,提高网络攻击的防御力,提高网络信息得安全性。同时,验证码的存在也增加了用户访问的复杂性。由于用户的偏好、忍耐度以及身体状况的因素,加之部分验证码识别难度较高,造成了用户的较差的操作体验。当前验证码种类繁多,最常用的是字符验证码。字符验证码的字体样式、字符颜色、字符分布、字符方向、背景复杂度、噪声类型和噪声强度等方面存在各种变换形式,在进行不同形式的字符验证码识别时需要使用不同的识别模型,造成开发周期长、验证码识别难度大,同时由于训练过程中使用CTC(ConnectionistTemporalClassification)损失函数,在进行验证码识别时如果最后生成的一个字符和倒数第二个字符一致,可能会被去除 ...
【技术保护点】
1.一种字符验证码的识别方法,其特征在于,包括/n对包括待识别的字符验证码的待识别图像进行预处理得到预处理图像;/n将所述预处理图像输入到训练中使用CTC损失函数的网络模型以识别出所述预处理图像中的字符作为识别结果;/n判断所述识别结果中字符验证码的字符的数量与所述待识别的字符验证码中字符的数量是否一致;/n若否,复制所述识别结果中最后一个字符并增加在所述最后一个字符后以更新所述识别结果。/n
【技术特征摘要】
1.一种字符验证码的识别方法,其特征在于,包括
对包括待识别的字符验证码的待识别图像进行预处理得到预处理图像;
将所述预处理图像输入到训练中使用CTC损失函数的网络模型以识别出所述预处理图像中的字符作为识别结果;
判断所述识别结果中字符验证码的字符的数量与所述待识别的字符验证码中字符的数量是否一致;
若否,复制所述识别结果中最后一个字符并增加在所述最后一个字符后以更新所述识别结果。
2.如权利要求1所述的字符验证码的识别方法,其特征在于,所述对包括待识别的字符验证码的待识别图像进行预处理得到预处理图像的步骤具体包括:
获取包括待识别的字符验证码的待识别图像;
滤除所述待识别图像的背景颜色以得到所述预处理图像;
和/或,
获取所述待识别图像中的连通域并剔除长宽比大于预设值的连通域以得到所述预处理图像;
和/或,
滤除所述待识别图像中的椒盐噪声以得到所述预处理图像。
3.如权利要求1所述的字符验证码的识别方法,其特征在于,所述网络模型包括依次连接的卷积层、批归一化层、激活层、最大池化层、BiLSTM层和全连接层;
所述卷积层作为所述网络模型的输入,所述全连接层作为所述网络模型的输出。
4.如权利要求1所述的字符验证码的识别方法,其特征在于,
所述待识别图像包括至少两行待识别的字符验证码;
所述对包括待识别的字符验证码的待识别图像进行预处理得到预处理图像的步骤具体包括
对所述待识别图像进行切割以形成若干子待识别图像,每个所述子待识别图像包含一行待识别的字符验证码;
对所述子待识别图像进行预处理得到所述预处理图像。
5.一种字符验证码的识别系统,其特征在于,包括预处理模块、识别模块、判断模块和后处理模块;
所述预处理模块,用于对包括待识别的字符验证码的待识别图像进行预处理得到预处理图像;
所述识别模块,用于将所述预处理图像输入到训练中使...
【专利技术属性】
技术研发人员:王荣生,江文斌,李健,
申请(专利权)人:上海携旅信息技术有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。