基于DFS和CNN的验证码提取识别方法技术

技术编号：35740444 阅读：8 留言：0更新日期：2022-11-26 18:43

本发明专利技术公开了一种基于DFS和CNN的验证码提取识别方法，包含：收集验证码图片集；对若干验证码图片进行预处理；通过DFS算法从预处理后到的验证码图片中提取出第一字符；将提取出的第一字符输入搭建好的CNN神经网络识别模型中对其进行训练；获取待识别验证码图片；对待识别验证码图片进行预处理；通过DFS算法从预处理后到的待识别验证码图片中提取出第二字符；将提取出的第二字符输入训练好的CNN神经网络识别模型中得到识别结果。本发明专利技术的基于DFS和CNN的验证码提取识别方法中，DFS算法专注于在源节点之前探索相邻节点，对所有节点进行穷举搜索，通过前进和回溯到达同一节点，有助于以更短的时间和更高的精度处理输入的验证码。证码。证码。

全部详细技术资料下载

【技术实现步骤摘要】
基于DFS和CNN的验证码提取识别方法

[0001]本专利技术涉及一种基于DFS和CNN的验证码提取识别方法。

技术介绍

[0002]验证码(CAPTCHA)是“Completely Automated Public Turing test to tell Computers and Humans Apart”(全自动区分计算机和人类的图灵测试)的缩写，是一种区分用户是计算机还是人的公共全自动程序。验证码破解中最重要的是从验证码方案中提取字符，而当前打破验证码的算法通常是偏静态的例如利用Log Gabor滤波器来从四个方向的验证码图像中提取字符成分等，只适用于一些特定类型的验证码。
[0003]现有算法的主要局限性在于它们在检测验证码方案中的微小变化方面既不是通用的，也不是鲁棒的，此方法只适用于识别相同类型的验证码。当今的验证码已经添加了各种抵抗机制例如噪声电弧、复杂的背景干扰等。

技术实现思路

[0004]本专利技术提供了一种基于DFS和CNN的验证码提取识别方法解决上述提到的技术问题，具体采用如下的技术方案：
[0005]一种基于DFS和CNN的验证码提取识别方法，包含：
[0006]收集验证码图片集，验证码图片集包含若干验证码图片；
[0007]对若干验证码图片进行预处理；
[0008]通过DFS算法从预处理后到的验证码图片中提取出第一字符；
[0009]将提取出的第一字符输入搭建好的CNN神经网络识别模型中对其进行训练；
[0010]获取...

【技术保护点】

【技术特征摘要】
1.一种基于DFS和CNN的验证码提取识别方法，其特征在于，包含：收集验证码图片集，所述验证码图片集包含若干验证码图片；对若干所述验证码图片进行预处理；通过DFS算法从预处理后到的所述验证码图片中提取出第一字符；将提取出的第一字符输入搭建好的CNN神经网络识别模型中对其进行训练；获取待识别验证码图片；对所述待识别验证码图片进行预处理；通过DFS算法从预处理后到的所述待识别验证码图片中提取出第二字符；将提取出的第二字符输入训练好的CNN神经网络识别模型中得到识别结果。2.根据权利要求1所述的基于DFS和CNN的验证码提取识别方法，其特征在于，所述对若干所述验证码图片进行预处理的具体方法为：删除所述验证码图片集中的异常数据；将PNG格式的所述验证码图片转换为JPEG格式；将所述验证码图片转换为灰度图；对所述验证码图片按照字符进行分割。3.根据权利要求2所述的基于DFS和CNN的验证码提取识别方法，其特征在于，所述删除所述验证码图片集中的异常数据的具体方法为：将包含高度扭曲字符的所述验证码图片从所述验证码图片集中删除；将包含英文字母和数字以外的字符的所述验证码图片从所述验证码图片集中删除。4.根据权利要求2所述的基于DFS和CNN的验证码提取识别方法，其特征在于，所述对若干所述验证码图片进行预处理的具体方法还包含：减少...

【专利技术属性】
技术研发人员：蒋晓宁，戚迦南，刘伟，
申请(专利权)人：浙江工商大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人