一种基于DenseNet的字符型图像验证码识别方法、系统、设备以及存储介质技术方案

技术编号:36426331 阅读:13 留言:0更新日期:2023-01-20 22:36
一种基于DenseNet的字符型图像验证码识别方法、系统、设备以及存储介质,属于人工智能技术领域。步骤S1,收集多个待识别的图像验证码,并将已收集的多个待识别的图像验证码构建成图像验证码数据集,已构建成的图像验证码数据集作为测试集;步骤S2,利用神经网络模型,并通过人工模拟图像与数据增强的结合对图像验证码数据集进行扩充;步骤S3,对已扩充的图像验证码数据集进行增强处理,已增强处理的图像验证码数据集作为训练集;步骤S4,构建基于DenseNet的图像验证码识别模型;步骤S5,将训练集输入至已构建的图像验证码识别模型进行训练;步骤S6,训练完成的图像验证码识别模型对测试集进行识别,得到图像验证码的识别结果。果。果。

【技术实现步骤摘要】
一种基于DenseNet的字符型图像验证码识别方法、系统、设备以及存储介质


[0001]本专利技术涉及人工智能
,具体涉及一种基于DenseNet的字符型图像验证码识别方法、系统、设备以及存储介质。

技术介绍

[0002]一般的,用户在登录系统时,除了需要输入账户名和密码,还需进行人机认证。系统主要通过人机认证的方式判断访问是来自真实用户还是机器程序,一方面,设置人机认证有利于防止机器程序恶意访问、暴力破解等操作,从而保证数据安全,保障系统稳定运行;另一方面,人机认证的设置也给安全测试人员的工作流程带来了一定的不便。
[0003]常见的人机认证的方式有识别字符、识别场景、选取文字、拼图、运算等基于图像的方式,以及识别语音内容等基于语音的方式。其中,字符型图像的方式得益于数据量小的优势,被广泛使用。字符型图像验证码的内容一般由若干位大小写字母和数字随机组成,但增加了大量干扰设置,如使字符扭曲变形、叠加粘连、以及添加点线等干扰元素,导致常用的光学字符识别工具不能直接应用于此类图像的识别。已有的字符型图像验证码识别方案,过程一般是首先对图像进行去噪、字符分割等预处理,再通过支持向量机、隐马尔可夫模型、或浅层神经网络识别处理后的图像。预处理过程中,去噪处理一般针对给定的一类或几类图像设计,因此适应性不强,且在去噪的过程中,极易丢失目标字符的部分信息;分割处理则不适用于字符互相叠加的情况。预处理的结果会严重影响后续识别的准确性,此外,支持向量机、隐马尔可夫等模型对于复杂图像的识别能力还存在一定的不足。
[0004]因此,现有方法对复杂字符型图像验证码识别的准确度还有待提高。

技术实现思路

[0005]本专利技术解决了现有方法对复杂字符型图像验证码识别的准确度低的问题。
[0006]本专利技术所述的一种基于DenseNet的字符型图像验证码识别方法,包括以下步骤:
[0007]步骤S1,收集多个待识别的图像验证码,并将已收集的多个待识别的图像验证码构建成图像验证码数据集,已构建成的图像验证码数据集作为测试集;
[0008]步骤S2,利用神经网络模型,并通过人工模拟图像与数据增强的结合对图像验证码数据集进行扩充;
[0009]步骤S3,对已扩充的图像验证码数据集进行增强处理,已增强处理的图像验证码数据集作为训练集;
[0010]步骤S4,构建基于DenseNet的图像验证码识别模型;
[0011]步骤S5,将训练集输入至已构建的图像验证码识别模型进行训练;
[0012]步骤S6,训练完成的图像验证码识别模型对测试集进行识别,得到图像验证码的识别结果;
[0013]所述图像验证码识别模型是将DenseNet作为模型主干,图像验证码识别模型依次
由第一卷积层、第一池化层、第一密集块、第一过渡层、第二密集块、第二过渡层、第三密集块、第三过渡层、第四密集块、第二池化层、第一全连接层和若干个全连接层分支构成。
[0014]进一步地,在本专利技术的一个实施例中,所述收集多个待识别的图像验证码,具体为:
[0015]通过爬虫程序获取目标网站的待识别的图像验证码,并多次刷新获取多个待识别的图像验证码,并将其保存。
[0016]进一步地,在本专利技术的一个实施例中,所述增强处理包括旋转、锐化、调节对比度、调节亮度、添加噪声、模糊处理、亮度均衡、雾化和添加阴影。
[0017]进一步地,在本专利技术的一个实施例中,所述将训练集输入至已构建的图像验证码识别模型进行训练,具体为:
[0018]已构建的图像验证码识别模型进行设定迭代次数,通过交叉熵损失函数度量预测结果相比于标签值的误差,通过AdamW优化器进行调节已构建的图像验证码识别模型的参数,当训练达到设定的迭代次数时,则停止训练并保存生成的图像验证码识别模型。
[0019]本专利技术所述的一种基于DenseNet的字符型图像验证码识别系统,所述系统包括以下模块:
[0020]收集模块,收集多个待识别的图像验证码,并将已收集的多个待识别的图像验证码构建成图像验证码数据集,已构建成的图像验证码数据集作为测试集;
[0021]扩充模块,利用神经网络模型,并通过人工模拟图像与数据增强的结合对图像验证码数据集进行扩充;
[0022]增强模块,对已扩充的图像验证码数据集进行增强处理,已增强处理的图像验证码数据集作为训练集;
[0023]构建模块,构建基于DenseNet的图像验证码识别模型;
[0024]训练模块,将训练集输入至已构建的图像验证码识别模型进行训练;
[0025]识别模块,训练完成的图像验证码识别模型对测试集进行识别,得到图像验证码的识别结果;
[0026]所述图像验证码识别模型是将DenseNet作为模型主干,图像验证码识别模型依次由第一卷积层、第一池化层、第一密集块、第一过渡层、第二密集块、第二过渡层、第三密集块、第三过渡层、第四密集块、第二池化层、第一全连接层和若干个全连接层分支构成。
[0027]本专利技术所述的一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
[0028]存储器,用于存放计算机程序;
[0029]处理器,用于执行存储器上所存放的程序时,实现上述方法中任一所述的方法步骤。
[0030]本专利技术所述的一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述方法中任一所述的方法步骤。
[0031]本专利技术解决了现有方法对复杂字符型图像验证码识别的准确度低的问题。具体有益效果包括:
[0032]1、本专利技术所述的一种基于DenseNet的字符型图像验证码识别方法,通过端到端的方式对直接图像验证码进行识别,相较于预处理后识别的方式,避免了预处理仅针对几类
风格图像设计,导致适应性不强,从而影响后续识别准确性的问题;
[0033]2、本专利技术所述的一种基于DenseNet的字符型图像验证码识别方法,通过人工模拟验证码图像风格编写程序以批量生成图像,相较于对每一类风格图像构建生成对抗网络的方式,有效节省了时间成本和计算成本,同时批量生成的图像带有匹配的标签,节省了人工标记成本;
[0034]3、本专利技术所述的一种基于DenseNet的字符型图像验证码识别方法,通过构建较深的神经网络,相比于机器学习算法或浅层神经网络,特征提取能力更强,更适用于复杂的图像验证码识别;
[0035]4、本专利技术所述的一种基于DenseNet的字符型图像验证码识别方法,在已有模型基础上,通过设置新的训练集数据进行微调,即可以应用于新风格的图像验证码的识别。
附图说明
[0036]本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0037]图1是具体实施方式所述的一种基于DenseNet的字符型图像验证码识别方法流程图;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于DenseNet的字符型图像验证码识别方法,其特征在于,包括以下步骤:步骤S1,收集多个待识别的图像验证码,并将已收集的多个待识别的图像验证码构建成图像验证码数据集,已构建成的图像验证码数据集作为测试集;步骤S2,利用神经网络模型,并通过人工模拟图像与数据增强的结合对图像验证码数据集进行扩充;步骤S3,对已扩充的图像验证码数据集进行增强处理,已增强处理的图像验证码数据集作为训练集;步骤S4,构建基于DenseNet的图像验证码识别模型;步骤S5,将训练集输入至已构建的图像验证码识别模型进行训练;步骤S6,训练完成的图像验证码识别模型对测试集进行识别,得到图像验证码的识别结果;所述图像验证码识别模型是将DenseNet作为模型主干,图像验证码识别模型依次由第一卷积层、第一池化层、第一密集块、第一过渡层、第二密集块、第二过渡层、第三密集块、第三过渡层、第四密集块、第二池化层、第一全连接层和若干个全连接层分支构成。2.根据权利要求1所述的一种基于DenseNet的字符型图像验证码识别方法,其特征在于,所述收集多个待识别的图像验证码,具体为:通过爬虫程序获取目标网站的待识别的图像验证码,并多次刷新获取多个待识别的图像验证码,并将其保存。3.根据权利要求1所述的一种基于DenseNet的字符型图像验证码识别方法,其特征在于,所述增强处理包括旋转、锐化、调节对比度、调节亮度、添加噪声、模糊处理、亮度均衡、雾化和添加阴影。4.根据权利要求1所述的一种基于DenseNet的字符型图像验证码识别方法,其特征在于,所述将训练集输入至已构建的图像验证码识别模型进行训练,具体为:已构建的图像验证码识别模型进行设定迭代次数,通过交叉熵损失函数度量预测结...

【专利技术属性】
技术研发人员:赵阳刘鸿儒张俊鹏杜宛泽岳驰涛
申请(专利权)人:吉林省吉林祥云信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1