【技术实现步骤摘要】
破解汉字验证码的方法、系统、电子设备及存储介质
本专利技术属于验证码识别
,具体涉及一种破解汉字验证码的方法、系统、电子设备及存储介质。
技术介绍
图形验证码(CAPTCHA)在互联网中的应用十分普遍,无论是账户登录、信息检索、资料下载,甚至是用户在登录后进行某些功能的频繁操作,为了保证操作安全性,网站或客户端程序一般都会要求用户输入验证码来进行下一步操作。图形验证码的形式多种多样,目前常见的有汉字识别式、字符识别(中、英文)式、滑块拼图式、选词式、场景识别式等,其中汉字验证码是应用范围最广的验证码形式之一。目前,一般只能实现对字符验证码的破解;但是,无法有效地实现对汉字验证码的验证。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中无法对汉字验证码进行有效识别的缺陷,提供一种破解汉字验证码的方法、系统、电子设备及存储介质。本专利技术是通过下述技术方案来解决上述技术问题:一种破解汉字验证码的方法,所述方法包括:获取目标图像中每个汉字的目标位置;获取所述目标 ...
【技术保护点】
1.一种破解汉字验证码的方法,其特征在于,所述方法包括:/n获取目标图像中每个汉字的目标位置;/n获取所述目标位置中的目标汉字轮廓;/n根据每个所述目标汉字轮廓获取对应的目标汉字;/n获取参考图像中的参考汉字轮廓;/n根据每个所述参考汉字轮廓获取对应的参考汉字和每个所述参考汉字在设定方向上的执行顺序;/n根据所述执行顺序和所述参考汉字获取所述目标图像中的所述目标汉字对应的点选结果。/n
【技术特征摘要】
1.一种破解汉字验证码的方法,其特征在于,所述方法包括:
获取目标图像中每个汉字的目标位置;
获取所述目标位置中的目标汉字轮廓;
根据每个所述目标汉字轮廓获取对应的目标汉字;
获取参考图像中的参考汉字轮廓;
根据每个所述参考汉字轮廓获取对应的参考汉字和每个所述参考汉字在设定方向上的执行顺序;
根据所述执行顺序和所述参考汉字获取所述目标图像中的所述目标汉字对应的点选结果。
2.如权利要求1所述的破解汉字验证码的方法,其特征在于,所述获取所述目标位置中的目标汉字轮廓的步骤包括:
采用灰度处理方法去除所述目标位置中汉字的图像背景得到第一图像;
对所述第一图像中的噪点进行去除处理得到第二图像;
对所述第二图像中的所述目标位置的汉字进行联通处理得到所述目标汉字轮廓。
3.如权利要求1所述的破解汉字验证码的方法,其特征在于,所述根据每个所述目标汉字轮廓获取对应的目标汉字的步骤包括:
将同一训练汉字的不同旋转角度的汉字图像作为输入,所述训练汉字作为输出,建立用于预测图像中汉字的目标模型;
将所述目标汉字轮廓输入所述目标模型,获取所述目标汉字;
所述根据每个所述参考汉字轮廓获取对应的参考汉字的步骤包括:
将所述参考汉字轮廓输入到所述目标模型,获取所述参考汉字。
4.如权利要求3所述的破解汉字验证码的方法,其特征在于,所述将所述目标汉字轮廓输入所述目标模型,获取所述目标汉字的步骤包括:
每个所述目标汉字轮廓输入到所述目标模型得到多个第一汉字;
其中,每个所述第一汉字对应不同的概率值;
选取所述概率值最高的所述第一汉字作为所述目标汉字;和/或,
所述目标模型为卷积神经网络模型;和/或,
所述获取目标图像中每个汉字的目标位置的步骤包括:
采用YOLO框架获取所述目标图像中每个汉字的目标位置。
5.如权利要求4所述的破解汉字验证码的方法,其特征在于,所述获取参考图像中的参考汉字轮廓的步骤包括:
获取所述参考图像中每一列和/或每一行的颜色像素值;
根据所述颜色像素值与预设像素值获取所述参考图像中每个所述参考汉字的边界,并根据所述边界切割所述参考图像得到所述参考汉字轮廓;或,
所述获取参考图像中的参考汉字轮廓的步骤之前还包括:
采用YOLO框架获取参考图像中每个汉字的第一位置;
所述获取参考图像中的参考汉字轮廓的步骤包括:
采用灰度处理方法去除所述第一位置中汉字的图像背景得到第三图像;
对所述第三图像中的噪点进行去除处理得到第四图像;
对所述第四图像中的所述第一位置的汉字进行联通处理得到所述参考汉字轮廓。
6.如权利要求1所述的破解汉字验证码的方法,其特征在于,所述根据所述执行顺序和所述参考汉字获取所述目标图像中的所述目标汉字对应的点选结果的步骤包括:
将所述目标汉字转换成第一字符串;
将所述参考汉字转换成第二字符串;
依次计算每个所述第一字符串和所述目标执行顺序上的所述第二字符串的相似度;
将相似度最高对应的所述参考汉字的执行顺序作为所述目标汉字的点选顺序;
根据所述点选顺序获取所述目标图像中所述目标汉字的点选结果;
所述根据所述执行顺序和所述参考汉字获取所述目标图像中的所述目标汉字对应的点选结果的步骤之后还包括:
根据所述点选结果对所述目标图像中的所述目标汉字进行点选操作。
7.一种破解汉字验证码的系统,其特征在于,所述系统包括:
目标位置获取模块,用于获取目标图像中每个汉字的目标位置;
第一轮廓获取模块,用于获取所述目标位置中的目标汉字轮廓;
目标汉字获取模块,用于根据每个所述目标汉字轮廓获取对应的目标汉字;
第二轮廓获取模块,...
【专利技术属性】
技术研发人员:黄小云,孙晨阳,李可玮,何晓力,魏小文,张芸蜻,谢毅刚,
申请(专利权)人:携程旅游信息技术上海有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。